Bài giảng Hồi quy đa thức trong máy học
Số trang: 31
Loại file: pdf
Dung lượng: 509.96 KB
Lượt xem: 15
Lượt tải: 0
Xem trước 4 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài giảng Hồi quy đa thức trong máy học cung cấp cho người học những kiến thức như: Trực quan hóa dữ liệu; Polynomial Linear Regression; Tiền xử lý dữ liệu; Huấn luyện mô hình; Trực quan hóa kết quả;...Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Hồi quy đa thức trong máy học POLYNOMIAL REGRESSION1. TS. Nguyễn Tấn Trần Minh Khang2. ThS. Võ Duy Nguyên3. Cao học. Nguyễn Hoàn Mỹ4. Tình nguyện viên. Lê Ngọc Huy5. Tình nguyện viên. Cao Bá Kiệt TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 1DATASET TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 2 Dataset─ Tên dữ liệu: Position Salaries.─ Nguồn: https://www.superdatascience.com/pages/machine- learning.─ Tập dữ liệu gồm 10 điểm dữ liệu, mỗi điểm dữ liệu gồm 3 thuộc tính, gồm: + Vị trí công việc (Position): mô tả tên một công việc. + Cấp bậc (Level): là một số nguyên trong khoảng 1 – 10, tương ứng với vị trí cao hay thấp trong một công ty. + Mức lương (Salary): là một số thực dương. TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 3 Dataset Position Level Salary Position Level SalaryBusiness Analyst 1 45,000 Region Manager 6 150,000Junior Consultant 2 50,000 Partner 7 200,000Senior Consultant 3 60,000 Senior Partner 8 300,000Manager 4 80,000 C-level 9 500,000Country Manager 5 110,000 CEO 10 1,000,000 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 4 Dataset─ Bài toán: Dự đoán mức lương của một người khi biết được cấp độ (vị trí) công việc của người đó.─ Ta sẽ sử dụng đồng thời thuật toán Linear Regression và thuật toán Polynomial Linear Regression cho tập dữ liệu này để so sánh hiệu suất của cả hai mô hình. TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 5TRỰC QUAN HÓA DỮ LIỆU TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 6 Trực quan hóa dữ liệuTRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 7 Trực quan hóa dữ liệu─ Đọc dữ liệu từ file csv và phân tách các giá trị đầu vào – ký hiệu là X, và giá trị đầu ra – ký hiệu là Y.1. import pandas as pd2. import numpy as np3. dataset=pd.read_csv(Position_Salaries.csv)4. X = dataset.iloc[:, 1:‐1].values5. Y = dataset.iloc[:, ‐1].values TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 8 Trực quan hóa dữ liệu─ Ta vẽ các điểm (level, s ...
Nội dung trích xuất từ tài liệu:
Bài giảng Hồi quy đa thức trong máy học POLYNOMIAL REGRESSION1. TS. Nguyễn Tấn Trần Minh Khang2. ThS. Võ Duy Nguyên3. Cao học. Nguyễn Hoàn Mỹ4. Tình nguyện viên. Lê Ngọc Huy5. Tình nguyện viên. Cao Bá Kiệt TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 1DATASET TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 2 Dataset─ Tên dữ liệu: Position Salaries.─ Nguồn: https://www.superdatascience.com/pages/machine- learning.─ Tập dữ liệu gồm 10 điểm dữ liệu, mỗi điểm dữ liệu gồm 3 thuộc tính, gồm: + Vị trí công việc (Position): mô tả tên một công việc. + Cấp bậc (Level): là một số nguyên trong khoảng 1 – 10, tương ứng với vị trí cao hay thấp trong một công ty. + Mức lương (Salary): là một số thực dương. TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 3 Dataset Position Level Salary Position Level SalaryBusiness Analyst 1 45,000 Region Manager 6 150,000Junior Consultant 2 50,000 Partner 7 200,000Senior Consultant 3 60,000 Senior Partner 8 300,000Manager 4 80,000 C-level 9 500,000Country Manager 5 110,000 CEO 10 1,000,000 TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 4 Dataset─ Bài toán: Dự đoán mức lương của một người khi biết được cấp độ (vị trí) công việc của người đó.─ Ta sẽ sử dụng đồng thời thuật toán Linear Regression và thuật toán Polynomial Linear Regression cho tập dữ liệu này để so sánh hiệu suất của cả hai mô hình. TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 5TRỰC QUAN HÓA DỮ LIỆU TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 6 Trực quan hóa dữ liệuTRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 7 Trực quan hóa dữ liệu─ Đọc dữ liệu từ file csv và phân tách các giá trị đầu vào – ký hiệu là X, và giá trị đầu ra – ký hiệu là Y.1. import pandas as pd2. import numpy as np3. dataset=pd.read_csv(Position_Salaries.csv)4. X = dataset.iloc[:, 1:‐1].values5. Y = dataset.iloc[:, ‐1].values TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN, KHU PHỐ 6, PHƯỜNG LINH TRUNG, QUẬN THỦ ĐỨC, TP. HỒ CHÍ MINH [T] 028 3725 2002 101 | [F] 028 3725 2148 | [W] www.uit.edu.vn | [E] info@uit.edu.vn 8 Trực quan hóa dữ liệu─ Ta vẽ các điểm (level, s ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Hồi quy đa thức trong máy học Hồi quy đa thức trong máy học Hồi quy đa thức Mô hình Polynomial Regression Trực quan hóa dữ liệuGợi ý tài liệu liên quan:
-
Bài giảng Tin học ứng dụng: Chương 3 - Nguyễn Thị Thùy Liên
34 trang 90 0 0 -
13 trang 43 0 0
-
Giáo án môn Tin học lớp 8 (Sách Kết nối tri thức)
141 trang 40 0 0 -
Trực quan hóa dữ liệu với Microsoft Power BI
11 trang 38 0 0 -
Trực quan hóa dữ liệu trạng thái giao thông trên nền web
9 trang 35 0 0 -
Trực quan hóa dữ liệu: Vai trò & thử thách
10 trang 34 0 0 -
Trình bày dữ liệu đồ thị trong trực quan hóa dữ liệu
13 trang 34 0 0 -
Bài giảng Khai phá web - Bài 3: Trực quan hóa dữ liệu
42 trang 30 0 0 -
Đồ hoạ thông tin: Công cụ truyền thông trực tuyến trong thời đại số
9 trang 25 0 0 -
Giải pháp nhà máy thông minh cho doanh nghiệp
11 trang 25 0 0