Thông tin tài liệu:
Bài viết Nghiên cứu và ứng dụng học máy để dự đoán năng lượng tiêu thụ trong tòa nhà dự đoán năng lượng tiêu thụ trong một tháng với tính chính xác cao bằng phương pháp sử dụng máy hỗ trợ vector (SVM) và cây quyết định ngẫu nhiên (random forest) trong lĩnh vực học máy. Kết quả của mô hình dự báo được kiểm tra bằng các phương pháp thống kê tiêu chuẩn.
Nội dung trích xuất từ tài liệu:
Nghiên cứu và ứng dụng học máy để dự đoán năng lượng tiêu thụ trong tòa nhà
Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8
NGHIÊN CỨU VÀ ỨNG DỤNG HỌC MÁY ĐỂ DỰ ĐOÁN
NĂNG LƯỢNG TIÊU THỤ TRONG TÒA NHÀ
Lê Thị Hương
Trường Đại học Thủy lợi
1. GIỚI THIỆU CHUNG Schneider Electric cho một tòa nhà được sử
dụng cho nghiên cứu bao gồm:
Năng lượng tiêu thụ ngày càng tăng lên do
Dữ liệu thời tiết trong 3 năm.
thay đổi thời tiết, tuổi thọ của các thiết bị trong
Năng lượng điện tiêu thụ trong 3 năm từ
tòa nhà, tăng trưởng kinh tế.Trong chỉ thị về
năm 2016 đến năm 2018.
Tính năng năng lượng đối với các tòa nhà
Dùng hàm describe() trong python hiển thị
(Energy Performance of Buildings Directive -
các thông số của năng lượng và thời tiết:
EPBD) của Liên Minh Châu Âu (EU) yêu cầu
tăng tiết kiệm năng lượng đối với các tòa nhà
thương mại lên 30% vào năm 2030. Việt Nam
không thể nằm ngoài xu thế chung của thế giới.
Ngày nay, nhờ hệ thống quản lý tòa nhà chúng
ta đã có thể thu thập được dữ liệu tiêu thụ năng
lượng thời gian thực, giám sát và điều khiển từ
xa các thiết bị trong tòa nhà để cắt giảm tiêu thụ
năng lượng gây lãng phí. Điều này cũng mở ra
cơ hội cho khả năng mới đó là trực quan hóa dữ
liệu, phân tích chuyên sâu để giúp người vận
hành đưa ra quyết định, điều khiển các thiết bị
dựa trên mô phỏng. Có nhiều kỹ thuật được sử
dụng nhưng ứng dụng dữ liệu lớn với tính
chính xác cao đang là xu hướng được nghiên
cứu. Mục đích chính của bài báo này dự đoán
năng lượng tiêu thụ trong một tháng với tính
chính xác cao bằng phương pháp sử dụng máy
hỗ trợ vector (SVM) và cây quyết định ngẫu
nhiên (random forest) trong lĩnh vực học máy. Hình 1. Biểu đồ kiểm tra tính khả dụng
Kết quả của mô hình dự báo được kiểm tra của dữ liệu
bằng các phương pháp thống kê tiêu chuẩn.
Dựa vào đồ thị ta thấy không có dữ liệu bỏ
2. PHƯƠNG PHÁP NGHIÊN CỨU sót.
Sử dụng hệ số tương quan Person để đo
2.1 Dữ liệu sử dụng và lựa chọn thông số tương quan giữa các biến số. Từ Hình 2, ta
đầu vào thấy nhiệt độ (Temp) tương quan dương với
Trong nghiên cứu này, dữ liệu được chiết điện năng sử dụng trong tòa nhà. Độ ẩm tương
suất từ hệ thống lưu trữ dữ liệu của phần đối (U) và tổng lượng mưa hàng giờ (RH) là
mềm Remote Energy System của Tập đoàn hai đặc điểm có tương quan âm cao nhất.
244
Tuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8
Ngoài ra cả hai đại lượng này cũng đa cộng ranh giới tối đa. Trong nghiên cứu này, tác
tuyến tính nên ta có thể sử dụng một trong hai giả xác định các giá trị cho các tham số SVR
đại lượng để dự đoán nhu cầu điện năng. thông qua quá trình thử - lỗi.
Dữ liệu học được đưa vào dạng [(x1, t1), …
(xn, tn)]⸦ RxR, trong đó n biểu thị không
gian của các mẫu đầu vào. Dựa vào quan hệ
giữa ԑ SVR, mục tiêu là tìm được hàm fx có
độ lệch ԑ với mục tiêu tj cho tất cả tập dữ liệu
huấn luyện và đồng thời càng phẳng càng tốt.
Hàm hồi quy có dạng: y = fx = wTΦ(x) +b.
Trong đó: wR là hằng số: xRn là vector
đầu vào; Φ(x) Rm là vector đặc trưng. Φ là
Hình 2. Heat map thể hiện mức độ tương hàm ánh xạ từ không gian đầu vào sang
quan giữa các biến nghiên cứu không gian đặc trưng. Như vậy để tìm w và b
2.2. Xây dựng và đánh giá mô hình ta phải tối thiểu hàm lỗi chuẩn hóa.
1 N 2
Công cụ và phương pháp sử dụng:
2 1
{yn tn } w
2
(1)
Thuật toán Support Vector Regression
(SVR): Support Vector Regression (SVR) là với λ là hằng số chuẩn hóa.
một thuận toán nằm trong bộ thuật toán SVM Thuật toán Random Forest (RF): Bộ dữ liệu
dùng để giải quyết các vấn đề hồi quy[1]. có n dữ liệu (sample) và mỗi dữ liệu có d thuộc
Thay vì giảm thiểu lỗi trong quá trình huấn tính (feature). Để xây dựng mỗi cây quyết
luyện, SVR cố gắng giảm thiểu lỗi tổng quát định: 1. Lấy ngẫu nhiên n dữ liệu từ bộ dữ liệu
bị ràng buộc để đạt được hiệu xuất tổng thể. 2. Sau khi sample được n dữ liệu thì chọn ngẫu
Ý tưởng về SVR dựa trên tính toán của hàm nhiên ở k thuộc tính (kTuyển tập Hội nghị Khoa học thường niên năm 2022. ISBN: 978-604-82-7001-8
Xây dựng mô hình: Ba bước xây dựng Bảng 1. So sánh hiệu suất các mô hình
mô hình (1) Chuẩn bị và tiền xử lý dữ liệu, STT Mô hình RMSE R2
loại bỏ nhiễu,(2 ...