![Phân tích tư tưởng của nhân dân qua đoạn thơ: Những người vợ nhớ chồng… Những cuộc đời đã hóa sông núi ta trong Đất nước của Nguyễn Khoa Điềm](https://timtailieu.net/upload/document/136415/phan-tich-tu-tuong-cua-nhan-dan-qua-doan-tho-039-039-nhung-nguoi-vo-nho-chong-nhung-cuoc-doi-da-hoa-song-nui-ta-039-039-trong-dat-nuoc-cua-nguyen-khoa-136415.jpg)
Xử lý dữ liệu thiếu bằng biểu đồ chuẩn hóa đơn vị (SLP) và support vector regression (SVR)
Số trang: 6
Loại file: pdf
Dung lượng: 1.15 MB
Lượt xem: 11
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây dựng Biểu đồ chuẩn hóa đơn vị (SLP) trên cơ sở bộ dữ liệu phụ tải điện quá khứ (chu kỳ 60 phút), kết hợp các giải thuật học máy SVR (NN/RD) để xây dựng lại đường đặc tuyến phụ tải từ đó ước lượng các dữ liệu đã mất hoặc không ghi nhận được trong quá trình đo đếm.
Nội dung trích xuất từ tài liệu:
Xử lý dữ liệu thiếu bằng biểu đồ chuẩn hóa đơn vị (SLP) và support vector regression (SVR)SCIENCE TECHNOLOGYXỬ LÝ DỮ LIỆU THIẾU BẰNG BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ(SLP) VÀ SUPPORT VECTOR REGRESSION (SVR)HANDLING MISSING DATA USING STANDARDIZED LOAD PROFILE (SLP)AND SUPPORT VECTOR REGRESSION (SVR) Nguyễn Tuấn Dũng1,*, Nguyễn Thanh Phương2TÓM TẮT 1. ĐẶT VẤN ĐỀ Trong những năm gần đây, việc nghiên cứu và ứng dụng các kỹ thuật khai 1.1. Dữ liệu thiếu trong quá trình khai thác cơ sở dữ liệuthác dữ liệu gặp phải nhiều khó khăn, thách thức lớn, trong đó có vấn đề thiếu (CSDL)những giá trị thuộc tính của dữ liệu. Có nhiều nguyên nhân khác nhau dẫn tới Cho đến nay, có nhiều phương pháp xử lý giá trị thiếu đãvấn đề này: thiết bị thu thập bị hỏng, có sự từ chối cung cấp dữ liệu nhằm bảo vệ được đề xuất và áp dụng [1, 2]. Các phương pháp này chotính riêng tư, có sai sót khi nhập dữ liệu hoặc có các sự cố xảy ra trong quá trình phép xử lý trực tiếp các giá trị thiếu, tuy nhiên chúng cũng cótruyền dữ liệu,... Trong đó, việc thiếu dữ liệu phục vụ công tác nghiên cứu, dự báo thể mang những thông tin nhiễu vào tập dữ liệu đang xét.phụ tải điện là một trong những vấn đề nan giải đối với ngành điện. Hiện các Việc xử lý các giá trị thiếu cần phải được cân nhắc và thựcCông ty điện lực đang thực hiện việc này bằng cách nội suy từ các giá trị đo đếm hiện một cách thận trọng, nếu các nhà nghiên cứu sử dụngcủa các ngày trước, giờ trước một cách thủ công, không chuẩn xác làm ảnh hưởng phương pháp xử lý dữ liệu bị mất mà không cẩn trọng xemkhông nhỏ đến kết quả phân tích, xử lý dữ liệu trong quá trình nghiên cứu, dự xét các giả định cần thiết của phương pháp đó thì họ cóbáo phụ tải. Bài báo đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây nguy cơ có kết quả sai lệch và gây hiểu nhầm [2]. Cho đếndựng Biểu đồ chuẩn hóa đơn vị (SLP) trên cơ sở bộ dữ liệu phụ tải điện quá khứ nay, việc xử lý giá trị thiếu trong các CSDL vẫn là đề tài thu(chu kỳ 60 phút), kết hợp các giải thuật học máy SVR (NN/RD) để xây dựng lại hút sự quan tâm của nhiều nhà nghiên cứu và ứng dụng.đường đặc tuyến phụ tải từ đó ước lượng các dữ liệu đã mất hoặc không ghi nhậnđược trong quá trình đo đếm. Một nhiệm vụ vô cùng quan trọng khi xây dựng một phương pháp xử lý giá trị thiếu là phải hiểu được cơ chế Từ khóa: Thiếu dữ liệu; ước lượng; số liệu đo đếm; phụ tải điện; Biểu đồ chuẩn sinh ra các giá trị thiếu trong CSDL cần xử lý. Nắm bắt đượchóa đơn vị; SVR. cơ chế sinh ra giá trị thiếu trong một tình huống cụ thể sẽABSTRACT giúp xây dựng được một phương pháp xử lý thích hợp và In recent years, the research and application of data mining techniques hiệu quả.encountered many difficulties and major challenges, including the lack of 1.2. Dữ liệu thiếu trong nghiên cứu phụ tải điệnattribute values of data. There are many different reasons for this problem: thedevice is broken, the data is refused to protect the privacy, data entry mistakes orincidents occur during data transmission. In particular, the lack of data forelectricity load research and forecasting is one of the problems for the electricityindustry. Currently, the power companies are doing this by interpolating fromthe measured values of previous days and hours manually, which significantlyaffects the results of data analysis during the load forecasting process. The paperproposes a method of processing missing data by building a Standardized Chart(SLP) based on past load data (60-minute cycle), combining machine learningalgorithms SVR (NN / RD) to rebuild the load curve, thereby we can estimate thedata missed or not recorded during the measurement. Keywords: Missing data; estimation; measured data; electrical load;Standardized load profile; SVR. Hình 1. Các lỗi thường gặp trong ghi nhận dữ liệu1 Tổng Công ty Điện lực TP.HCM Trong quá trình vận hành, thu thập dữ liệu đã xuất hiện2 Trường Đại học Công nghệ TP.HCM nhiều sự cố làm gián đoạn việc ghi nhận các dữ liệu đo* Email: dungnt@hcmpc.com.vn ...
Nội dung trích xuất từ tài liệu:
Xử lý dữ liệu thiếu bằng biểu đồ chuẩn hóa đơn vị (SLP) và support vector regression (SVR)SCIENCE TECHNOLOGYXỬ LÝ DỮ LIỆU THIẾU BẰNG BIỂU ĐỒ CHUẨN HÓA ĐƠN VỊ(SLP) VÀ SUPPORT VECTOR REGRESSION (SVR)HANDLING MISSING DATA USING STANDARDIZED LOAD PROFILE (SLP)AND SUPPORT VECTOR REGRESSION (SVR) Nguyễn Tuấn Dũng1,*, Nguyễn Thanh Phương2TÓM TẮT 1. ĐẶT VẤN ĐỀ Trong những năm gần đây, việc nghiên cứu và ứng dụng các kỹ thuật khai 1.1. Dữ liệu thiếu trong quá trình khai thác cơ sở dữ liệuthác dữ liệu gặp phải nhiều khó khăn, thách thức lớn, trong đó có vấn đề thiếu (CSDL)những giá trị thuộc tính của dữ liệu. Có nhiều nguyên nhân khác nhau dẫn tới Cho đến nay, có nhiều phương pháp xử lý giá trị thiếu đãvấn đề này: thiết bị thu thập bị hỏng, có sự từ chối cung cấp dữ liệu nhằm bảo vệ được đề xuất và áp dụng [1, 2]. Các phương pháp này chotính riêng tư, có sai sót khi nhập dữ liệu hoặc có các sự cố xảy ra trong quá trình phép xử lý trực tiếp các giá trị thiếu, tuy nhiên chúng cũng cótruyền dữ liệu,... Trong đó, việc thiếu dữ liệu phục vụ công tác nghiên cứu, dự báo thể mang những thông tin nhiễu vào tập dữ liệu đang xét.phụ tải điện là một trong những vấn đề nan giải đối với ngành điện. Hiện các Việc xử lý các giá trị thiếu cần phải được cân nhắc và thựcCông ty điện lực đang thực hiện việc này bằng cách nội suy từ các giá trị đo đếm hiện một cách thận trọng, nếu các nhà nghiên cứu sử dụngcủa các ngày trước, giờ trước một cách thủ công, không chuẩn xác làm ảnh hưởng phương pháp xử lý dữ liệu bị mất mà không cẩn trọng xemkhông nhỏ đến kết quả phân tích, xử lý dữ liệu trong quá trình nghiên cứu, dự xét các giả định cần thiết của phương pháp đó thì họ cóbáo phụ tải. Bài báo đề xuất một phương pháp xử lý dữ liệu thiếu bằng cách xây nguy cơ có kết quả sai lệch và gây hiểu nhầm [2]. Cho đếndựng Biểu đồ chuẩn hóa đơn vị (SLP) trên cơ sở bộ dữ liệu phụ tải điện quá khứ nay, việc xử lý giá trị thiếu trong các CSDL vẫn là đề tài thu(chu kỳ 60 phút), kết hợp các giải thuật học máy SVR (NN/RD) để xây dựng lại hút sự quan tâm của nhiều nhà nghiên cứu và ứng dụng.đường đặc tuyến phụ tải từ đó ước lượng các dữ liệu đã mất hoặc không ghi nhậnđược trong quá trình đo đếm. Một nhiệm vụ vô cùng quan trọng khi xây dựng một phương pháp xử lý giá trị thiếu là phải hiểu được cơ chế Từ khóa: Thiếu dữ liệu; ước lượng; số liệu đo đếm; phụ tải điện; Biểu đồ chuẩn sinh ra các giá trị thiếu trong CSDL cần xử lý. Nắm bắt đượchóa đơn vị; SVR. cơ chế sinh ra giá trị thiếu trong một tình huống cụ thể sẽABSTRACT giúp xây dựng được một phương pháp xử lý thích hợp và In recent years, the research and application of data mining techniques hiệu quả.encountered many difficulties and major challenges, including the lack of 1.2. Dữ liệu thiếu trong nghiên cứu phụ tải điệnattribute values of data. There are many different reasons for this problem: thedevice is broken, the data is refused to protect the privacy, data entry mistakes orincidents occur during data transmission. In particular, the lack of data forelectricity load research and forecasting is one of the problems for the electricityindustry. Currently, the power companies are doing this by interpolating fromthe measured values of previous days and hours manually, which significantlyaffects the results of data analysis during the load forecasting process. The paperproposes a method of processing missing data by building a Standardized Chart(SLP) based on past load data (60-minute cycle), combining machine learningalgorithms SVR (NN / RD) to rebuild the load curve, thereby we can estimate thedata missed or not recorded during the measurement. Keywords: Missing data; estimation; measured data; electrical load;Standardized load profile; SVR. Hình 1. Các lỗi thường gặp trong ghi nhận dữ liệu1 Tổng Công ty Điện lực TP.HCM Trong quá trình vận hành, thu thập dữ liệu đã xuất hiện2 Trường Đại học Công nghệ TP.HCM nhiều sự cố làm gián đoạn việc ghi nhận các dữ liệu đo* Email: dungnt@hcmpc.com.vn ...
Tìm kiếm theo từ khóa liên quan:
Tạp chí Khoa học và Công nghệ Số liệu đo đếm Phụ tải điện Biểu đồ chuẩn hóa đơn vị Đường đặc tuyến phụ tảiTài liệu liên quan:
-
15 trang 224 0 0
-
9 trang 160 0 0
-
Phân tích và so sánh các loại pin sử dụng cho ô tô điện
6 trang 111 0 0 -
10 trang 90 0 0
-
Hội nhập quốc tế trong lĩnh vực pháp luật sở hữu trí tuệ của Việt Nam
4 trang 85 0 0 -
5 trang 69 0 0
-
Ảnh hưởng các tham số trong bảng sam điều kiện đối với phương pháp điều khiển sử dụng đại số gia tử
9 trang 69 0 0 -
11 trang 67 0 0
-
Giáo trình Cung cấp điện - ĐH Công Nghiệp TP. Hồ Chí Minh
171 trang 60 0 0 -
15 trang 55 0 0