Tăng tốc việc phân tích chuỗi thời gian với phương pháp máy học tự động hóa
Số trang: 12
Loại file: pdf
Dung lượng: 405.94 KB
Lượt xem: 6
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết "Tăng tốc việc phân tích chuỗi thời gian với phương pháp máy học tự động hóa" giới thiệu các công cụ của phương pháp máy học tự động cung cấp các lợi thế quan trọng so với các công cụ phân tích truyền thống như tính đơn giản, nhanh & khả năng diễn giải kết quả thu được. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Tăng tốc việc phân tích chuỗi thời gian với phương pháp máy học tự động hóa TĂNG TỐC VIỆC PHÂN TÍCH CHUỖI THỜI GIAN VỚI PHƯƠNG PHÁP MÁY HỌC TỰ ĐỘNG HÓA Bùi Mạnh Trường Khoa Công nghệ Thông tin. Trường Đại học Tài chính – Marketing Email bmtruong@ufm.edu.vn Tóm tắt: Thời gian (Time) là một trong những nhân tố quan trọng nhất cần xem xét và đánhgiá để đảm bảo thành công trong kinh doanh và cũng rất khó khăn để bắt kịp tốc độ của thời gian.Công nghệ đã và đang phát triển cùng với các phương pháp mạnh mẽ giúp biết trước sự việc trướckhi thời gian kịp tới thời điểm sự việc diễn ra. Dữ liệu chuỗi thời gian nâng cao hiệu quả kinhdoanh bằng việc đưa ra các cách nhìn sâu sắc hơn về kết quả hoạt động kinh doanh trong tươnglai. Các công cụ của phương pháp máy học tự động cung cấp các lợi thế quan trọng so với cáccông cụ phân tích truyền thống như tính đơn giản, nhanh & khả năng diễn giải kết quả thu được. Từ khóa: data, time series, machine learning, automated machine learning, AutoMLGIỚI THIỆU Phân tích chuỗi thời gian (Time series) có nhiều mục tiêu khác nhau, tùy thuộc vàolĩnh vực được ứng dụng. Các mục tiêu bao gồm dự đoán giá trị tương lai của chuỗi, tríchxuất tín hiệu ẩn dấu trong dữ liệu pha tạp, khám phá cơ chế mà dữ liệu được tạo ra, môphỏng kết quả độc lập trong thực tế của chuỗi để hiểu dữ liệu sẽ thay đổi thế nào trongtương lai. Trong tất cả các ứng dụng, phân tích chuỗi thời gian ban đầu thường cố gắng tìmra được mô hình toán học để giúp tìm ra được hình thức trực quan tốt nhất đối với dữ liệuquan sát được. Nhiều năm qua, số lượng các dòng dữ liệu đổ vào các kho dữ liệu phân tíchtăng đáng kể liên tục để hỗ trợ phạm vi rộng lớn hơn cho các nhu cầu kinh doanh. Sự giatăng này đã làm thay đổi sâu sắc các loại hình phân tích theo yêu cầu, từ các công việc phântích tổng hợp mô tả về kết quả hoạt động kinh doanh trong lịch sử cho tới việc tập trungnhiều hơn vào kết quả hoạt động kinh doanh hiện tại và tương lai trong đó có sử dụng cácphương pháp đo lường với độ chi tiết cao. Sự gia tăng này cũng tạo áp lực cho các tổ chức đầu tư vào công nghệ để quản lý &phân tích dữ liệu chuỗi thời gian. Những dữ liệu này phản ánh tất cả các mặt của quy trìnhkinh doanh, hành vi khách hàng & việc sử dụng tài sản doanh nghiệp cùng với việc phântích để nhanh chóng xác định những sai lệch so với quy chuẩn mà có thể ảnh hưởng tiêucực tới kết quả hoạt động kinh doanh hoặc giúp phát hiện ra những cơ hội mới. 256 Việc phát triển mô hình Máy học theo cách truyền thống đòi hỏi nhiều tài nguyên,đòi hỏi kiến thức chuyên môn cao và thời gian rất lâu để xây dựng mô hình và khi so sánhnhiều mô hình với nhau. Khi các công cụ thống kê truyền thống gặp khó khăn trong việcxử lý các dữ liệu đầu vào đa biến, bỏ sót những tiềm năng mang lợi thế cạnh tranh để nắmbắt & ảnh hưởng tiêu cực tới các hoạt động kinh doanh thực tế thì các công cụ Máy học tựđộng có thể giúp tăng cường việc phân tích, xây dựng mô hình & dự đoán dựa vào dữ liệuchuỗi thời gian để đề xuất cho doanh nghiệp những cơ hội dễ hiểu & khả thi một cách đơngiản và nhanh chóng. Máy học tự động (Automated Machine Learning) sử dụng các thuật toán m học đượctự động hóa và quá trình thiết kế có cấu trúc của mô hình đã được xác định. Máy học tựđộng cung cấp các công cụ phân tích dữ liệu có cấu trúc một cách có hệ thống được thiếtkế sẵn để hỗ trợ các lĩnh vực như bán lẻ, chuyển đổi, y tế... nhằm thu được kinh nghiệmthực tiễn tốt nhất khi áp dụng các thuật toán Máy học để giải quyết các bài toán dự đoánchính xác với chi phí thấp và nhanh chóng. Máy học tự động thực hiện quy trình tự động hóa các tác vụ và liên tục lặp lại mộtphần hoặc toàn bộ quy trình này để phát triển mô hình máy học nên mất nhiều thời gian đểthực hiện. Nó cho phép các nhà khoa học dữ liệu, nhà phân tích và nhà phát triển để xâydựng các mô hình Máy học có khả năng phát triển quy mô khi ứng dụng với hiệu quả vànăng suất cao nhưng vẫn đảm bảo chất lượng của mô hình. Máy học tự động đang đượcứng dụng trong dịch vụ Máy học Azure được phát triển từ thành công mang tính đột phácủa bộ phận nghiên cứu trong tập đoàn Microsoft.ĐẶC TRƯNG CỦA CHUỖI THỜI GIAN & CÁC ỨNG DỤNG Mọi hoạt động của thế giới, con người & thiên nhiên đều thay đổi theo thời gian.Chuỗi thời gian có thể định nghĩa là một chuỗi các dữ liệu tại các thời điểm được đánh dấutạo thành các mốc thời gian cách xa đều nhau. Phân tích chuỗi thời gian là việc sử dụng cácphương pháp thống kê hoặc Máy học để phân tích dữ liệu tại một hoặc nhiều mốc thời gianbằng cách trích xuất được các mẫu có đầy đủ ý nghĩa trong các biến đầu ra như là xu hướng(nhu cầu sử dụng laptop nhiều hơn máy tính để bàn, thanh toán bằng ví điện tử nhiều hơnthanh toán tiền mặt, mua hàng online ngày càng phát triển ... ), mùa kinh doanh (mùa hè,tháng nhập học, Tết Nguyên đán ... ) hoặc các sự kiện đặc biệt (ngày mua sắm cao điểmBlack Friday, lễ giáng sinh, ngày lễ tình nhân 14/02 ... ) và mối quan hệ hoặc tương tác 257giữa các biến đầu vào giúp việc dự đoán các biến đầu vào sẽ thay đổi như thế nào để ảnhhưởng đến các biến đầu ra. Có nhiều ứng dụng của phân tích chuỗi thời gian, trong số đó là nhu cầu về việc dựbáo tương lai giúp cải thiện công tác hoạch định sản xuất tối ưu hơn. Điều này cho phép dựđoán về tình hình nhà đất của một địa phương trong năm tới, nhu cầu về phòng khách sạntại Phú Quốc trong tuần tới, số lượng người sẽ đổ về phố đi bộ trong vài giờ tới, khối lượngcông việc của bộ định tuyến trong vài phút tới & thậm chí số lượng click chuột & sự chuyểnđổi của một cổng thanh toán mua sắm trực tuyến trong 30 giây tiếp theo. Ngoài vi ...
Nội dung trích xuất từ tài liệu:
Tăng tốc việc phân tích chuỗi thời gian với phương pháp máy học tự động hóa TĂNG TỐC VIỆC PHÂN TÍCH CHUỖI THỜI GIAN VỚI PHƯƠNG PHÁP MÁY HỌC TỰ ĐỘNG HÓA Bùi Mạnh Trường Khoa Công nghệ Thông tin. Trường Đại học Tài chính – Marketing Email bmtruong@ufm.edu.vn Tóm tắt: Thời gian (Time) là một trong những nhân tố quan trọng nhất cần xem xét và đánhgiá để đảm bảo thành công trong kinh doanh và cũng rất khó khăn để bắt kịp tốc độ của thời gian.Công nghệ đã và đang phát triển cùng với các phương pháp mạnh mẽ giúp biết trước sự việc trướckhi thời gian kịp tới thời điểm sự việc diễn ra. Dữ liệu chuỗi thời gian nâng cao hiệu quả kinhdoanh bằng việc đưa ra các cách nhìn sâu sắc hơn về kết quả hoạt động kinh doanh trong tươnglai. Các công cụ của phương pháp máy học tự động cung cấp các lợi thế quan trọng so với cáccông cụ phân tích truyền thống như tính đơn giản, nhanh & khả năng diễn giải kết quả thu được. Từ khóa: data, time series, machine learning, automated machine learning, AutoMLGIỚI THIỆU Phân tích chuỗi thời gian (Time series) có nhiều mục tiêu khác nhau, tùy thuộc vàolĩnh vực được ứng dụng. Các mục tiêu bao gồm dự đoán giá trị tương lai của chuỗi, tríchxuất tín hiệu ẩn dấu trong dữ liệu pha tạp, khám phá cơ chế mà dữ liệu được tạo ra, môphỏng kết quả độc lập trong thực tế của chuỗi để hiểu dữ liệu sẽ thay đổi thế nào trongtương lai. Trong tất cả các ứng dụng, phân tích chuỗi thời gian ban đầu thường cố gắng tìmra được mô hình toán học để giúp tìm ra được hình thức trực quan tốt nhất đối với dữ liệuquan sát được. Nhiều năm qua, số lượng các dòng dữ liệu đổ vào các kho dữ liệu phân tíchtăng đáng kể liên tục để hỗ trợ phạm vi rộng lớn hơn cho các nhu cầu kinh doanh. Sự giatăng này đã làm thay đổi sâu sắc các loại hình phân tích theo yêu cầu, từ các công việc phântích tổng hợp mô tả về kết quả hoạt động kinh doanh trong lịch sử cho tới việc tập trungnhiều hơn vào kết quả hoạt động kinh doanh hiện tại và tương lai trong đó có sử dụng cácphương pháp đo lường với độ chi tiết cao. Sự gia tăng này cũng tạo áp lực cho các tổ chức đầu tư vào công nghệ để quản lý &phân tích dữ liệu chuỗi thời gian. Những dữ liệu này phản ánh tất cả các mặt của quy trìnhkinh doanh, hành vi khách hàng & việc sử dụng tài sản doanh nghiệp cùng với việc phântích để nhanh chóng xác định những sai lệch so với quy chuẩn mà có thể ảnh hưởng tiêucực tới kết quả hoạt động kinh doanh hoặc giúp phát hiện ra những cơ hội mới. 256 Việc phát triển mô hình Máy học theo cách truyền thống đòi hỏi nhiều tài nguyên,đòi hỏi kiến thức chuyên môn cao và thời gian rất lâu để xây dựng mô hình và khi so sánhnhiều mô hình với nhau. Khi các công cụ thống kê truyền thống gặp khó khăn trong việcxử lý các dữ liệu đầu vào đa biến, bỏ sót những tiềm năng mang lợi thế cạnh tranh để nắmbắt & ảnh hưởng tiêu cực tới các hoạt động kinh doanh thực tế thì các công cụ Máy học tựđộng có thể giúp tăng cường việc phân tích, xây dựng mô hình & dự đoán dựa vào dữ liệuchuỗi thời gian để đề xuất cho doanh nghiệp những cơ hội dễ hiểu & khả thi một cách đơngiản và nhanh chóng. Máy học tự động (Automated Machine Learning) sử dụng các thuật toán m học đượctự động hóa và quá trình thiết kế có cấu trúc của mô hình đã được xác định. Máy học tựđộng cung cấp các công cụ phân tích dữ liệu có cấu trúc một cách có hệ thống được thiếtkế sẵn để hỗ trợ các lĩnh vực như bán lẻ, chuyển đổi, y tế... nhằm thu được kinh nghiệmthực tiễn tốt nhất khi áp dụng các thuật toán Máy học để giải quyết các bài toán dự đoánchính xác với chi phí thấp và nhanh chóng. Máy học tự động thực hiện quy trình tự động hóa các tác vụ và liên tục lặp lại mộtphần hoặc toàn bộ quy trình này để phát triển mô hình máy học nên mất nhiều thời gian đểthực hiện. Nó cho phép các nhà khoa học dữ liệu, nhà phân tích và nhà phát triển để xâydựng các mô hình Máy học có khả năng phát triển quy mô khi ứng dụng với hiệu quả vànăng suất cao nhưng vẫn đảm bảo chất lượng của mô hình. Máy học tự động đang đượcứng dụng trong dịch vụ Máy học Azure được phát triển từ thành công mang tính đột phácủa bộ phận nghiên cứu trong tập đoàn Microsoft.ĐẶC TRƯNG CỦA CHUỖI THỜI GIAN & CÁC ỨNG DỤNG Mọi hoạt động của thế giới, con người & thiên nhiên đều thay đổi theo thời gian.Chuỗi thời gian có thể định nghĩa là một chuỗi các dữ liệu tại các thời điểm được đánh dấutạo thành các mốc thời gian cách xa đều nhau. Phân tích chuỗi thời gian là việc sử dụng cácphương pháp thống kê hoặc Máy học để phân tích dữ liệu tại một hoặc nhiều mốc thời gianbằng cách trích xuất được các mẫu có đầy đủ ý nghĩa trong các biến đầu ra như là xu hướng(nhu cầu sử dụng laptop nhiều hơn máy tính để bàn, thanh toán bằng ví điện tử nhiều hơnthanh toán tiền mặt, mua hàng online ngày càng phát triển ... ), mùa kinh doanh (mùa hè,tháng nhập học, Tết Nguyên đán ... ) hoặc các sự kiện đặc biệt (ngày mua sắm cao điểmBlack Friday, lễ giáng sinh, ngày lễ tình nhân 14/02 ... ) và mối quan hệ hoặc tương tác 257giữa các biến đầu vào giúp việc dự đoán các biến đầu vào sẽ thay đổi như thế nào để ảnhhưởng đến các biến đầu ra. Có nhiều ứng dụng của phân tích chuỗi thời gian, trong số đó là nhu cầu về việc dựbáo tương lai giúp cải thiện công tác hoạch định sản xuất tối ưu hơn. Điều này cho phép dựđoán về tình hình nhà đất của một địa phương trong năm tới, nhu cầu về phòng khách sạntại Phú Quốc trong tuần tới, số lượng người sẽ đổ về phố đi bộ trong vài giờ tới, khối lượngcông việc của bộ định tuyến trong vài phút tới & thậm chí số lượng click chuột & sự chuyểnđổi của một cổng thanh toán mua sắm trực tuyến trong 30 giây tiếp theo. Ngoài vi ...
Tìm kiếm theo từ khóa liên quan:
Kỷ yếu hội thảo khoa học Hội thảo Phân tích - quản trị dữ liệu thông minh Phân tích chuỗi thời gian Phương pháp máy học tự động hóa Dữ liệu pha tạp Automated Machine LearningGợi ý tài liệu liên quan:
-
Yếu tố nhận diện người thứ ba ngay tình trong giao dịch dân sự
11 trang 318 0 0 -
197 trang 275 0 0
-
Cách tính nhanh giá trị riêng của ma trận vuông cấp 2 và cấp 3
4 trang 273 0 0 -
Một số vấn đề về chuyển đổi số và ứng dụng trong doanh nghiệp
11 trang 260 0 0 -
Quản lý dữ liệu thông tin người hưởng bảo hiểm xã hội
6 trang 224 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 222 0 0 -
Phương pháp nhận diện biển số xe ô tô sử dụng học máy và thư viện OpenCV
6 trang 210 0 0 -
11 trang 205 0 0
-
Nghi thức chào hỏi trong văn hóa giao tiếp của người Nhật
13 trang 161 0 0 -
Một số ứng dụng của xác suất thống kê
5 trang 147 0 0