Dự báo chuỗi thời gian dựa trên matrix profile
Số trang: 11
Loại file: pdf
Dung lượng: 556.60 KB
Lượt xem: 9
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết đề xuất một phương pháp mới trong dự đoán chuỗi thời gian sử dụng matrix profile, là một vector khoảng cách của các cặp là motif hay những cặp lân cận với nhau. Với việc áp dụng thuộc tính Consecutive Neighborhood Preserving (CNP), kết quả thực nghiệm cho thấy phương pháp đề xuất có độ chính xác cao hơn và thời gian tính toán nhanh hơn các phương pháp trước đó.
Nội dung trích xuất từ tài liệu:
Dự báo chuỗi thời gian dựa trên matrix profile Hội nghị Khoa học công nghệ lần thứ XXII Trường Đại học Giao thông vận tải DỰ BÁO CHUỖI THỜI GIAN DỰA TRÊN MATRIX PROFILE Trần Thị Dung1, Trần Phong Nhã1, Bùi Ngọc Dũng2* Phân hiệu tại Thành phố Hồ Chí Minh, Trường Đại học Giao thông vận tải, 1 Số 450-451 Lê Văn Việt, Phường Tăng Nhơn Phú A, Quận 9, Thành phố Hồ Chí Minh2 Khoa Công nghệ thông tin, Trường Đại học Giao thông vận tải, Số 3 Cầu giấy, Hà Nội * Tác giả liên hệ: Email: dnbui@utc.edu.vn.Tóm tắt. Dự báo chuỗi thời gian là một lĩnh vực đang được các nhà khoa học quantâm do đó có nhiều ứng dụng trong thực tế. Đã có nhiều phương pháp được đề xuấttrong bài toán dự báo chuỗi thời gian như: dự báo tuyến tính, mô hình tự hồi quy, môhình trung bình trượt, mô hình mạng neural nhân tạo, mô hình Markov ẩn. Tuy nhiêncác phương pháp đó có nhược điểm là thời gian tính toán lâu và không có nhiều trườnghợp thực nghiệm để so sánh kết quả tối ưu. Trong bài báo này, chúng tôi đề xuất mộtphương pháp mới trong dự đoán chuỗi thời gian sử dụng matrix profile, là một vectorkhoảng cách của các cặp là motif hay những cặp lân cận với nhau. Với việc áp dụngthuộc tính Consecutive Neighborhood Preserving (CNP), kết quả thực nghiệm chothấy phương pháp đề xuất có độ chính xác cao hơn và thời gian tính toán nhanh hơncác phương pháp trước đó.Từ khóa: chuỗi thời gian, motif, dự báo chuỗi thời gian, Consecutive NeighborhoodPreserving;1. ĐẶT VẤN ĐỀ Dự báo chuỗi thời gian là một nhu cầu không thể thiếu cho những hoạt động củacon người trong bối cảnh bùng nổ thông tin. Việc dự báo sẽ cung cấp những cơ sở cầnthiết cho các hoạch định và có thể nói rằng, nếu không có khoa học dự báo thì nhữngdự định tương lai của con người vạch ra sẽ không có sự thuyết phục đáng kể. Các ứngdụng của dự báo chuỗi thời gian được sử dụng trong các lĩnh vực: tài chính để dự báogiá chứng khoán [1], dự báo kinh doanh xăng dầu [2], dự báo tuyển sinh đại học [3],dự báo dân số [3]. Đã có nhiều phương pháp dự báo chuỗi thời gian được các nhà nghiên cứu đềxuất những năm gần đây. Năm 2009, Jiang đề xuất phương pháp dự báo chuỗi thờigian chứng khoán dựa vào thông tin motif [4]. Năm 2007, Lora sử dụng kỹ thuật lâncận gần nhất có trong số để dự báo dữ liệu [5]. Năm 2015, cách tiếp cận mới dựa trênđại số gia tử theo ngữ nghĩa trong bài toán dự báo chuỗi thời gian mờ đã được Hiếucùng các cộng sự giới thiệu [6]. Năm 2016, Tùng và các cộng sự đã sử dụng chuỗi thờigian mờ theo tiếp cận đại số gia tử để dự báo chuỗi thời gian [7].-680-Hội nghị Khoa học công nghệ lần thứ XXII Trường Đại học Giao thông vận tải Phương pháp dự báo bằng matrix profile là một phương pháp mới áp dụng chochuỗi thời gian. Đây là phương pháp tìm lân cận gần nhất của mỗi chuỗi con trongchuỗi thời gian. Dựa vào đặc tính lân cận gần nhất, ta có thể đưa ra dự đoán về các giátrị tiếp diễn trong chuỗi thời gian. Phương pháp được thử nghiệm trên tập dữ liệuneuroscience cho kết quả tốt hơn về độ chính xác và thời gian.2. PHƯƠNG PHÁP DỰ ĐOÁN CHUỖI THỜI GIAN6.1. Nền tảng lý thuyết2.1.1. Chuỗi thời gian: Nếu T là một chuỗi thời gian thì T=(t1, t2,…,tn) gồm tập hợp nsố có giá trị thực theo thời gian [8].2.1.2. Chuỗi con: Cho một chuỗi thời gian T = (t1, t2…, tn), một chuỗi con có chiều dài n của T là mộtchuỗi Ti, n = (ti, ti+1,…, ti+n-1) với 1≤ i ≤ m-n+1 [8].2.1.3. Các định nghĩa về matrix profile Định nghĩa 1: Một Matrix distances Di tương ứng với chuỗi con Ti, m và chuỗithời gian T là một vectơ của khoảng cách Euclide giữa một chuỗi con đã cho Ti, m vàmỗi chuỗi con trong chuỗi thời gian T. Hoặc Di = [di, 1, di, 2,..., di, n-m + 1], trong đó di, j(1≤ j ≤ n - m + 1) là khoảng cách giữa Ti, m và Tj, m [9]. Định nghĩa 2: Một Matrix profile P của chuỗi thời gian T là một vector củakhoảng các Euclide giữa mỗi chuỗi con của T và lân cận gần nhất trong T, khái niệmlân cận gần nhất có nghĩa là hai cặp chuỗi con có khoảng cách nhỏ nhất so với cácchuỗi con khác. Hay, P = [min(D1), min(D2),…,min(Dn-m+1)], trong đó Di (1 ≤ i ≤ n-m+1) là Matrixdistances Di tương ứng với truy vấn Ti,m và chuỗi thời gian T [9]. Trong Hình 1 thể hiện mối quan hệ giữa khoảng cách ma trận, Matrix distancesvà Matrix profile. Mỗi thành phần của ma trận khoảng cách di,j là khoảng cách giữaTi,m và Tj,m (1 ≤ i, j ≤ n-m+1) trong chuỗi thời gian T.Hình 1. Mối quan hệ giữa khoảng cách ma trận, Matrix distances và Matrix profile ([9]). Chỉ số i trong Matrix profile P nói chúng ta khoảng cách Euclide giữa chuỗi conTi, m với lân cận gần nhất trong chuỗi thời gian T. Tuy nhiên, nó không nói lên vị trí -681-Hội nghị Khoa học công nghệ lần thứ XXII ...
Nội dung trích xuất từ tài liệu:
Dự báo chuỗi thời gian dựa trên matrix profile Hội nghị Khoa học công nghệ lần thứ XXII Trường Đại học Giao thông vận tải DỰ BÁO CHUỖI THỜI GIAN DỰA TRÊN MATRIX PROFILE Trần Thị Dung1, Trần Phong Nhã1, Bùi Ngọc Dũng2* Phân hiệu tại Thành phố Hồ Chí Minh, Trường Đại học Giao thông vận tải, 1 Số 450-451 Lê Văn Việt, Phường Tăng Nhơn Phú A, Quận 9, Thành phố Hồ Chí Minh2 Khoa Công nghệ thông tin, Trường Đại học Giao thông vận tải, Số 3 Cầu giấy, Hà Nội * Tác giả liên hệ: Email: dnbui@utc.edu.vn.Tóm tắt. Dự báo chuỗi thời gian là một lĩnh vực đang được các nhà khoa học quantâm do đó có nhiều ứng dụng trong thực tế. Đã có nhiều phương pháp được đề xuấttrong bài toán dự báo chuỗi thời gian như: dự báo tuyến tính, mô hình tự hồi quy, môhình trung bình trượt, mô hình mạng neural nhân tạo, mô hình Markov ẩn. Tuy nhiêncác phương pháp đó có nhược điểm là thời gian tính toán lâu và không có nhiều trườnghợp thực nghiệm để so sánh kết quả tối ưu. Trong bài báo này, chúng tôi đề xuất mộtphương pháp mới trong dự đoán chuỗi thời gian sử dụng matrix profile, là một vectorkhoảng cách của các cặp là motif hay những cặp lân cận với nhau. Với việc áp dụngthuộc tính Consecutive Neighborhood Preserving (CNP), kết quả thực nghiệm chothấy phương pháp đề xuất có độ chính xác cao hơn và thời gian tính toán nhanh hơncác phương pháp trước đó.Từ khóa: chuỗi thời gian, motif, dự báo chuỗi thời gian, Consecutive NeighborhoodPreserving;1. ĐẶT VẤN ĐỀ Dự báo chuỗi thời gian là một nhu cầu không thể thiếu cho những hoạt động củacon người trong bối cảnh bùng nổ thông tin. Việc dự báo sẽ cung cấp những cơ sở cầnthiết cho các hoạch định và có thể nói rằng, nếu không có khoa học dự báo thì nhữngdự định tương lai của con người vạch ra sẽ không có sự thuyết phục đáng kể. Các ứngdụng của dự báo chuỗi thời gian được sử dụng trong các lĩnh vực: tài chính để dự báogiá chứng khoán [1], dự báo kinh doanh xăng dầu [2], dự báo tuyển sinh đại học [3],dự báo dân số [3]. Đã có nhiều phương pháp dự báo chuỗi thời gian được các nhà nghiên cứu đềxuất những năm gần đây. Năm 2009, Jiang đề xuất phương pháp dự báo chuỗi thờigian chứng khoán dựa vào thông tin motif [4]. Năm 2007, Lora sử dụng kỹ thuật lâncận gần nhất có trong số để dự báo dữ liệu [5]. Năm 2015, cách tiếp cận mới dựa trênđại số gia tử theo ngữ nghĩa trong bài toán dự báo chuỗi thời gian mờ đã được Hiếucùng các cộng sự giới thiệu [6]. Năm 2016, Tùng và các cộng sự đã sử dụng chuỗi thờigian mờ theo tiếp cận đại số gia tử để dự báo chuỗi thời gian [7].-680-Hội nghị Khoa học công nghệ lần thứ XXII Trường Đại học Giao thông vận tải Phương pháp dự báo bằng matrix profile là một phương pháp mới áp dụng chochuỗi thời gian. Đây là phương pháp tìm lân cận gần nhất của mỗi chuỗi con trongchuỗi thời gian. Dựa vào đặc tính lân cận gần nhất, ta có thể đưa ra dự đoán về các giátrị tiếp diễn trong chuỗi thời gian. Phương pháp được thử nghiệm trên tập dữ liệuneuroscience cho kết quả tốt hơn về độ chính xác và thời gian.2. PHƯƠNG PHÁP DỰ ĐOÁN CHUỖI THỜI GIAN6.1. Nền tảng lý thuyết2.1.1. Chuỗi thời gian: Nếu T là một chuỗi thời gian thì T=(t1, t2,…,tn) gồm tập hợp nsố có giá trị thực theo thời gian [8].2.1.2. Chuỗi con: Cho một chuỗi thời gian T = (t1, t2…, tn), một chuỗi con có chiều dài n của T là mộtchuỗi Ti, n = (ti, ti+1,…, ti+n-1) với 1≤ i ≤ m-n+1 [8].2.1.3. Các định nghĩa về matrix profile Định nghĩa 1: Một Matrix distances Di tương ứng với chuỗi con Ti, m và chuỗithời gian T là một vectơ của khoảng cách Euclide giữa một chuỗi con đã cho Ti, m vàmỗi chuỗi con trong chuỗi thời gian T. Hoặc Di = [di, 1, di, 2,..., di, n-m + 1], trong đó di, j(1≤ j ≤ n - m + 1) là khoảng cách giữa Ti, m và Tj, m [9]. Định nghĩa 2: Một Matrix profile P của chuỗi thời gian T là một vector củakhoảng các Euclide giữa mỗi chuỗi con của T và lân cận gần nhất trong T, khái niệmlân cận gần nhất có nghĩa là hai cặp chuỗi con có khoảng cách nhỏ nhất so với cácchuỗi con khác. Hay, P = [min(D1), min(D2),…,min(Dn-m+1)], trong đó Di (1 ≤ i ≤ n-m+1) là Matrixdistances Di tương ứng với truy vấn Ti,m và chuỗi thời gian T [9]. Trong Hình 1 thể hiện mối quan hệ giữa khoảng cách ma trận, Matrix distancesvà Matrix profile. Mỗi thành phần của ma trận khoảng cách di,j là khoảng cách giữaTi,m và Tj,m (1 ≤ i, j ≤ n-m+1) trong chuỗi thời gian T.Hình 1. Mối quan hệ giữa khoảng cách ma trận, Matrix distances và Matrix profile ([9]). Chỉ số i trong Matrix profile P nói chúng ta khoảng cách Euclide giữa chuỗi conTi, m với lân cận gần nhất trong chuỗi thời gian T. Tuy nhiên, nó không nói lên vị trí -681-Hội nghị Khoa học công nghệ lần thứ XXII ...
Tìm kiếm theo từ khóa liên quan:
Dự báo chuỗi thời gian Mô hình mạng neural nhân tạo Mô hình Markov ẩn Thuật toán preSCRIMP Dự báo giá chứng khoánGợi ý tài liệu liên quan:
-
Cải biên thuật toán bậc cao của singh và ứng dụng trong dự báo chuỗi thời gian
8 trang 47 0 0 -
Dự báo chuỗi thời gian với mô hình Transfomers
4 trang 43 1 0 -
Nhận dạng tiếng Việt nói trên thiết bị di động
9 trang 27 0 0 -
Bài giảng: Dự báo sử dụng mô hình chuỗi thời gian
23 trang 25 0 0 -
Bài giảng Sử dụng mô hình Arima trong dự báo chuỗi thời gian - Cao Hào Thi
26 trang 25 0 0 -
Thiết bị tổng hợp văn bản tiếng Việt sang tiếng nói dựa trên mô hình Markov ẩn
5 trang 23 0 0 -
18 trang 23 0 0
-
25 trang 20 0 0
-
155 trang 20 0 0
-
Áp dụng bottle neck feature cho nhận dạng tiếng nói tiếng Việt
10 trang 19 0 0