Khai thác thông tin tình trạng ùn tắc giao thông từ dữ liệu GPS - Trường hợp thành phố Hồ Chí Minh
Số trang: 5
Loại file: pdf
Dung lượng: 1.35 MB
Lượt xem: 9
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài báo này đề xuất giải pháp trích xuất thông tin hữu ích về tình trạng giao thông từ dữ liệu GPS thu thập được từ các thiết bị giám sát hành trình của phương tiện giao thông. Giải thuật gom cụm dựa trên mật độ được tích hợp vào trong quy trình khai thác dữ liệu để lọc ra các vị trí thường xuyên ùn tắc trong mạng lưới giao thông đô thị. Chúng tôi tiến hành thực nghiệm trên bộ dữ liệu thật phạm vi Thành phố Hồ Chí Minh và thu được kết quả khá hứa hẹn về mặt ứng dụng.
Nội dung trích xuất từ tài liệu:
Khai thác thông tin tình trạng ùn tắc giao thông từ dữ liệu GPS - Trường hợp thành phố Hồ Chí Minh 36 Journal of Transportation Science and Technology, Vol 20, Aug 2016 KHAI THÁC THÔNG TIN TÌNH TRẠNG ÙN TẮC GIAO THÔNG TỪ DỮ LIỆU GPS - TRƯỜNG HỢP THÀNH PHỐ HỒ CHÍ MINH MINING INFORMATION ABOUT TRAFFIC CONGESTIONS FROM GPS DATA – CASE STUDY OF HO CHI MINH CITY Lê Văn Quốc Anh Khoa CNTT, ĐH GTVT TP.HCM, anh@ut.edu.vn Tóm tắt: Bài báo này đề xuất giải pháp trích xuất thông tin hữu ích về tình trạng giao thông từ dữ liệu GPS thu thập được từ các thiết bị giám sát hành trình của phương tiện giao thông. Giải thuật gom cụm dựa trên mật độ được tích hợp vào trong quy trình khai thác dữ liệu để lọc ra các vị trí thường xuyên ùn tắc trong mạng lưới giao thông đô thị. Chúng tôi tiến hành thực nghiệm trên bộ dữ liệu thật phạm vi Thành phố Hồ Chí Minh và thu được kết quả khá hứa hẹn về mặt ứng dụng. Từ khóa: Dữ liệu hành trình GPS; khai thác dữ liệu; phát hiện ùn tắc. Abstract: This paper presents an approach to the discovery of useful information about traffic condition from GPS data obtained from vehicle tracking devices. A density - based clustering approach is intergrated into the data mining process to figure out the most likely areas of congestions in urban traffic networks. We performed experiments on real - life datasets of Ho Chi Minh City and obtained very promissing results for developing applications. Keywords: Gps trajectory data; data mining; congestion detection. 1. Giới thiệu Mặc dù tính ứng dụng của bài toán này là Khai thác dữ liệu là quá trình tìm kiếm và khá đa dạng nhưng việc xử lý trên dữ liệu GPS rút trích những thông tin tiềm ẩn có giá trị, hữu và rút trích được những thông tin có giá trị gặp ích từ một khối lượng dữ liệu khá lớn ban đầu. nhiều thách thức. Thứ nhất, với sự ổn định và Những thông tin được rút trích được gọi là tri tính chính xác tương đối, bản thân dữ liệu thức, là yếu tố quyết định giúp phát triển các dạng này xuất hiện khá nhiều điểm dữ liệu ứng dụng thông minh. Trong lĩnh vực giao nhiễu và mất mát thông tin [5]. Thứ hai, dữ thông vận tải, việc sử dụng kết quả từ việc liệu thu thập theo thời gian nên khối lượng dữ phân tích dữ liệu từ các thiết bị giám sát hành liệu để phân tích là khá lớn, có thể xem như là trình, dữ liệu xe con di dộng (FCD) và dữ liệu một dạng “Big Data”. Điểm cuối cùng là vấn điện thoại trực tuyến (FPD) đã đem lại những đề biểu diễn những tri thức khai thác được từ hiệu quả rõ rệt trong vấn đề giám sát và quản dữ liệu GPS. Rất khó để mô tả hay diễn dịch lý giao thông [1]. nếu không sử dụng các công cụ trực quan hoá [6]. Bài báo này đề cập đến bài toán phân tích hay khai thác dữ liệu hành trình thu thập được Bài báo này trình bày giải pháp hiệu quả từ các thiết bị thu GPS, gọi tắt là dữ liệu GPS, cho bài toán trích xuất thông tin về tình trạng để trích xuất những thông tin có giá trị và hữu ùn tắc giao thông từ dữ liệu GPS với các đóng ích về tình trạng ùn tắc giao thông của mạng góp sau: lưới giao thông trong đô thị. Nguồn của dữ Mô hình hoá điểm ùn tắc giao thông liệu GPS khá đa dạng và phổ biến, thông dụng dựa trên khái niệm Cluster. nhất là từ các thiết bị thu GPS gắn trên các Giải quyết vấn đề nhiễu bằng cách tách phương tiện giao thông hay thu thập qua phần điểm dữ liệu và gom cụm dựa trên mật độ. mềm viết cho các điện thoại thông minh. Việc khai thác dữ liệu GPS mang lại khá nhiều ứng Trực quan hoá các điểm ùn tắc trên dụng hữu ích, như: dự báo tắc nghẽn giao bản đồ. thông [2], khai thác địa điểm quan trọng và lộ 2. Các khái niệm và công trình liên trình thông dụng từ dữ liệu GPS [3], quy quan hoạch sử dụng các lộ trình tối ưu [4]. 2.1. Mô hình hoá dữ liệu GPS 37 TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016 Dữ liệu thô thu thập từ các thiết bị thu GPS gọi là GPS Log tồn tại dưới khá nhiều định dạng, trong đó thông dụng là ở định dạng file (CSV, GPX, KML,…) hoặc dạng bảng trong một hệ quản trị cơ sở dữ liệu quan hệ (Oracle, MS SQL Server,…), tham khảo hình 1. Hình 1. Minh hoạ GPS Log thu thập từ một thiết bị giám sát hành trình phương tiện giao thông. Hình 2. Minh hoạ một quỹ đạo GPS trích xuất từ GPS Log, khu vực TP.HCM, xuất phát từ Quận 10, qua Để có sự chuẩn hoá dữ liệu đầu vào cho giải Quận 2, và dừng ở Quận 7. thuật khai thác dữ liệu sau này, chúng tôi mô 2.2. Gom cụm dữ liệu dựa trên mật độ hình hoá dữ liệu GPS qua các khái niệm sau - Giải thuật DBSCAN đây: Giải thuật DBSCAN [7] là giải thuật gom Toạ độ GPS: Được biểu diễn bởi bộ cụm dữ liệu dựa trên mật độ được đánh giá là bốn , trong đó: id là mã khá hiệu quả trong việc gom cụm điểm dữ liệu định danh của đối tượng chuyển động có yếu tố nhiễu. Ngoài ra, những đặc tính khác (phương tiện giao thông hoặc một điện thoại của giải thuật này rất phù hợp để được lựa có hỗ trợ GPS); lat là vĩ độ, lon là kinh độ; và chọn trong bài toán phát hiện điểm ùn tắc giao time là thời gian ghi nhận vị trí của đối tượng. thông, như: Không yêu cầu cung cấp trước số GPS Log: Là một tập hợp các toạ độ lượng cụm (trong trường hợp này là số điểm GPS, có ...
Nội dung trích xuất từ tài liệu:
Khai thác thông tin tình trạng ùn tắc giao thông từ dữ liệu GPS - Trường hợp thành phố Hồ Chí Minh 36 Journal of Transportation Science and Technology, Vol 20, Aug 2016 KHAI THÁC THÔNG TIN TÌNH TRẠNG ÙN TẮC GIAO THÔNG TỪ DỮ LIỆU GPS - TRƯỜNG HỢP THÀNH PHỐ HỒ CHÍ MINH MINING INFORMATION ABOUT TRAFFIC CONGESTIONS FROM GPS DATA – CASE STUDY OF HO CHI MINH CITY Lê Văn Quốc Anh Khoa CNTT, ĐH GTVT TP.HCM, anh@ut.edu.vn Tóm tắt: Bài báo này đề xuất giải pháp trích xuất thông tin hữu ích về tình trạng giao thông từ dữ liệu GPS thu thập được từ các thiết bị giám sát hành trình của phương tiện giao thông. Giải thuật gom cụm dựa trên mật độ được tích hợp vào trong quy trình khai thác dữ liệu để lọc ra các vị trí thường xuyên ùn tắc trong mạng lưới giao thông đô thị. Chúng tôi tiến hành thực nghiệm trên bộ dữ liệu thật phạm vi Thành phố Hồ Chí Minh và thu được kết quả khá hứa hẹn về mặt ứng dụng. Từ khóa: Dữ liệu hành trình GPS; khai thác dữ liệu; phát hiện ùn tắc. Abstract: This paper presents an approach to the discovery of useful information about traffic condition from GPS data obtained from vehicle tracking devices. A density - based clustering approach is intergrated into the data mining process to figure out the most likely areas of congestions in urban traffic networks. We performed experiments on real - life datasets of Ho Chi Minh City and obtained very promissing results for developing applications. Keywords: Gps trajectory data; data mining; congestion detection. 1. Giới thiệu Mặc dù tính ứng dụng của bài toán này là Khai thác dữ liệu là quá trình tìm kiếm và khá đa dạng nhưng việc xử lý trên dữ liệu GPS rút trích những thông tin tiềm ẩn có giá trị, hữu và rút trích được những thông tin có giá trị gặp ích từ một khối lượng dữ liệu khá lớn ban đầu. nhiều thách thức. Thứ nhất, với sự ổn định và Những thông tin được rút trích được gọi là tri tính chính xác tương đối, bản thân dữ liệu thức, là yếu tố quyết định giúp phát triển các dạng này xuất hiện khá nhiều điểm dữ liệu ứng dụng thông minh. Trong lĩnh vực giao nhiễu và mất mát thông tin [5]. Thứ hai, dữ thông vận tải, việc sử dụng kết quả từ việc liệu thu thập theo thời gian nên khối lượng dữ phân tích dữ liệu từ các thiết bị giám sát hành liệu để phân tích là khá lớn, có thể xem như là trình, dữ liệu xe con di dộng (FCD) và dữ liệu một dạng “Big Data”. Điểm cuối cùng là vấn điện thoại trực tuyến (FPD) đã đem lại những đề biểu diễn những tri thức khai thác được từ hiệu quả rõ rệt trong vấn đề giám sát và quản dữ liệu GPS. Rất khó để mô tả hay diễn dịch lý giao thông [1]. nếu không sử dụng các công cụ trực quan hoá [6]. Bài báo này đề cập đến bài toán phân tích hay khai thác dữ liệu hành trình thu thập được Bài báo này trình bày giải pháp hiệu quả từ các thiết bị thu GPS, gọi tắt là dữ liệu GPS, cho bài toán trích xuất thông tin về tình trạng để trích xuất những thông tin có giá trị và hữu ùn tắc giao thông từ dữ liệu GPS với các đóng ích về tình trạng ùn tắc giao thông của mạng góp sau: lưới giao thông trong đô thị. Nguồn của dữ Mô hình hoá điểm ùn tắc giao thông liệu GPS khá đa dạng và phổ biến, thông dụng dựa trên khái niệm Cluster. nhất là từ các thiết bị thu GPS gắn trên các Giải quyết vấn đề nhiễu bằng cách tách phương tiện giao thông hay thu thập qua phần điểm dữ liệu và gom cụm dựa trên mật độ. mềm viết cho các điện thoại thông minh. Việc khai thác dữ liệu GPS mang lại khá nhiều ứng Trực quan hoá các điểm ùn tắc trên dụng hữu ích, như: dự báo tắc nghẽn giao bản đồ. thông [2], khai thác địa điểm quan trọng và lộ 2. Các khái niệm và công trình liên trình thông dụng từ dữ liệu GPS [3], quy quan hoạch sử dụng các lộ trình tối ưu [4]. 2.1. Mô hình hoá dữ liệu GPS 37 TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016 Dữ liệu thô thu thập từ các thiết bị thu GPS gọi là GPS Log tồn tại dưới khá nhiều định dạng, trong đó thông dụng là ở định dạng file (CSV, GPX, KML,…) hoặc dạng bảng trong một hệ quản trị cơ sở dữ liệu quan hệ (Oracle, MS SQL Server,…), tham khảo hình 1. Hình 1. Minh hoạ GPS Log thu thập từ một thiết bị giám sát hành trình phương tiện giao thông. Hình 2. Minh hoạ một quỹ đạo GPS trích xuất từ GPS Log, khu vực TP.HCM, xuất phát từ Quận 10, qua Để có sự chuẩn hoá dữ liệu đầu vào cho giải Quận 2, và dừng ở Quận 7. thuật khai thác dữ liệu sau này, chúng tôi mô 2.2. Gom cụm dữ liệu dựa trên mật độ hình hoá dữ liệu GPS qua các khái niệm sau - Giải thuật DBSCAN đây: Giải thuật DBSCAN [7] là giải thuật gom Toạ độ GPS: Được biểu diễn bởi bộ cụm dữ liệu dựa trên mật độ được đánh giá là bốn , trong đó: id là mã khá hiệu quả trong việc gom cụm điểm dữ liệu định danh của đối tượng chuyển động có yếu tố nhiễu. Ngoài ra, những đặc tính khác (phương tiện giao thông hoặc một điện thoại của giải thuật này rất phù hợp để được lựa có hỗ trợ GPS); lat là vĩ độ, lon là kinh độ; và chọn trong bài toán phát hiện điểm ùn tắc giao time là thời gian ghi nhận vị trí của đối tượng. thông, như: Không yêu cầu cung cấp trước số GPS Log: Là một tập hợp các toạ độ lượng cụm (trong trường hợp này là số điểm GPS, có ...
Tìm kiếm theo từ khóa liên quan:
Thông tin tình trạng ùn tắc giao thông Dữ liệu GPS Hồ Chí Minh Khai thác dữ liệu Phát hiện ùn tắcGợi ý tài liệu liên quan:
-
8 trang 148 0 0
-
Cấp bản sao văn bằng, chứng chỉ.
4 trang 82 0 0 -
4 trang 80 0 0
-
Sự kiện Bác Hồ ra đi tìm đường cứu nước - Ý nghĩa lịch sử và giá trị thời đại: Phần 2
128 trang 67 0 0 -
SỰ RA ĐỜI CỦA ĐOÀN THANH NIÊN CỘNG SẢN HỒ CHÍ MINH
3 trang 61 0 0 -
Tư tưởng Hồ Chí Minh về quyền con người: Phần 2 - TS. Phạm Ngọc Anh
101 trang 52 0 0 -
Tiểu luận: Nguồn gốc hình thành và nguồn gốc quyết định đến bản chất tư tưởng Hồ Chí Minh
20 trang 50 0 0 -
Hệ quyết định nhất quán và luật quan trọng
6 trang 42 0 0 -
Lưu trữ và thư viện số - Nền tảng xây dựng nhân văn số thức
8 trang 37 0 0 -
Tổng quan về lợi ích và hạn chế của khai thác dữ liệu trong nghiên cứu giáo dục
3 trang 36 0 0