Điều phối tác vụ trong hệ thống MAP-REDUCE dựa trên tính địa phương của dữ liệu
Số trang: 6
Loại file: pdf
Dung lượng: 1.65 MB
Lượt xem: 12
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết tập trung nghiên cứu và so sánh hiệu suất hệ thống trong các trường hợp độ sao lưu dữ liệu có giá trị khác nhau, từ đó giúp người vận hành hệ thống Map-Reduce có thêm một tiêu chí để chọn các thông số hệ thống phù hợp. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Điều phối tác vụ trong hệ thống MAP-REDUCE dựa trên tính địa phương của dữ liệu Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) iu Phi Tác V Trong H Thng MAP-REDUCE Da Trên Tính a Phưng Ca D Liu Hunh Tn t Bùi Xuân Lc Hc viên Khoa Công Ngh Thông Tin II Khoa K Thut Hc Vin Công Ngh Bưu Chính Vin Thông i Hc Tân To Email: dathuynhtan@gmail.com Email: locbui@ieee.org Abstract— Vn d liu a phưng là mt vn quan trng thêm to ra kt qu cui cùng. Khi thc hin các tác v cn xem xét khi thit k thut toán iu phi công vic cho h “map”, mt trong nhng xem xét quan trng là vic phân b thng Map-Reduce. Gn ây, bài báo k thut [13] ã gii quyt tác v gn vi máy tính lưu tr khi d liu u vào cho tác v ưc vn d liu a phưng bng vic xut mt kin trúc ó; vn này còn ưc gi là vn d liu a phưng. hàng i mi và mt thut toán iu phi tác v ánh x (map task) da trên chính sách JSQ (Join the Shortest Queue) kt hp i vi mi tác v, chúng ta gi mt máy tính là mt máy vi chính sách MaxWeight. Tuy nhiên, bài báo [13] ch xem xét tính a phưng cho tác v nu on d liu liên quan n tác trưng hp sao lưu d liu là mt giá tr c th bng 3. Trên v này ưc lưu tr ngay ti máy tính ó, và chúng ta gi tác thc t, tu thuc vào cu hình h thng, sao lưu d liu có th v này là mt tác v a phưng trên máy tính. Trong trưng ln hn hoc nh hn 3. Trong bài báo này, chúng tôi m rng nghiên cu ca bài báo [13] và so sánh hiu sut h thng trong hp còn li (ngha là d liu cn thit cho tác v không ưc các trưng hp sao lưu d liu có giá tr khác nhau, t ó lưu tr ti máy tính), máy tính ó ưc gi là máy tính t xa giúp ngưi vn hành h thng Map-Reduce có thêm mt tiêu chí cho tác v, và tưng ng vi tác v này ưc gi là tác v t chn các thông s h thng phù hp. xa trên máy tính. Tính a phưng nên ưc xem xét n trong vic phân b các tác v “map” chy trên các máy tính. Vic Keywords- in toán ám mây, Map-Reduce, d liu a ci thin tính a phưng có th gim thi gian x lý ca các phưng, Hadoop. tác v “map” và lưu lưng ti t mng khi mt vài tác v “map” cn ly d liu t xa. Tuy nhiên, vic gán tt c các tác I. GII THIU v n các máy tính a phưng có th dn n mt s phân Ngày nay, chúng ta ang sng trong thi i thông tin, vi phi không ng u ca các tác v gia các máy, tc là mt s tng trưng bùng n thông tin theo cp s nhân. Nhng s máy b tc nghn trong khi các máy khác nhàn ri. Vì vy công ty hàng u v công ngh thông tin như Google, Yahoo!, chúng ta cn phi cân bng gia các d liu a phưng và cân Amazon, Microsoft, Facebook, Twitter… ang i mt vi bng ti trong Map-Reduce. ây chính là ng lc thúc y mt khi lưng d liu khng l. S tng trưng này òi hi các nhà nghiên cu tìm hiu, ci tin, xut các thut toán các chin lưc mi x lý và phân tích d liu. in toán mi nhm nâng cao hiu qu s dng và hiu sut h thng. ám mây ưc phát trin và Map-Reduce/Hadoop ang là mt Mt s thut toán iu phi ưc xut trưc ây trong h mô hình tính toán mnh m ưc ng dng trong in toán thng Map-Reduce/Hadoop ci thin d liu a phưng. ám mây. Vic x lý các tp d liu quy mô ln ã tr thành Thut toán FIFO scheduler trong Hadoop [12] vi vic iu mt vn ngày càng quan trng và y thách thc vi s phi mt máy sn sàng phc v tác v “map” t công vic lưng d liu ưc to ra bi các mng xã hi trc tuyn, head-of-line vi d liu gn nht n máy tính. Mc dù mt vài nghiên cu khoa hc… Map-Reduce/Hadoop [9]-[15] là mt ti ưu hoá a phưng ã ưc thc hin, vn head-of-line framework n gin nhưng mnh m x lý các tp d liu blocking a phưng vn tn ti và hiu sut thông lưng vn quy mô ln trong môi trưng phân tán và x lý song song, và b hn ch. Thut toán Fair Scheduler trong Hadoop [6] vi k ang ưc s dng rng rãi trong thc t. Mt cm máy tính thut iu phi chm tr ưc s dng ci thin a phưng. Map-Reduce có th bao gm hàng chc ngàn máy tính [2]. Các Khi mt máy tính yêu cu mt tác v mi, nu công vic ưc d liu ưc lưu tr thưng ưc t chc trên h thng phân iu phi tip công bng không có tác v a phưng sn có phi tp tin (ví d h thng tp tin Google (GFS) [10], h thng cho máy tính này, thì công vic tm thi b qua và máy tính tp tin phân tán Hadoop (HDFS) [4]) trong ó phân chia mt kim tra các công vic tip theo trong danh sách. K t khi tp d liu ln thành nhiu o ...
Nội dung trích xuất từ tài liệu:
Điều phối tác vụ trong hệ thống MAP-REDUCE dựa trên tính địa phương của dữ liệu Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) iu Phi Tác V Trong H Thng MAP-REDUCE Da Trên Tính a Phưng Ca D Liu Hunh Tn t Bùi Xuân Lc Hc viên Khoa Công Ngh Thông Tin II Khoa K Thut Hc Vin Công Ngh Bưu Chính Vin Thông i Hc Tân To Email: dathuynhtan@gmail.com Email: locbui@ieee.org Abstract— Vn d liu a phưng là mt vn quan trng thêm to ra kt qu cui cùng. Khi thc hin các tác v cn xem xét khi thit k thut toán iu phi công vic cho h “map”, mt trong nhng xem xét quan trng là vic phân b thng Map-Reduce. Gn ây, bài báo k thut [13] ã gii quyt tác v gn vi máy tính lưu tr khi d liu u vào cho tác v ưc vn d liu a phưng bng vic xut mt kin trúc ó; vn này còn ưc gi là vn d liu a phưng. hàng i mi và mt thut toán iu phi tác v ánh x (map task) da trên chính sách JSQ (Join the Shortest Queue) kt hp i vi mi tác v, chúng ta gi mt máy tính là mt máy vi chính sách MaxWeight. Tuy nhiên, bài báo [13] ch xem xét tính a phưng cho tác v nu on d liu liên quan n tác trưng hp sao lưu d liu là mt giá tr c th bng 3. Trên v này ưc lưu tr ngay ti máy tính ó, và chúng ta gi tác thc t, tu thuc vào cu hình h thng, sao lưu d liu có th v này là mt tác v a phưng trên máy tính. Trong trưng ln hn hoc nh hn 3. Trong bài báo này, chúng tôi m rng nghiên cu ca bài báo [13] và so sánh hiu sut h thng trong hp còn li (ngha là d liu cn thit cho tác v không ưc các trưng hp sao lưu d liu có giá tr khác nhau, t ó lưu tr ti máy tính), máy tính ó ưc gi là máy tính t xa giúp ngưi vn hành h thng Map-Reduce có thêm mt tiêu chí cho tác v, và tưng ng vi tác v này ưc gi là tác v t chn các thông s h thng phù hp. xa trên máy tính. Tính a phưng nên ưc xem xét n trong vic phân b các tác v “map” chy trên các máy tính. Vic Keywords- in toán ám mây, Map-Reduce, d liu a ci thin tính a phưng có th gim thi gian x lý ca các phưng, Hadoop. tác v “map” và lưu lưng ti t mng khi mt vài tác v “map” cn ly d liu t xa. Tuy nhiên, vic gán tt c các tác I. GII THIU v n các máy tính a phưng có th dn n mt s phân Ngày nay, chúng ta ang sng trong thi i thông tin, vi phi không ng u ca các tác v gia các máy, tc là mt s tng trưng bùng n thông tin theo cp s nhân. Nhng s máy b tc nghn trong khi các máy khác nhàn ri. Vì vy công ty hàng u v công ngh thông tin như Google, Yahoo!, chúng ta cn phi cân bng gia các d liu a phưng và cân Amazon, Microsoft, Facebook, Twitter… ang i mt vi bng ti trong Map-Reduce. ây chính là ng lc thúc y mt khi lưng d liu khng l. S tng trưng này òi hi các nhà nghiên cu tìm hiu, ci tin, xut các thut toán các chin lưc mi x lý và phân tích d liu. in toán mi nhm nâng cao hiu qu s dng và hiu sut h thng. ám mây ưc phát trin và Map-Reduce/Hadoop ang là mt Mt s thut toán iu phi ưc xut trưc ây trong h mô hình tính toán mnh m ưc ng dng trong in toán thng Map-Reduce/Hadoop ci thin d liu a phưng. ám mây. Vic x lý các tp d liu quy mô ln ã tr thành Thut toán FIFO scheduler trong Hadoop [12] vi vic iu mt vn ngày càng quan trng và y thách thc vi s phi mt máy sn sàng phc v tác v “map” t công vic lưng d liu ưc to ra bi các mng xã hi trc tuyn, head-of-line vi d liu gn nht n máy tính. Mc dù mt vài nghiên cu khoa hc… Map-Reduce/Hadoop [9]-[15] là mt ti ưu hoá a phưng ã ưc thc hin, vn head-of-line framework n gin nhưng mnh m x lý các tp d liu blocking a phưng vn tn ti và hiu sut thông lưng vn quy mô ln trong môi trưng phân tán và x lý song song, và b hn ch. Thut toán Fair Scheduler trong Hadoop [6] vi k ang ưc s dng rng rãi trong thc t. Mt cm máy tính thut iu phi chm tr ưc s dng ci thin a phưng. Map-Reduce có th bao gm hàng chc ngàn máy tính [2]. Các Khi mt máy tính yêu cu mt tác v mi, nu công vic ưc d liu ưc lưu tr thưng ưc t chc trên h thng phân iu phi tip công bng không có tác v a phưng sn có phi tp tin (ví d h thng tp tin Google (GFS) [10], h thng cho máy tính này, thì công vic tm thi b qua và máy tính tp tin phân tán Hadoop (HDFS) [4]) trong ó phân chia mt kim tra các công vic tip theo trong danh sách. K t khi tp d liu ln thành nhiu o ...
Tìm kiếm theo từ khóa liên quan:
Kỷ yếu hội nghị Quốc gia về Điện tử truyền thông Hệ thống MAP-REDUCE Tính địa phương của dữ liệu Điện toán đám mây Sao lưu dữ liệu Thuật toán FIFOGợi ý tài liệu liên quan:
-
63 trang 190 0 0
-
Bài tập nhóm Kiến trúc ứng dụng trong doanh nghiệp: Bạn ở đâu trong đám mây?
32 trang 175 0 0 -
7 trang 160 0 0
-
Kỹ thuật điều chế QPSK cho hệ thống thông tin quang vô tuyến DWDM
6 trang 151 0 0 -
6 trang 144 0 0
-
Đồ án tốt nghiệp: Nghiên cứu và triển khai điện toán đám mây riêng bằng Hyper-V
81 trang 141 1 0 -
Đề xuất khung kiến trúc ứng dụng cho chính phủ di động dựa trên kiến trúc tổng thể tại Việt Nam
8 trang 140 0 0 -
Mô hình xử lý dữ liệu lớn trên điện toán đám mây theo mô hình ánh xạ - rút gọn
8 trang 139 0 0 -
Khảo sát thuật toán OSD sử dụng bộ mã RS và kỹ thuật điều chế QAM
5 trang 124 0 0 -
Chuyển đổi số: cơ sở và ứng dụng
18 trang 122 0 0