Một vài khía cạnh của phân tích dữ liệu lớn trong kinh tế
Số trang: 10
Loại file: pdf
Dung lượng: 0.00 B
Lượt xem: 225
Lượt tải: 0
Xem trước 1 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Bài viết "Một vài khía cạnh của phân tích dữ liệu lớn trong kinh tế" nhằm mục đích giới thiệu sự cần thiết của việc phân tích dữ liệu lớn trong bối cảnh cuộc cách mạng công nghiệp 4.0 đang diễn ra trên phạm vi toàn cầu nói chung và đối với nền kinh tế Việt Nam nói riêng.
Nội dung trích xuất từ tài liệu:
Một vài khía cạnh của phân tích dữ liệu lớn trong kinh tế MỘT VÀI KHÍA CẠNH CỦA PHÂN TÍCH DỮ LIỆU LỚN TRONG KINH TẾ ThS. NCS. Cao Tấn Bình1, ThS. Trần Bảo Duy2, TS. Trương Thị Thanh Phượng3 (1),(2),(3) Trường Đại học Quy Nhơn Tóm tắt: Ngày nay, cùng với sự phát triển nhanh chóng trong lĩnh vực khoa học và công nghệ, mạng lưới internet toàn cầu cũng không ngừng được cải thiện và phát triển. Sự tương tác, giao dịch của con người trên internet dưới nhiều hình thức và trong nhiều lĩnh vực khác nhau đã lưu lại ở đấy một lượng thông tin khổng lồ với tốc độ thay đổi nhanh và cấu trúc phức tạp, gọi là dữ liệu lớn. Để xử lý dữ liệu với tính chất như vậy, người ta cần tìm ra công cụ mới phù hợp hơn phương pháp thống kê cổ điển để phân tích và dự báo chính xác hiện tượng. Bài viết này nhằm mục đích giới thiệu sự cần thiết của việc phân tích dữ liệu lớn trong bối cảnh cuộc cách mạng công nghiệp 4.0 đang diễn ra trên phạm vi toàn cầu nói chung và đối với nền kinh tế Việt Nam nói riêng. Từ khóa: Dữ liệu lớn, cuộc cách mạng công nghiệp 4.0, kinh tế Việt Nam. 1. Giới thiệu Trên thế giới có nhiều định nghĩa về Dữ liệu lớn (Big data). Vào năm 2001, nhà phân tích Doug Laney của hãng META Group (bây giờ chính là công ty nghiên cứu Gartner4) đã nói rằng những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều: tăng về lượng (volume), tăng về tốc độ (velocity) và tăng về chủng loại (variety). _____________________ 4 Gartner là công ty tư vấn và nghiên cứu của Mỹ, cung cấp công nghệ thông tin cho IT và các nhà quản lý kinh doanh trên khắp thế giới. Sau đó, Gartner cùng với nhiều công ty và tổ chức khác trong lĩnh vực công nghệ thông tin tiếp tục sử dụng mô hình “3V” này để định nghĩa nên Dữ liệu lớn. Đến năm 2012, Gartner bổ sung thêm rằng Dữ liệu lớn ngoài ba tính chất trên thì còn phải cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào sự vật/sự việc và tối ưu hóa các quy trình làm việc. Do đó, vào năm 2014 Gartner đưa ra một khái niệm mới về Dữ liệu lớn. Dữ liệu lớn là mô hình “5V”. Cụ thể như sau: 71 Số lượng lưu trữ (Volume) Dữ liệu lớn là tập hợp dữ liệu có dung lượng lưu trữ vượt mức đảm đương của những ứng dụng và công cụ truyền thống. Kích cỡ của Dữ liệu lớn đang từng ngày tăng lên. Tốc độ xử lý (Velocity) Dung lượng gia tăng của dữ liệu rất nhanh và tốc độ xử lý đang tiến dần tới thời gian thực. Các ứng dụng phổ biến trên lĩnh vực Internet, Tài chính, Ngân hàng, Hàng không, Quân sự, Y tế-Sức khỏe ngày nay phần lớn Dữ liệu lớn được xử lý theo thời gian thực. Công nghệ xử lý dữ liệu lớn ngày một tiên tiến cho phép chúng ta xử lý tức thời trước khi chúng được lưu trữ vào cơ sở dữ liệu. Đa dạng chuẩn loại (Variety) Hình thức lưu trữ và chủng loại dữ liệu ngày một đa dạng hơn. Trước đây chúng ta hay nới đến dữ liệu có cấu trúc thì ngày nay hơn 80% dữ liệu thế giới được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, video, voice,…). Bản thân các công ty, doanh nghiệp cũng đang sở hữu Dữ liệu lớn của riêng mình, chẳng hạn như trang bán hàng trực tuyến eBay thì sử dụng hai trung tâm dữ liệu với dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình. Nhà bán lẻ trực tuyến Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày cũng như những yêu cầu từ khoảng nửa triệu đối tác bán hàng. Amazon sử dụng một hệ thống Linux và vào khoảng năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng là 7,8TB, 18,5TB và 24,7TB. Tương tự, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng tải lên, YouTube hay Google thì phải lưu lại hết các lượt truy vấn và video của người dùng cùng nhiều loại thông tin khác có liên quan. Độ chính xác (Veracity) Một trong những tính chất phức tạp nhất của Dữ liệu lớn là độ chính xác của dữ liệu. Với xu hướng truyền thống xã hội và mạng lưới xã hội ngày nay, và sự gia tăng mạnh mẽ tính tương tác và chia sẽ của người dùng các thiết bị di động làm cho bức tranh xác định về độ tin cậy và chính xác của dữ liệu ngày một khó khăn hơn. Bài toán phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính chất quan trọng của Dữ liệu lớn. Giá trị thông tin (Value) Giá trị thông tin là tính chất quan trọng nhất của xu hướng công nghệ dữ liệu lớn. Ở đây doanh nghiệp phải hoạch định được những giá trị thông tin hữu ích cho vấn đề, bài toán hoặc mô hình hoạt động kinh doanh của mình. Có thể nói việc đầu tiên là phải xác định được giá trị thông tin (value) thì mới nên bắt tay vào Dữ liệu lớn. Việt Nam đang càng ngày phát triển và hội nhập với xu hướng công nghệ thế giới. Với hơn 30 triệu người dùng Internet trên các thiết bị cố định và hơn 15 triệu người dùng Internet trên các thiết bị di động làm cho Việt Nam đang đứng trước một cơ hội vô cùng lớn về khai thác Dữ liệu lớn. Sẽ có những doanh nghiệp Việt Nam khai thác thành công Dữ liệu lớn với doanh số hàng trăm triệu USD trong vòng 5 năm tới. Các dịch vụ kết nối OTT (Over- the-top) và truyền thông xã hội đóng góp hơn 80% phương thức giao tiếp trực tuyến, ghi hình trực tuyến. Điều này góp phần đẩy mạnh xu hướng truyền thông số đa phương tiện, đa màn hình (PC, smartphone, tablet, smart TV) sẽ bùng nổ với độ phủ hơn 50% dân số Việt Nam. Việt Nam là một kho “vàng” dữ liệu vô cùng lớn cho việc ứng dụng Dữ liệu lớn. Giá trị tiềm năng của Dữ liệu lớn chỉ được thể hiện khi nó được dùng trong quá trình ra quyết định. Để có thể đưa ra quyết định dựa trên bằng chứng, các tổ chức cần có quy trình hiệu quả để chuyển đổi một khối lượng lớn các dữ liệu có tính thay đổi nhanh và đa dạng ...
Nội dung trích xuất từ tài liệu:
Một vài khía cạnh của phân tích dữ liệu lớn trong kinh tế MỘT VÀI KHÍA CẠNH CỦA PHÂN TÍCH DỮ LIỆU LỚN TRONG KINH TẾ ThS. NCS. Cao Tấn Bình1, ThS. Trần Bảo Duy2, TS. Trương Thị Thanh Phượng3 (1),(2),(3) Trường Đại học Quy Nhơn Tóm tắt: Ngày nay, cùng với sự phát triển nhanh chóng trong lĩnh vực khoa học và công nghệ, mạng lưới internet toàn cầu cũng không ngừng được cải thiện và phát triển. Sự tương tác, giao dịch của con người trên internet dưới nhiều hình thức và trong nhiều lĩnh vực khác nhau đã lưu lại ở đấy một lượng thông tin khổng lồ với tốc độ thay đổi nhanh và cấu trúc phức tạp, gọi là dữ liệu lớn. Để xử lý dữ liệu với tính chất như vậy, người ta cần tìm ra công cụ mới phù hợp hơn phương pháp thống kê cổ điển để phân tích và dự báo chính xác hiện tượng. Bài viết này nhằm mục đích giới thiệu sự cần thiết của việc phân tích dữ liệu lớn trong bối cảnh cuộc cách mạng công nghiệp 4.0 đang diễn ra trên phạm vi toàn cầu nói chung và đối với nền kinh tế Việt Nam nói riêng. Từ khóa: Dữ liệu lớn, cuộc cách mạng công nghiệp 4.0, kinh tế Việt Nam. 1. Giới thiệu Trên thế giới có nhiều định nghĩa về Dữ liệu lớn (Big data). Vào năm 2001, nhà phân tích Doug Laney của hãng META Group (bây giờ chính là công ty nghiên cứu Gartner4) đã nói rằng những thách thức và cơ hội nằm trong việc tăng trưởng dữ liệu có thể được mô tả bằng ba chiều: tăng về lượng (volume), tăng về tốc độ (velocity) và tăng về chủng loại (variety). _____________________ 4 Gartner là công ty tư vấn và nghiên cứu của Mỹ, cung cấp công nghệ thông tin cho IT và các nhà quản lý kinh doanh trên khắp thế giới. Sau đó, Gartner cùng với nhiều công ty và tổ chức khác trong lĩnh vực công nghệ thông tin tiếp tục sử dụng mô hình “3V” này để định nghĩa nên Dữ liệu lớn. Đến năm 2012, Gartner bổ sung thêm rằng Dữ liệu lớn ngoài ba tính chất trên thì còn phải cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào sự vật/sự việc và tối ưu hóa các quy trình làm việc. Do đó, vào năm 2014 Gartner đưa ra một khái niệm mới về Dữ liệu lớn. Dữ liệu lớn là mô hình “5V”. Cụ thể như sau: 71 Số lượng lưu trữ (Volume) Dữ liệu lớn là tập hợp dữ liệu có dung lượng lưu trữ vượt mức đảm đương của những ứng dụng và công cụ truyền thống. Kích cỡ của Dữ liệu lớn đang từng ngày tăng lên. Tốc độ xử lý (Velocity) Dung lượng gia tăng của dữ liệu rất nhanh và tốc độ xử lý đang tiến dần tới thời gian thực. Các ứng dụng phổ biến trên lĩnh vực Internet, Tài chính, Ngân hàng, Hàng không, Quân sự, Y tế-Sức khỏe ngày nay phần lớn Dữ liệu lớn được xử lý theo thời gian thực. Công nghệ xử lý dữ liệu lớn ngày một tiên tiến cho phép chúng ta xử lý tức thời trước khi chúng được lưu trữ vào cơ sở dữ liệu. Đa dạng chuẩn loại (Variety) Hình thức lưu trữ và chủng loại dữ liệu ngày một đa dạng hơn. Trước đây chúng ta hay nới đến dữ liệu có cấu trúc thì ngày nay hơn 80% dữ liệu thế giới được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, video, voice,…). Bản thân các công ty, doanh nghiệp cũng đang sở hữu Dữ liệu lớn của riêng mình, chẳng hạn như trang bán hàng trực tuyến eBay thì sử dụng hai trung tâm dữ liệu với dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình. Nhà bán lẻ trực tuyến Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày cũng như những yêu cầu từ khoảng nửa triệu đối tác bán hàng. Amazon sử dụng một hệ thống Linux và vào khoảng năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn nhất thế giới với dung lượng là 7,8TB, 18,5TB và 24,7TB. Tương tự, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng tải lên, YouTube hay Google thì phải lưu lại hết các lượt truy vấn và video của người dùng cùng nhiều loại thông tin khác có liên quan. Độ chính xác (Veracity) Một trong những tính chất phức tạp nhất của Dữ liệu lớn là độ chính xác của dữ liệu. Với xu hướng truyền thống xã hội và mạng lưới xã hội ngày nay, và sự gia tăng mạnh mẽ tính tương tác và chia sẽ của người dùng các thiết bị di động làm cho bức tranh xác định về độ tin cậy và chính xác của dữ liệu ngày một khó khăn hơn. Bài toán phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính chất quan trọng của Dữ liệu lớn. Giá trị thông tin (Value) Giá trị thông tin là tính chất quan trọng nhất của xu hướng công nghệ dữ liệu lớn. Ở đây doanh nghiệp phải hoạch định được những giá trị thông tin hữu ích cho vấn đề, bài toán hoặc mô hình hoạt động kinh doanh của mình. Có thể nói việc đầu tiên là phải xác định được giá trị thông tin (value) thì mới nên bắt tay vào Dữ liệu lớn. Việt Nam đang càng ngày phát triển và hội nhập với xu hướng công nghệ thế giới. Với hơn 30 triệu người dùng Internet trên các thiết bị cố định và hơn 15 triệu người dùng Internet trên các thiết bị di động làm cho Việt Nam đang đứng trước một cơ hội vô cùng lớn về khai thác Dữ liệu lớn. Sẽ có những doanh nghiệp Việt Nam khai thác thành công Dữ liệu lớn với doanh số hàng trăm triệu USD trong vòng 5 năm tới. Các dịch vụ kết nối OTT (Over- the-top) và truyền thông xã hội đóng góp hơn 80% phương thức giao tiếp trực tuyến, ghi hình trực tuyến. Điều này góp phần đẩy mạnh xu hướng truyền thông số đa phương tiện, đa màn hình (PC, smartphone, tablet, smart TV) sẽ bùng nổ với độ phủ hơn 50% dân số Việt Nam. Việt Nam là một kho “vàng” dữ liệu vô cùng lớn cho việc ứng dụng Dữ liệu lớn. Giá trị tiềm năng của Dữ liệu lớn chỉ được thể hiện khi nó được dùng trong quá trình ra quyết định. Để có thể đưa ra quyết định dựa trên bằng chứng, các tổ chức cần có quy trình hiệu quả để chuyển đổi một khối lượng lớn các dữ liệu có tính thay đổi nhanh và đa dạng ...
Tìm kiếm theo từ khóa liên quan:
Dữ liệu lớn Cuộc cách mạng công nghiệp 4.0 Kinh tế Việt Nam Mạng lưới internet toàn cầu Phân tích dữ liệu lớn Ngành tài chính và bảo hiểmGợi ý tài liệu liên quan:
-
38 trang 252 0 0
-
Hai mô hình phát triển và sự đổi mới kinh tế thông qua thực tiễn phát triển nông nghiệp ở Việt Nam
348 trang 217 0 0 -
Tiểu luận: Chính sách đối ngoại của Việt Nam – ASEAN trước và sau đổi mới
18 trang 206 0 0 -
46 trang 204 0 0
-
Giáo trình Lịch sử các học thuyết kinh tế - PGS.TS. Trần Đình Trọng
337 trang 189 1 0 -
19 trang 181 0 0
-
Luận văn: Tìm hiểu thực trạng và xây dựng chiến lược Marketing Mix cho sản phẩm nước xả vải mới
30 trang 179 0 0 -
Tiểu luận Xây dựng nền kinh tế thị trường định hướng xã hội chủ nghĩa
20 trang 155 0 0 -
Lợi ích và thách thức ứng dụng phân tích dữ liệu và dữ liệu lớn trong kiểm toán báo cáo tài chính
8 trang 129 0 0 -
Hiệu quả đầu tư và dư địa cho các chính sách kích thích kinh tế của Việt Nam hiện nay
10 trang 125 0 0