Danh mục

Tìm hiểu các công cụ phân tích dữ liệu

Số trang: 10      Loại file: pdf      Dung lượng: 374.40 KB      Lượt xem: 38      Lượt tải: 0    
tailieu_vip

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết "Tìm hiểu các công cụ phân tích dữ liệu" giúp bạn đọc tìm hiểu sơ lược qua các công cụ phân tích dữ liệu tập trung vào 2 khía cạnh: Các công cụ (Có thể là thương mại) dành cho các doanh nghiệp hoặc người dùng không cần kiến thức lập trình và Ngôn ngữ lập trình dành cho người dùng có chút ít kiến thức về lập trình có thể phát huy hiệu quả phân tích dữ liệu. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Tìm hiểu các công cụ phân tích dữ liệu TÌM HIỂU CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU Nguyễn Thanh Trường Khoa Công nghệ Thông tin. Trường Đại học Tài chính - Marketing Email: nt.truong@ufm.edu.vn Tóm tắt: Phân tích dữ liệu (data analytics) là một quá trình kiểm tra, làm sạch, chuyển đổi và mô hình hóa dữ liệu với mục tiêu khám phá thông tin hữu ích, đưa ra kết luận và hỗ trợ việc ra quyết định. Phân tích dữ liệu có nhiều khía cạnh và cách tiếp cận, bao gồm các kỹ thuật đa dạng dưới nhiều tên gọi khác nhau và được sử dụng trong các lĩnh vực kinh doanh, khoa học và khoa học xã hội khác nhau. Trong thế giới kinh doanh ngày nay, phân tích dữ liệu đóng vai trò giúp đưa ra các quyết định khoa học hơn và giúp doanh nghiệp hoạt động hiệu quả hơn. Trong bài này, chúng ta cùng tìm hiểu sơ lược qua các công cụ phân tích dữ liệu tập trung vào 2 khía cạnh: Các công cụ (Có thể là thương mại) dành cho các doanh nghiệp hoặc người dùng không cần kiến thức lập trình và Ngôn ngữ lập trình dành cho người dùng có chút ít kiến thức về lập trình có thể phát huy hiệu quả phân tích dữ liệu. Từ khóa: Phân tích dữ liệu, data analytics 1. GIỚI THIỆU Nhu cầu ngày càng tăng và tầm quan trọng của phân tích dữ liệu trên thị trường đã tạo ra nhiều cơ hội trên toàn thế giới. Việc chọn lọc các công cụ phân tích dữ liệu hàng đầu gặp khó khăn vì các công cụ nguồn mở phổ biến hơn, thân thiện với người dùng và hướng đến hiệu suất hơn so với phiên bản trả phí. Có nhiều công cụ nguồn mở không yêu cầu bất kỳ mã hóa nào và quản lý để mang lại kết quả tốt hơn so với các phiên bản trả phí, như Lập trình R trong khai thác dữ liệu và Tableau public, Python trong trực quan hóa dữ liệu. Sau đây chúng ta cùng điểm qua một số công cụ phân tích dữ liệu hàng đầu, cả mã nguồn mở và phiên bản trả phí, dựa trên mức độ phổ biến, khả năng học hỏi và hiệu suất của chúng. 2. CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU 2.1. Tableau Public Tableau Public là một phần mềm miễn phí kết nối bất kỳ nguồn dữ liệu nào có thể là Kho dữ liệu của công ty, Microsoft Excel hoặc dữ liệu dựa trên web và tạo trực quan hóa dữ liệu, bản đồ, bảng điều khiển, v.v. với các bản cập nhật theo thời gian thực hiển thị trên web. Chúng cũng có thể được chia sẻ thông qua phương 186 tiện truyền thông xã hội hoặc với khách hàng. Nó cho phép truy cập để tải xuống tập tin ở các định dạng khác nhau. Nếu muốn thấy sức mạnh của hoạt cảnh, thì chúng ta phải có nguồn dữ liệu rất tốt. Khả năng Dữ liệu lớn của Tableau khiến chúng trở nên quan trọng và người dùng có thể phân tích và trực quan hóa dữ liệu tốt hơn bất kỳ phần mềm trực quan hóa dữ liệu nào khác trên thị trường. Các sản phẩm Tableau truy vấn cơ sở dữ liệu quan hệ, phân tích xử lý trực tuyến khối, cơ sở dữ liệu đám mây và bảng tính để tạo trực quan hóa dữ liệu kiểu đồ thị. Phần mềm cũng có thể trích xuất, lưu trữ và truy xuất dữ liệu từ một công cụ dữ liệu trong bộ nhớ. Các sản phẩm củaTableau gồm: - Tableau Desktop - Tableau Server - Tableau Online - Tableau Prep Builder (Released in 2018) - Tableau Vizable (Consumer data visualization mobile app released in 2015) - Tableau Public (free to use) - Tableau Reader (free to use) - Tableau Mobile - Tableau CRM Tableau có chức năng lập bản đồ, và có thể vẽ các tọa độ kinh độ và vĩ độ cũng như kết nối với các tập tin không gian như Esri Shapefiles, KML (Keyhole Markup Language) và GeoJSON để hiển thị địa lý tùy chỉnh. Mã hóa địa lý tích hợp cho phép các địa điểm hành chính (quốc gia, tiểu bang / tỉnh, quận / huyện), mã bưu chính, Quận Quốc hội Hoa Kỳ, CBSA / MSA của Hoa Kỳ, Mã vùng, Sân bay và các khu vực thống kê của Liên minh Châu Âu (mã NUTS) đến được ánh xạ tự động. Các khu vực địa lý có thể được nhóm lại để tạo lãnh thổ tùy chỉnh hoặc mã hóa địa lý tùy chỉnh được sử dụng để mở rộng vai trò địa lý hiện có trong sản phẩm. 2.2. SAS SAS (trước đây là “Statistical Analysis System' - Hệ thống Phân tích Thống kê) là một bộ phần mềm thống kê được phát triển 187 bởi Viện SAS để quản lý dữ liệu, phân tích nâng cao, phân tích đa biến, kinh doanh tình báo, điều tra tội phạm, và phân tích dự đoán. SAS được phát triển tại Đại học Bang North Carolina từ năm 1966 cho đến năm 1976, khi Viện SAS được hợp nhất. SAS đã được phát triển thêm vào những năm 1980 và 1990 với việc bổ sung các thủ tục thống kê mới, các thành phần mới được bổ sung. Giao diện trỏ và nhấp đã được thêm vào phiên bản 9 vào năm 2004. Một sản phẩm phân tích truyền thông xã hội đã được thêm vào năm 2010. Tính đến năm 2011, bộ sản phẩm lớn nhất của SAS là dòng sản phẩm dành cho khách hàng thông minh. Nhiều mô-đun SAS dành cho web, mạng xã hội và phân tích tiếp thị có thể được sử dụng để lập hồ sơ khách hàng và khách hàng tiềm năng, dự đoán hành vi của họ cũng như quản lý và tối ưu hóa thông tin liên lạc. SAS cũng cung cấp Khung gian lận SAS. Chức năng chính của khung là giám sát các giao dịch trên các ứng dụng, mạng và đối tác khác nhau và sử dụng phân tích để xác định các điểm bất thường có dấu hiệu gian lận. SAS Enterprise GRC (Quản trị, Rủi ro và Tuân thủ) cung cấp mô hình rủi ro, phân tích kịch bản và các chức năng khác để quản lý và hình dung rủi ro, tuân thủ và các chính sách của công ty. Ngoài ra còn có bộ sản phẩm Quản lý rủi ro doanh nghiệp SAS được thiết kế chủ yếu cho các ngân hàng và tổ chức dịch vụ tài chính. 2.3. Apache Spark Apache Spark là một công cụ phân tích hợp nhất mã nguồn mở để xử lý dữ liệu quy mô lớn. Spark cung ...

Tài liệu được xem nhiều:

Tài liệu cùng danh mục:

Tài liệu mới: