Lập trình R trong phân tích dữ liệu
Thông tin tài liệu:
Nội dung trích xuất từ tài liệu:
Lập trình R trong phân tích dữ liệu LẬP TRÌNH R TRONG PHÂN TÍCH DỮ LIỆU Nguyễn Thanh Trường Khoa Công nghệ Thông tin. Trường Đại học Tài chính - Marketing Email: nt.truong@ufm.edu.vnTóm tắt: : Ngành Khoa học dữ liệu là lĩnh vực nghiên cứu về việc quản trị và phân tích dữ liệu, từ đótìm ra cách hiểu biết, các tri thức hành động, các quyết định dẫn dắt hành động. Ngành Khoa học dữliệu là ngành gồm 3 phần chính: Tạo ra và quản trị dữ liệu, phân tích dữ liệu, chuyển kết quả phân tíchđánh giá. Phân tích dữ liệu (data analytics) là một quá trình kiểm tra, làm sạch, chuyển đổi và mô hìnhhóa dữ liệu với mục tiêu khám phá thông tin hữu ích, đưa ra kết luận và hỗ trợ việc ra quyết định. Phântích dữ liệu có nhiều khía cạnh và cách tiếp cận, bao gồm các kỹ thuật đa dạng dưới nhiều tên gọi khácnhau và được sử dụng trong các lĩnh vực kinh doanh, khoa học và khoa học xã hội khác nhau. Trongbài này, tác giả sẽ tìm hiểu cách thức hoạt động và lập trình trên ngôn ngữ R để tiếp cận cách thao táctrên tập dữ liệu. Từ khóa: Data analytics, data science, programming r, phân tích dữ liệu, khoa học dữ liệu, lậptrình R1. GIỚI THIỆU Các nhà khoa học dữ liệu thường đóng vai trò là nhà tư vấn được thuê bởi các côngty nơi họ tham gia vào các quá trình ra quyết định khác nhau và tạo ra chiến lược. Nói cáchkhác, nhà khoa học dữ liệu sử dụng những hiểu biết sâu sắc có ý nghĩa từ dữ liệu để hỗ trợcác công ty đưa ra các quyết định kinh doanh thông minh hơn. Hiện nay tại Việt Nam đã có nhiều trường đạihọc đào tạo ngành khoa học dữ liệu như: Đại HọcCông Nghệ Thông Tin – Đại Học Quốc Gia TPHCM,Đại Học Khoa Học Tự Nhiên – Đại Học Quốc GiaTPHCM, Đại Học Kinh Tế Quốc Dân, Đại Học KinhTế TPHCM, Đại Học Kinh Tế -Tài Chính TPHCM,Đại học Công Nghệ TPHCM, Đại Học Dân Lập VănLang,… cho thấy xu hướng ngày càng cao của ngànhkhoa học dữ liệu. Trong xu hướng đó, chúng ta nên tìm hiểu cách thức hoạt động và cách làm việc củamột vài công cụ trong phân tích dữ liệu. Đối với người làm ngành công nghệ thông tin thì 223đây cũng là một ngành mới, vì nó là sự giao thoa của 3 lĩnh vực: Khoa học máy tính –Thống kê – Chuyên môn ngành. Trong đó phân tích dữ liệu đóng vai trò quan trọng giúp các nhà quản lý, kinh doanhthống kê, dự báo được các số liệu nhằm hoạch định kê hoạch giúp cho công tác quản lý vàkinh doanh phát triển hơn nhất là trong cuộc cách mạng công nghiệp lần thứ 4, ai nắm bắtđược thông tin, dữ liệu và dự báo có thể giúp rất nhiều cho hiện tại và tương lai..2. SƠ LƯỢC CÁC CÔNG CỤ PHÂN TÍCH DỮ LIỆU Các công cụ phân tích dữ liệu có thể chia làm 2 nhóm: - Nhóm công cụ thao tác trên giao diện là chính, nhóm này dành cho người dùng ít hoặc không thuộc nhóm ngành liên quan đến công nghệ thông tin như: các nhà kinh tế, các nhà thống kê, … - Nhóm khác là các ngôn ngữ lập trình để thao tác dữ liệu, nhóm này đòi hỏi người dùng có chút ít kiến thức về lập trình như các nhà toán học, công nghệ thông tin,…2.1. Các công cụ phân tích dữ liệu2.1.1. Tableau Public Tableau Public là một phần mềm miễn phí kết nối bất kỳ nguồn dữ liệu nào có thể là Kho dữ liệu của công ty, Microsoft Excel hoặc dữ liệu dựa trên web và tạo trực quan hóa dữ liệu, bản đồ, bảng điều khiển,v.v. với các bản cập nhật theo thời gian thực hiển thị trên web. Chúng cũng có thể đượcchia sẻ thông qua phương tiện truyền thông xã hội hoặc với khách hàng. Nó cho phép truycập để tải xuống tập tin ở các định dạng khác nhau. Nếu muốn thấy sức mạnh của hoạtcảnh, thì chúng ta phải có nguồn dữ liệu rất tốt. Khả năng Dữ liệu lớn của Tableau khiếnchúng trở nên quan trọng và người dùng có thể phân tích và trực quan hóa dữ liệu tốt hơnbất kỳ phần mềm trực quan hóa dữ liệu nào khác trên thị trường.2.1.2. SAS SAS (trước đây là “Statistical Analysis System - Hệ thống Phân tích Thống kê) là một bộ phần mềm thống kê được phát triển bởi Viện SASđể quản lý dữ liệu, phân tích nâng cao, phân tích đa biến, kinh doanh tình báo, điều tra tộiphạm, và phân tích dự đoán. 224 Tính đến năm 2011, bộ sản phẩm lớn nhất của SAS là dòng sản phẩm dành cho kháchhàng thông minh. Nhiều mô-đun SAS dành cho web, mạng xã hội và phân tích tiếp thị cóthể được sử dụng để lập hồ sơ khách hàng và khách hàng tiềm năng, dự đoán hành vi củahọ cũng như quản lý và tối ưu hóa thông tin liên lạc. SAS cũng cung cấp khung gian lậnSAS. Chức năng chính của khung là giám sát các giao dịch trên các ứng dụng, mạng và đốitác khác nhau và sử dụng phân tích để xác định các điểm bất thường có ...
Tìm kiếm theo từ khóa liên quan:
Kỷ yếu hội thảo khoa học Hội thảo Khoa học Gắn kết đào tạo với doanh nghiệp Lập trình R Phân tích dữ liệu Khoa học dữ liệu Quyết định kinh doanh thông minhGợi ý tài liệu liên quan:
-
Yếu tố nhận diện người thứ ba ngay tình trong giao dịch dân sự
11 trang 319 0 0 -
197 trang 275 0 0
-
Cách tính nhanh giá trị riêng của ma trận vuông cấp 2 và cấp 3
4 trang 274 0 0 -
Một số vấn đề về chuyển đổi số và ứng dụng trong doanh nghiệp
11 trang 262 0 0 -
Quản lý dữ liệu thông tin người hưởng bảo hiểm xã hội
6 trang 224 0 0 -
Thuật toán khai phá tập mục thường xuyên trong cơ sở dữ liệu lớn thông qua mẫu đại diện
11 trang 223 0 0 -
Phương pháp nhận diện biển số xe ô tô sử dụng học máy và thư viện OpenCV
6 trang 210 0 0 -
11 trang 205 0 0
-
Nghi thức chào hỏi trong văn hóa giao tiếp của người Nhật
13 trang 162 0 0 -
Một số ứng dụng của xác suất thống kê
5 trang 147 0 0 -
Sản xuất và chế biến thực phẩm sạch - Kỷ yếu hội thảo khoa học: Phần 2
153 trang 133 0 0 -
Lợi ích và thách thức ứng dụng phân tích dữ liệu và dữ liệu lớn trong kiểm toán báo cáo tài chính
8 trang 129 0 0 -
Mặt đường bê tông xi măng trên nền đàn hồi: Ứng xử do chênh lệch nhiệt độ và tải trọng xe đồng thời
11 trang 104 0 0 -
Quản trị dữ liệu lớn trong hệ thống IoT với công nghệ điện toán đám mây, sương mù, biên
14 trang 102 0 0 -
Phát triển Fintech ứng dụng Big data và AI cho ngân hàng Việt Nam
20 trang 101 0 0 -
Mô phỏng tính toán sức kháng của dầm bê tông cốt thép có xét đến ăn mòn cốt thép
7 trang 100 0 0 -
Tính đối thoại trong một số truyện viết cho thiếu nhi của Võ Diệu Thanh
11 trang 100 0 0 -
Đánh giá công tác đấu giá quyền sử dụng đất trên địa bàn thị xã Hương Trà, tỉnh Thừa Thiên Huế
12 trang 99 0 0 -
Mô hình Dea Metafrontier và việc so sánh hiệu quả theo vùng của các trường đại học của Việt Nam
6 trang 99 0 0 -
8 trang 96 0 0