Mục tiêu nghiên cứu của đề tài "Phân tích mạng các bài báo ChatGPT" nhằm phân tích wordcloud dựa trên tóm tắt của các bài báo để xác định các từ khóa quan trọng trong các bài báo đó; Xây dựng và phân tích mạng từ dữ liệu các bài báo để xác định các tác giả có nhiều ảnh hưởng hoặc ít ảnh hưởng trong mạng.
Nội dung trích xuất từ tài liệu:
Báo cáo học phần Mạng xã hội: Phân tích mạng các bài báo ChatGPT MỤC LỤCMỤC LỤC ............................................................................................................... iDANH MỤC HÌNH ................................................................................................ iiDANH MỤC BẢNG ............................................................................................... iiCHƯƠNG 1. GIỚI THIỆU .................................................................................. 3 1.1. Lý do chọn đề tài ...................................................................................... 3 1.2. Mục tiêu nghiên cứu của đồ án ................................................................. 3CHƯƠNG 2. THU THẬP VÀ XỬ LÝ DỮ LIỆU ............................................... 4 2.1. Thu thập dữ liệu ........................................................................................ 4 2.2. Tiền xử lý dữ liệu ...................................................................................... 5 2.3. Phân tích Wordcloud của tóm tắt .............................................................. 7CHƯƠNG 3. XÂY DỰNG VÀ PHÂN TÍCH MẠNG ........................................ 9 3.1. Cấu trúc đồ thị........................................................................................... 9 3.2. Các tiêu chí đánh giá mạng ..................................................................... 10 3.3. Phân tích mạng........................................................................................ 10CHƯƠNG 4. KẾT LUẬN ................................................................................... 16 4.1. Kết quả đạt được ..................................................................................... 16 4.2. Hướng phát triển ..................................................................................... 16TÀI LIỆU THAM KHẢO ................................................................................... 17 i DANH MỤC HÌNHHình 1. Nội dung mẫu dữ liệu dùng để thực nghiệm ............................................... 5Hình 2. Dữ liệu các bài báo bị loại ........................................................................... 6Hình 3. Thống kê số bài báo bị loại và đạt yêu cầu ................................................. 6Hình 4. Dữ liệu dùng để tạo đồ thị ........................................................................... 7Hình 5. Danh sách stopword được sử dụng ............................................................. 7Hình 6. Wordcloud của tất cả các tóm tắt................................................................. 8Hình 7. Wordcloud của 20 từ nổi bật ....................................................................... 8Hình 7. Giao diện làm việc của Gephi ..................................................................... 9Hình 8. Minh họa dữ liệu đỉnh ................................................................................. 9Hình 9. Minh họa dữ liệu cạnh ............................................................................... 10Hình 10. Cấu trúc mạng tổng thể ........................................................................... 11Hình 11. Sự phân bố bậc của nút............................................................................ 12Hình 12. Độ trung tâm của nút theo độ trung tâm ở giữa ...................................... 13Hình 13. Độ trung tâm của nút dựa trên sự gần gũi ............................................... 13Hình 14. Độ trung tâm dựa trên sự gần gũi từ 0 đến 0.5........................................ 14Hình 15. Các cộng đồng trong mạng ..................................................................... 14Hình 16. Top 6 cộng đồng trong mạng................................................................... 15 DANH MỤC BẢNGBảng 1. Thống kê số tác giả của bài báo .................................................................. 7Bảng 2. Các số liệu tổng thể của mạng .................................................................. 11Bảng 3. Các số liệu về bậc trong mạng .................................................................. 12 ii CHƯƠNG 1. GIỚI THIỆU 1.1. Lý do chọn đề tài Ngày nay, với sự bùng nổ của công nghệ thông tin, đặc biệt là trí thông minh nhântạo (Artificial Intelligence - AI), các công cụ hỗ trợ công việc hằng ngày cho con người dựatrên AI ra đời ngày càng nhiều và phát triển nhanh chóng. Trong đó, ChatGPT (ChatGenerative Pre-training Transformer) được đánh là công cụ phổ biến nhất và là “chatbot trítuệ nhân tạo tốt nhất” [1]. ChatGPT là một chatbot được công ty OpenAI phát triển và ramắt lần đầu tiên vào tháng 11 năm 2022. ChatGPT là một ứng dụng AI được phát triển từmô hình GPT-3.5, một mô hình ngôn ngữ lớn của OpenAI được huấn luyện đồng thời bằngcả hai kỹ thuật học có giám sát (supervised learning) lẫn học tăng cường (reinforcement).Sự phối hợp của hai kỹ thuật này nhằm đưa ra câu trả lời giống như một cuộc trò chuyệnvới người thật. Theo số liệu của công ty phân tích Similarweb Ltd., hiện nay có khoảng 1.8tỷ lượt truy cập vào trang web chat.openai.com hàng tháng [2]. Với khả năng xử lý ngônngữ tự nhiên vượt trội và kho dữ liệu huấn luyện khổng lồ, ChatGPT có thể hỗ trợ tốt tronggiáo dục, giúp tìm kiếm thông tin, xử lý và giải quyết vấn đề một cách hiệu quả. Theo Chenvà cộng sự [3], ChatGPT có khả năng tự động tạo ra câu trả lời và sinh văn bản, phục vụcho nhiều mục đích như trả lời câu hỏi, dịch thuật và các ứng dụng khác. Ngoài ra, ChatGPTcũng có khả ...