Danh mục

Nghiên cứu mô hình phát hiện chủ đề bình luận và phân tích cảm xúc người dùng điện thoại trên dữ liệu lớn

Số trang: 12      Loại file: pdf      Dung lượng: 1.06 MB      Lượt xem: 290      Lượt tải: 0    
10.10.2023

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài toán này được ứng dụng trong rất nhiều lĩnh vực khác nhau như giáo dục, thương mại điện tử, hay nhà hàng khách sạn. Nhưng hiện có ít nghiên cứu về phân tích cảm xúc theo chủ đề mà người dùng bình luận trên tập dữ liệu lớn.
Nội dung trích xuất từ tài liệu:
Nghiên cứu mô hình phát hiện chủ đề bình luận và phân tích cảm xúc người dùng điện thoại trên dữ liệu lớn 276 KỶ YẾU HỘI THẢO KHOA HỌC NGHIÊN CỨU MÔ HÌNH PHÁT HIỆN CHỦ ĐỀ BÌNH LUẬN VÀ PHÂN TÍCH CẢM XÚC NGƯỜI DÙNG ĐIỆN THOẠI TRÊN DỮ LIỆU LỚN Lê Ngọc Lợi*, Lê Thị Thanh Ngân*, Nguyễn Thái Anh*, Phan Hồ Viết Trường* TÓM TẮT Phân tích cảm xúc người dùng là bài toán không còn quá xa lạ trong lĩnh vực xử lý ngôn ngữ tự nhiên. Đầu vào là tập hợp các văn bản, và phân loại cảm xúc sẽ là kết quả của văn bản đầu vào. Bài toán này được ứng dụng trong rất nhiều lĩnh vực khác nhau như giáo dục, thương mại điện tử, hay nhà hàng khách sạn. Nhưng hiện có ít nghiên cứu về phân tích cảm xúc theo chủ đề mà người dùng bình luận trên tập dữ liệu lớn. Nghiên cứu này sử dụng mô hình phân lớp logistic regression để dự báo cảm xúc của người dùng với tập dữ liệu lên đến gần 8 triệu dòng bình luận đánh giá bằng tiếng Anh của trang bán hàng trên website bán hàng Amazon.com kết hợp với mô hình phát hiện chủ đề Latent Dirichlet Allocation, là một mô hình thống kê nhằm đưa ra các chủ đề ẩn trong tập dữ liệu văn bản. Từ khóa: Latent Dirichlet Allocation (LDA), semantic analysis, phân tích chủ đề, dữ liệu lớn 1. Giới thiệu Xử lý ngôn ngữ tự nhiên có hai nhóm: hiểu ngôn ngữ và tạo ra ngôn ngữ của con người (Su và cộng sự, 2020). Tuy nhiên, nhận dạng giọng nói, trả lời các câu hỏi như chat bot hay là dịch ngôn ngữ bằng google dịch đều sử dụng NLP. Hai lĩnh vực quan trọng của quá trình là phân tích cảm xúc con người và nhận biết cảm xúc con người (Fang & Zhan, 2015; Nandwani & Verma, 2021). Phát hiện cảm xúc con người là bài toán xác định những cảm xúc của con người như buồn, vui, lo lắng, tức giận, chán nản,… (Dzedzickis và cộng sự, 2020). Ngược lại, phân tích những cảm xúc con người là bài toán đánh giá dữ liệu nằm trong nhóm giá trị định nghĩa trước. Trong giáo dục, ban giám hiệu nhà trường có thể biết được cảm nhận của học sinh hay sinh viên khi tham gia lớp học đó và đánh giá phương pháp dạy đúng đắn của các thầy giáo, cô giáo. Thông qua việc đánh giá cảm xúc, nhà trường có thể biết học sinh, sinh viên có hứng thú với một môn học nào đó hay không (Barron- Estrada, 2019). Trong kinh doanh, các nhà cung cấp sử dụng mạng xã hội để quảng bá các sản phẩm của họ và thu hút phản hồi thông qua nhận xét của khách hàng. Từ nhận xét của khách hàng, doanh nghiệp nắm bắt được mức độ hài lòng của khách hàng, từ đó tăng doanh số bán hàng (Al Ajrawi và cộng sự, 2021). Khoa Công nghệ Thông tin, Trường Kỹ Thuật và Công Nghệ Văn Lang, Đại học Văn Lang, TPHCM * CHUYỂN ĐỔI SỐ: XU HƯỚNG VÀ ỨNG DỤNG CÔNG NGHỆ 277 Tuy vậy, các công trình về phân tích cảm xúc của người dùng sản phẩm theo chủ đề bình luận là rất ít. Nhu cầu thu thập và phân tích dữ liệu để rút ra những kiến ​​ thức từ nguồn bình luận sản phẩm rất cần thiết để từ đó cải tiến chất lượng sản phẩm. Với việc mua sắm trực tuyến ngày càng tăng, các website bán hàng cho phép doanh nghiệp thu thập những bình luận về sản phẩm, dịch vụ nhằm đưa ra những định hướng tốt hơn. Những năm gần đây, nhiều doanh nghiệp đã cung cấp công cụ để phân tích phản hồi của khách hàng trên các website từ đó đưa ra thang điểm và mức độ hài lòng của người dùng về sản phẩm, dịch vụ qua những câu văn và bình luận (Naseem và cộng sự, 2021). Tuy nhiên, thước đo này chưa đưa ra được vấn đề chi tiết của sản phẩm để doanh nghiệp kịp thời tìm những giải pháp, ra quyết định, hướng đi tốt hơn. Trong công trình này, chúng tôi sẽ sử dụng mô hình logistic regression phân tích cảm xúc của người dùng với tập dữ liệu lên đến gần 8 triệu dòng bình luận đánh giá bằng tiếng Anh của trang bán hàng trên website bán hàng Amazon.com kết hợp mô hình Latent Dirichlet Allocation (LDA), là kiểu mô hình thống kê và phát hiện các chủ đề tiềm ẩn ở trong tập dữ liệu. Qua đó có thể nhận biết những vấn đề mà khách hàng quan tâm giúp nhà quản trị đưa ra những khuyến nghị phù hợp để phát triển sản phẩm tốt hơn. 2. Tổng quan nghiên cứu 2.1. Tổng quan về các nghiên cứu trong và ngoài nước Phân tích cảm xúc của người dùng là một dạng xử lý ngôn ngữ tự nhiên thông qua việc sử dụng những giải thuật trong học máy để xây dựng những ứng dụng giúp cho nhà kinh doanh hiểu được mối quan tâm của khách hàng về sản phẩm đang dùng dễ dàng hơn. Tác giả Wankhade và cộng sự (2022) đã có một bài báo về một cuộc khảo sát về các phương pháp phân tích tình cảm, ứng dụng và thách thức. Tuy nhiên còn nhiều thách thức trong quy trình đánh giá và phân tích cảm xúc Những thách thức này tạo ra trở ngại để giải thích chính xác tình cảm và xác định cực tình cảm thích hợp. Phân tích cảm xúc xác định và trích xuất thông tin chủ quan từ văn bản bằng cách ứng dụng xử lý ngô ...

Tài liệu được xem nhiều:

Tài liệu cùng danh mục:

Tài liệu mới: