Danh mục

Ứng dụng khai phá văn bản để phân tích dữ liệu truyền miệng trực tuyến trong du lịch

Số trang: 12      Loại file: pdf      Dung lượng: 441.49 KB      Lượt xem: 8      Lượt tải: 0    
Thư viện của tui

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Mục tiêu của nghiên cứu này dùng phương pháp phân tích sắc thái cảm xúc từ tập dữ liệu truyền miệng trực truyến từ năm 2009 đến 2023, bằng cách sử dụng các thu viện Pyhon như Spacy để rút trích các khía cạnh, TextBlob để xác định sắc thái tiêu cực hay tích cực, và matplotlib để hiển thị dữ liệu dưới dạng biểu đồ.
Nội dung trích xuất từ tài liệu:
Ứng dụng khai phá văn bản để phân tích dữ liệu truyền miệng trực tuyến trong du lịch ỨNG DỤNG KHAI PHÁ VĂN BẢN ĐỂ PHÂN TÍCH DỮ LIỆU TRUYỀN MIỆNG TRỰC TUYẾN TRONG DU LỊCH Nguyễn Cao Hoài Phương1, Hồ Như Ngọc2 1. Ban Đề Án Chuyển Đổi Số, Trường Đại học Thủ Dầu Một 2. Khoa Công Nghiệp Văn Hóa, Trường Đại học Thủ Dầu MộtTÓM TẮT Nghiên cứu về sự hài lòng của khách hàng là một phần quan trọng để giúp các cơ sở chothuê dịch vụ lưu trú cải thiện và nâng chất lượng dịch vụ của họ. Tuy nhiên, các nghiên cứuquan tâm đến nguồn dữ liệu truyền miệng trực tuyến từ các trang web cung cấp dịch vụ lưu trúthường thu thập dữ liệu trong vài tháng, hoặc vài năm. Chính vì thế, mục tiêu của nghiên cứunày dùng phương pháp phân tích sắc thái cảm xúc từ tập dữ liệu truyền miệng trực truyến từnăm 2009 đến 2023, bằng cách sử dụng các thu viện Pyhon như Spacy để rút trích các khíacạnh, TextBlob để xác định sắc thái tiêu cực hay tích cực, và matplotlib để hiển thị dữ liệu dướidạng biểu đồ. Đầu tiên, thu thập dữ liệu và tiền xử lý chúng. Sau đó, chúng tôi tiến hành rúttrích các khía cạnh, xác định khía cạnh đó đang được nhận xét tiêu cực hay tích cực, và vẽ biểuđồ. Cuối cùng, dựa trên các biểu đồ chúng tôi nhận thấy rằng mặc dù các cở sở lưu trú chămsóc khách hàng khá tốt với 95% đáng giá tích cực, tuy nhiên 5% đánh giá tiêu cực tập trungvào các khía cạnh quan trọng như “hotel”, “room”, “staff”, “service”, “food”, xu thế du lịchcủa du khách tăng theo hàng năm, ngoại trừ thời gian bùng phát dịch Covid-19 cần phải rútkinh nghiệm. Đồng thời, nghiên cứu cũng có một số khuyến nghị các khía cạnh được đánh giátích cực và tiêu cực dựa trên đám mây từ vựng. Từ khóa: khai phá dữ liệu văn bản, phân tích sắc thái cảm xúc, truyền miệng trực tuyến.1. GIỚI THIỆU Những năm gần đây, có nhiều nghiên cứu liên quan đến du lịch đặt biệt là xem xét đếntruyền miệng điện tử (Balan & Mathew, 2015), truyền miệng trực tuyến (Alam, Ryu, & Lee,2016) (Wang, Lu, & Zhai, 2011) (Hall, et al., 2022) (Guttentag, 2019). Hay nội dung của đánhgiá của người dùng trên các trang đặt phòng trực tuyến được xem là tuyền miệng trực tuyến(Andreu, Bigne, Amaro, & Palomo, 2020) (Cheng & Foley, 2019) (Dolnicar & Zare, 2020)(Quattrone, Proserpio, Quercia, Capra, & Musolesi, 2016) (Zervas, Proserpio, & Byers, 2020).Tuy nhiên, dữ liệu phân tích của các nghiên cứu này được thu thập trong một khoản thời gianngắn, hay phần nhiều là phát triển thuật toán (Ravanifard, Buntine, & Mirzaei, 2020) (Wang,Lu, & Zhai, 2011)(Alam, Ryu, & Lee, 2016) (Wang, Lu, & Zhai, 2011) (Balan & Mathew,2015). Chính vì thế, cần có một nghiên cứu trên một tập dữ liệu được thu thập trong một thờigian dài nhằm xem xét sự thay đổi sắc thái của các khía cạnh trong nhận xét của du khách bằngcách xem xét các mối quan hệ giữa các khía cạnh tích cực và tiêu cực, và mức độ tương quangiữa các đánh giá khía cạnh này theo thời gian. Với sự phát triển nhanh của công nghệ thông tin cộng với sự hình thành của nền kinh tếchia sẻ (Belk, 2014) thì truyền miệng trực tuyến cũng góp phần ảnh hưởng lớn đến quyết địnhcủa du khách (Hall, et al., 2022) (Nguyen & Tong, 2023). Tuy nhiên, dữ liệu các đánh giá trực 542tuyến đăng tải công khai trên trang Inside Airbnb cần được xem xét (Alsudais, 2021) (Guttentag,2019), trong đó các tác giả (Alsudais, 2021) đã chỉ ra một số ít sai sót trong dữ liệu được côngbố trên, còn nhóm của (Guttentag, 2019) cho thấy rằng các tập dữ đăng tải có giá trị nghiên cứubằng chứng là có 132 bài báo được đăng tải trên các tập chí chuyên ngành có phản biện nộidung. Bên cạnh đó, trang TripAdvisor.com cũng là nguồn cung cấp dữ liệu đánh giá, các nhànghiên cứu sử dụng một số công cụ để thu thập dữ liệu (Alam, Ryu, & Lee, 2016) (Ravanifard,Buntine, & Mirzaei, 2020) (Zervas, Proserpio, & Byers, 2020), tuy nghiên các tác giả ít khicông cố dữ liệu, ngoại trừ (Ravanifard, Buntine, & Mirzaei, 2020). Chính vì thế, trong phân còn lại trong bài viết này được trình bày như sau: với phần 2được trình bày các nghiên cứu liên quan, trong khi các bước phân tích sắc thái cảm xúc phần 3.Phần 4 chúng tôi dành để giới thiệu phương pháp nghiên cứu và các bước tiền xử lý dữ liệuđược trình bày trong phần 5. Phần 6 trình bày phân tích dữ liệu, trong đó các kết quả, và thảoluận của quá trình nghiên cứu được trình bày trong phần 7. Cuối cùng, chúng tôi tổng kết lạicác công việc đã thực hiện và đề xuất công việc trong tương lại được trình bày trong phần 8.2. CÁC NGHIÊN CỨU LIÊN QUAN Đứng trước nền kinh tế gặp nhiều khó khăn thời kỳ hậu covid-19 thì có vô số cơ hội và tháchthức được đưa ra cho du khách, chủ nhà, cơ sở lưu trú và cơ quan quản lý, do đó rất cần có cácnghiên cứu liên quan về phân tích dữ liệu (Guttentag, 2019), tiếp thị (Nguyen & Tong, 2023), phápluật, và chính sách công (Ngoc & Omar, 2022), công nghệ thông tin (Phuong, 2022). Chính vì thế,nghiên cứu phản hồi của khách hàng đang dần trở thành cốt lõi của bất kỳ ngành nào mong muốncải thiện hoạt động liên tục (Alam, Ryu, & Lee, 2016) (Andreu, Bigne, Amaro, & Palomo, 2020)(Dolnicar & Zare, 2020) (Hall, et al., 2022) (Phuong, 2022) (Zervas, Proserpio, & Byers, 2020). Một ngữ cảnh lý thuyết về nền kinh tế được chia sẻ bởi (Belk, 2014). Trong đó tập dữ liệuđược chia sẻ là quan trọng, nhiều nghiên cứu tập trung thu thập dữ liệu trên nền tảng Inside Airbnb(Guttentag, 2019) (Zervas, Proserpio, & Byers, 2020) bởi vì nó được công khai và được côngnhận trên tác tập chí ưu tín (Guttentag, 2019). Hoặc trên nền tảng TripAdvisor cũng được nhiềunhà nghiên cứu (Wang, Lu, & Zhai, 2011) (Alam, Ryu, & Lee, 2016) thu thập dữ liệu, tuy nhiêntập dữ liệu họ ít khi công bố chúng, chỉ có (Wang, Lu, & Zhai, 2011) là có công bố dữ liệu. Trong các nghiên cứu gần đây, phân tích sắc thái dựa trên khía cạnh được nhiề ...

Tài liệu được xem nhiều: