Danh mục

Sử dụng mạng nơ-ron đồ thị để phân tích cảm xúc cho bình luận

Số trang: 15      Loại file: pdf      Dung lượng: 566.20 KB      Lượt xem: 32      Lượt tải: 0    
Thu Hiền

Phí tải xuống: 4,000 VND Tải xuống file đầy đủ (15 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết "Sử dụng mạng nơ-ron đồ thị để phân tích cảm xúc cho bình luận" nghiên cứu mô hình Graph neural networks (GNN) trong học sâu (deep learning) áp dụng trên dữ liệu đồ thị để phân loại văn bản Tiếng Anh ứng dụng trong bài toán phân lớp băn bản. Kết quả thực nghiệm trên bộ dữ liệu Movie Reviews đã đạt đến độ chính xác lên đến 76,468% so với một số mô hình học sâu khác trong bài toán phân lớp văn bản được trình bày trong nghiên cứu. Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Sử dụng mạng nơ-ron đồ thị để phân tích cảm xúc cho bình luậnKỷ yếu Hội thảo khoa học Khoa Công nghệ thông tin, năm 2024 SỬ DỤNG MẠNG NƠ-RON ĐỒ THỊ ĐỂ PHÂN TÍCH CẢM XÚC CHO BÌNH LUẬN Huỳnh Thị Cẩm Dung1,*, Vũ Phú Lộc 1 Trần Khải Thiện2, Nguyễn Thị Bích Ngân3, Phạm Nguyễn Huy Phương4 1 Lớp cao học CNTT Khóa 01, Trường Đại học Công Thương Thành phố Hồ Chí Minh 2 Khoa CNTT, Trường Đại học Ngoại Ngữ - Tin Học Thành phố Hồ Chí Minh 3 Khoa Công nghệ Thông tin, Trường Đại học Công Thương Thành phố Hồ Chí Minh 4 Phòng Quản lý Sau Đại Học, Trường Đại học Công Thương Thành phố Hồ Chí Minh *Email: huynhthicamdung2906@gmail.com Ngày nhận bài: 07/04/2024; Ngày chấp nhận đăng: 20/05/2024 TÓM TẮT Hiện nay có nhiều bài toán trong thực tế mà dữ liệu khi ánh xạ qua đồ thị có cấu trúcphức tạp, không thuộc không gian Euclide, cũng không có hình thức cố định với kích thướcvà số chiều lớn. Chẳng hạn như: phát hiện thuốc giả, hệ thống thương mại điện tử cần pháthiện người bán, người mua sản phẩm độc hại, giải mã bộ gen hoặc khoa học vật liệu. Chínhvì vậy việc nghiên cứu và xây dựng các thuật toán xử lý dữ liệu đồ thị trở thành một chủ đềquan trọng trong phương pháp học sâu và học máy truyền thống. Trong bài báo này, chúngtôi nghiên cứu mô hình Graph neural networks (GNN) trong học sâu (deep learning) áp dụngtrên dữ liệu đồ thị để phân loại văn bản Tiếng Anh ứng dụng trong bài toán phân lớp bănbản. Kết quả thực nghiệm trên bộ dữ liệu Movie Reviews1 đã đạt đến độ chính xác lên đến76,468% so với một số mô hình học sâu khác trong bài toán phân lớp văn bản được trình bàytrong nghiên cứu. Từ khoá: Học sâu, Máy học, Phân lại văn bản, Xử lý ngôn ngữ tự nhiên, Mạng nơ-ron,Deep Learning, Machine Learning, Natural language processing, Graph neural network,Graph convolutional network, Text classification. 1. GIỚI THIỆU Hiện nay dữ liệu đồ thị trở thành một phần không thể thiếu và áp dụng nhiều trong cáclĩnh vực như: thị giác máy tính, nhận dạng mẫu, phân tích hình ảnh, xử lý ngôn ngữ tự nhiên,… Gần đây dữ liệu đồ thị còn được sử dụng để dự đoán cấu trúc phân tử protein bậc 3 và 4.Việc này có ý nghĩa quan trọng trong việc tìm ra các chất mới có khả năng tương tác sinhhọc ở mức độ phân tử và tế bào[1]. Sự đặc biệt của đồ thị là không giới hạn về kích thướchay số chiều nên việc khai thác tiềm năng của deep learning trên dữ liệu đồ thị trở thành xuhướng mà các nhà nghiên cứu hướng tới. Tương tự trong các bài toán phân loại văn bản, cónhiều phương pháp phân loại phổ biến được sử dụng trong lĩnh vực học máy và xử lý ngônngữ tự nhiên (Natural language processing - NLP) như: Cây quyết định, Support VectorMachines (SVM), Logistic Regression, và Neural Networks trong đó có mô hình Graph1 https://www.cs.cornell.edu/people/pabo/movie-review-data 238Huỳnh Thị Cẩm Dung và CSNeural Networks,…. Cây quyết định, Support Vector Machines (SVM), và LogisticRegression là những mô hình phân loại truyền thống trong học máy, trong khi NeuralNetworks (NN) là một mô hình phân loại dựa trên mạng nơ-ron [1]. Sự khác biệt giữa cácmô hình này dẫn đến hiệu suất khác nhau trong việc phân loại dữ liệu. Đối với với mạng nơ-ron thì có khả năng học và trích xuất các đặc trưng từ dữ liệu một cách tự động thông quaviệc học sâu, trong khi các mô hình truyền thống thường yêu cầu việc trích xuất đặc trưngthủ công. Ngoài ra mạng nơ-ron có thể được xây dựng và tinh chỉnh dễ dàng để phù hợp vớinhiều loại dữ liệu và bài toán khác nhau. Nó có thể kết hợp với các lớp và kiến trúc khácnhau để cải thiện hiệu suất. Graph Neural Networks (GNNs) là mô hình mạng nơ-ron có giám sát. Mỗi nơ-ron trongGNN tương ứng với một nút trong đồ thị, các nơ-ron được kết nối với nhau theo cách kết nốicủa các nút trong đồ thị. Nên GNN hiệu quả trong việc xử lý và phân tích cấu trúc phức tạpvà mối quan hệ trong dữ liệu đồ thị, bởi vì nó có khả năng cập nhật trạng thái của mỗi nútdựa trên trạng thái của các nút liên kết với nó. Chính vì vậy trong bài này chúng tôi tiếp cậnviệc tìm hiểu, giới thiệu các khía cạnh của GNN, nghiên cứu về sức mạnh biểu đạt và tínhlinh hoạt của GNN cũng như khám phá cách chúng có thể thay đổi cách chúng ta hiểu và xửlý dữ liệu đồ thị trong tương lai, đề xuất và xây dựng ứng dụng phân loại văn bản tiếng Anháp dụng với mạng neuron đồ thị [1]. 2. KIẾN THỨC NỀN TẢNG2.1 Tổng quan phương pháp Trong bài nghiên cứu chúng tôi sẽ áp dụng mô hình Graph Neural Network để phânloại cảm xúc trong tập dữ liệu Movie Reviews [2], đây là một nguồn dữ liệu gồm các bìnhluận bằng tiếng Anh phổ biến trong lĩnh vực xử lý ngôn ngữ tự nhiên và học máy, được tổnghợp bởi Pang và Lee vào năm 2005. Đầu vào của mô hình GNN là các đánh giá và nhận xéttừ người dùng về các bộ phim, với mục tiêu là phân loại chúng thành hai loại cảm xúc chính:tích cực (Positive) và tiêu cực (Negative). Đồng thời chúng tôi sẽ tiến hành so sánh kết quảthực nghiệm GNN với các phương pháp phân loại văn bản phổ biến khác, từ đó rút ra các kếtluận.2.2 Cấu trúc mô hình mạng2.2.1. Graph convolutional network(GCN) Mạng GCN (Graph Convolutional Network) là một dạng của mạng nơ-ron sử dụng đểxử lý dữ liệu đồ thị, cho phép nó hiểu và khai thác thông tin phức tạp và mối quan hệ trongdữ liệu đồ thị, từ đó nâng cao hiệu suất và độ chính xác của các ứng dụng liên quan đến họcsâu và trí tuệ nhân tạo. GCN được thiết kế để học cấu trúc và thông tin trong dữ liệu đồ thịbằng cách áp dụng phép tích chập (convolution) trên đồ thị. Đầu vào của GCN là một đặctrưng đỉnh ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: