Danh mục

Chatbot cho sinh viên công nghệ thông tin

Số trang: 7      Loại file: pdf      Dung lượng: 534.21 KB      Lượt xem: 11      Lượt tải: 0    
Thu Hiền

Phí tải xuống: 4,000 VND Tải xuống file đầy đủ (7 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết đề xuất xây dựng Chatbot trên máy tính Raspberry Pi có thể trả lời tự động cho sinh viên ngành Công nghệ thông tin (CNTT) các câu hỏi liên quan đến môi trường học tập và phương pháp học tập bậc đại học, kỹ năng nghề nghiệp, xu hướng công nghệ.
Nội dung trích xuất từ tài liệu:
Chatbot cho sinh viên công nghệ thông tinKỷ yếu Hội nghị KHCN Quốc gia lần thứ XII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR); Huế, ngày 07-08/6/2019DOI: 10.15625/vap.2019.00012 CHATBOT CHO SINH VIÊN CÔNG NGHỆ THÔNG TIN Đỗ Thanh Nghị1, Hoàng Tùng2 1 Khoa CNTT-TT, Trường Đại học Cần Thơ Khu 2, Đường 3/2, Xuân Khánh, Ninh Kiều, TP. Cần Thơ dtnghi@cit.ctu.edu.vn 2 Trung tâm Tin học, Trường Đại học Nguyễn Tất Thành 300A - Nguyễn Tất Thành, Phường 13, Quận 4, TP. Hồ Chí Minh htung@ntt.edu.vnTÓM TẮT: Trong bài viết này, chúng tôi đề xuất xây dựng Chatbot trên máy tính Raspberry Pi có thể trả lời tự động cho sinh viênngành Công nghệ thông tin (CNTT) các câu hỏi liên quan đến môi trường học tập và phương pháp học tập bậc đại học, kỹ năngnghề nghiệp, xu hướng công nghệ. Sinh viên thực hiện đặt câu hỏi cho Chatbot bằng cách nói trực tiếp bằng tiếng nói, Chatbot tiếpnhận câu hỏi từ microphone và chuyển đổi câu hỏi từ dạng tiếng nói sang dạng văn bản, nhận dạng câu hỏi văn bản bằng mô hìnhphân lớp văn bản đã được huấn luyện, Chatbot trả về câu trả lời dạng văn bản và phát ra câu trả lời bằng tiếng nói cho sinh viênnghe. Chúng tôi đã thu thập và biên soạn tập dữ liệu văn bản gồm 986 câu hỏi của 213 câu trả lời từ nguồn tài liệu học tập và BlogScience Technology của giáo sư John Vũ. Sau khi tách từ, tiền xử lý, các câu hỏi được biểu diễn về dạng mô hình túi từ. Chúng tôihuấn luyện cách bộ phân lớp như máy học véctơ hỗ trợ, mạng nơron, rừng ngẫu nhiên, k láng giềng cho độ chính xác lần lượt là76,77 %; 72,73 %; 71,72 % và 65,66 %. Kết quả thực nghiệm cho phép chúng tôi chọn bộ phân lớp văn bản máy học véctơ hỗ trợcho mô hình trả lời Chatbot.Từ khóa: Chatbot, phân lớp tự động văn bản, máy học véctơ hỗ trợ, mạng nơron, rừng ngẫu nhiên, k láng giềng. I. GIỚI THIỆU Chatbot là một chương trình máy tính có khả năng tương tác với người dùng bằng ngôn ngữ tự nhiên dưới mộtgiao diện đơn giản, âm thanh hoặc dưới dạng tin nhắn [Jurafsky & Martin, 2018], [Raj, 2018]. Lĩnh vực nghiên cứuChatbot tập trung vào các mô hình tương tác giữa máy tính với người dùng bằng các đoạn đối thoại thông minh tựđộng sử dụng ngôn ngữ tự nhiên. Hỏi đáp và chatbot ngày càng trở nên phổ biến và và được xây dựng như một trợ lýảo trong rất nhiều lĩnh vực và nhiều khía cạnh trong cuộc sống như là trợ lý sức khỏe, trợ lý giáo dục, trợ lý bảo tàng.Hầu hết các mô hình Chatbot được tạo ra dựa trên các phương pháp chính như sau. Tiếp cận dựa trên tập và các luật đã tạo sẵn: Phương pháp phổ biến trong việc xâydựng Chatbot là tạo các bộ tập câu nghe ở đầu vào được dự đoán trước và câu trả lời tương ứng với câu nghe. Các câugiao tiếp đối thoại của người dùng sẽ được so sánh với các tập dữ liệu câu nghe để tìm ra mẫu câu trả lời phù hợp nhất.Một trong những cách tạo ra các tập câu nghe và câu trả lời là dựa trên AIML - một ngôn ngữ giống như XML. AIMLcho phép hỏi đáp, chatbot tạo ra các chủ đề và các tập dữ liệu theo chủ đề đó. ALICE, ChatScript là những ứng dụnghỏi đáp Chatbot phổ biến sử dụng tập AIML. Dữ liệu của của những Chatbot này là những mẫu câu đối thoại được lưutrong những tập tin AIML và được phát triển bởi Wallace từ năm 1995. Mặc dù việc sử dụng tập dữ liệu AIML có ưuđiểm là đơn giản và dễ sử dụng, nhưng việc xây dựng dữ liệu tốn rất nhiều thời gian và việc phụ thuộc vào dữ liệuđược tạo sẵn từ người dùng sẽ gây ra sự nhàm chán và thiếu dữ liệu. Tiếp cận dựa trên Ontology: Một ontology là một mô hình cấu trúc dữ liệu phân cấp bao gồm các lớp đốitượng dữ liệu, mối quan hệ giữa chúng và các luật được định nghĩa trong cùng một lĩnh vực và được sử dụng để suyluận về các đối tượng trong lĩnh vực đó và mối quan hệ giữa chúng. Ontology cung cấp một bộ từ vựng chung bao gồmcác khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc tính này. Ngoài bộ từ vựng,ontology còn cung cấp các ràng buộc, đôi khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mongmuốn của bộ từ vựng. Nó được sử dụng không những trong một miền mà còn có thể được giao tiếp giữa người và cáchệ thống ứng dụng phân tán khác. Ontology cũng được dùng để kết hợp với cơ sở dữ liệu quan hệ để tạo ra các cơ sởtri thức cho hỏi đáp, Chatbot trích xuất các câu trả lời có sẵn trong tập tài liệu sau đó sử dụng các suy luận để tìm mốiliên kết giữa câu trả lời và câu hỏi. Việc sử dụng ontology giúp giải quyết được những khuyết điểm của việc xây dựngtri thức sử dụng AIML, tuy nhiên việc xây dựng quan hệ và quy luật giữa các khái niệm vẫn cần nhiều đến công sứccon người và tốn thời gian. Tiếp cận dựa trên corpus: Các nghiên cứu gần đây tận dụng các corpus dữ liệu (tập hợp nhiều tài liệu) để tìmkiếm một câu trả lời phù hợp nhất với dữ liệu nghe được từ người dùng. Phương pháp truy hồi thông tin sử dụng cácphương pháp tìm kiếm những câu trả lời từ danh sách các tài liệu trong Google corpus. Phương pháp này cũng có thểkết hợp sử dụng corpus và các bộ trích lọc ngữ nghĩa của dữ liệu FrameNet và Verbnet để tìm các câu trả lời chính xác.Phương pháp truy hồi thông tin có thể dựa trên corpus các tài liệu và sử dụng các luật để tìm ra câu trả lời phù hợp.Đặc biệt, CleverBot là một trong những Chatbot thành công gần đây có ứng dụng phương pháp truy hồi này. Phươngpháp này dùng để tìm ra danh sách các tài liệu phù hợp nhất và từ các tài liệu này họ sẽ xây dựng các bộ luật để tìm ra86 CHATBOT CHO SINH VIÊN CÔNG NGHỆ THÔNG TINcác câu trả lời th ...

Tài liệu được xem nhiều:

Gợi ý tài liệu liên quan: