Danh mục

Hệ thống hỗ trợ hỏi đáp thủ tục hành chính

Số trang: 7      Loại file: pdf      Dung lượng: 566.90 KB      Lượt xem: 18      Lượt tải: 0    
tailieu_vip

Hỗ trợ phí lưu trữ khi tải xuống: 8,000 VND Tải xuống file đầy đủ (7 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài viết trình bày đề xuất xây dựng hệ thống hỗ trợ hỏi đáp thủ tục hành chính cho người dùng là các tổ chức, cá nhân và doanh nghiệp (gọi tắt là đối tượng người dùng). Hệ thống tự động trả lời các câu hỏi liên quan đến thủ tục hành chính mà đối tượng người dùng thường đặt ra mỗi khi đến cơ quan cung cấp thủ tục hành chính.
Nội dung trích xuất từ tài liệu:
Hệ thống hỗ trợ hỏi đáp thủ tục hành chính Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020 DOI: 10.15625/vap.2020.00164 HỆ THỐNG HỖ TRỢ HỎI ĐÁP THỦ TỤC HÀNH CHÍNH Nguyễn Thanh Điền1, Phạm Thế Phi2, Phạm Công Xuyên3, Đỗ Thanh Nghị2 1 Sở Khoa học và Công nghệ thành phố Cần Thơ Số 02, Đường Lý Thường kiệt, Tân An, Ninh Kiều, TP. Cần Thơ 2 Khoa CNTT-TT, Trường Đại học Cần Thơ Khu 2, Đường 3/2, Xuân Khánh, Ninh Kiều, TP. Cần Thơ 3 Trường Đại học Lạc Hồng Số 10, Huỳnh Văn Nghệ, P. Bửu Long, Tp. Biên Hòa - Tỉnh Đồng Nai pcxuyen@lhu.edu.vn, ntdienct@gmail.com, {ptphi,dtnghi}@cit.ctu.edu.vn TÓM TẮT: Trong bài viết này, chúng tôi đề xuất xây dựng hệ thống hỗ trợ hỏi đáp thủ tục hành chính cho người dùng là các tổ chức, cá nhân và doanh nghiệp (gọi tắt là đối tượng người dùng). Hệ thống tự động trả lời các câu hỏi liên quan đến thủ tục hành chính mà đối tượng người dùng thường đặt ra mỗi khi đến cơ quan cung cấp thủ tục hành chính. Người dùng đặt câu hỏi hay yêu cầu trực tiếp cho hệ thống dưới dạng văn bản, hệ thống tiếp nhận và thực hiện phân lớp văn bản câu hỏi, để xác định được câu trả lời thủ tục tương ứng với yêu cầu người dùng. Chúng tôi đã thu thập và biên soạn tập dữ liệu văn bản gồm 420 câu hỏi và câu trả lời trả lời từ 36 thủ tục hành chính thuộc lĩnh vực Báo chí, Xuất bản - In - Phát hành của đơn vị cung cấp là Sở Thông tin và Truyền thông thành phố Cần Thơ. Tập dữ liệu văn bản câu hỏi sau thu thập được tiền xử lý, tách từ và được biểu diễn về dạng mô hình túi từ. Chúng tôi huấn luyện các bộ phân lớp như máy học véctơ hỗ trợ, rừng ngẫu nhiên, mạng nơron cho độ chính xác lần lượt là 89,768 %, 97,101 % và 99,526 %. Từ kết quả thực nghiệm, chúng tôi đề xuất sử dụng bộ phân lớp văn bản mạng nơron trong hệ thống trả lời tự động thủ tục hành chính. Từ khóa: Hệ thống hỏi đáp tự động thủ tục hành chính, phân lớp văn bản, máy học véctơ hỗ trợ SVM, rừng ngẫu nhiên, mạng nơron. I. GIỚI THIỆU Ngày nay, hệ thống hỏi đáp tự động càng trở nên phổ biến và được sử dụng trong nhiều lĩnh vực của cuộc sống như trợ lý sức khoẻ, trợ lý giáo dục, trợ lý bảo tàng, trợ lý cá nhân, trợ lý du lịch, hỏi đáp dịch vụ công cộng. Hệ thống hỏi đáp tự động [D. Jurafsky and J-H. Martin, 2017] được nghiên cứu tập trung vào mô hình tương tác giữa người và máy tính, sử dụng ngôn ngữ tự nhiên với các đoạn văn bản, các đoạn hội thoại ngắn dưới giao diện tương tác đơn giản. Phần lớn các mô hình hệ thống hỏi đáp tự động được tạo ra dựa trên ba hướng tiếp cận chính. Tiếp cận dựa trên tập câu hỏi, câu trả lời đã được tạo sẵn: Đây là phương pháp được sử dụng phổ biến hiện nay, hệ thống hỏi đáp tự động có tập các câu hỏi đầu vào được xây dựng sẵn cùng với các câu trả lời tương ứng. Các câu hỏi giao tiếp được đặt ra từ người dùng sẽ được so khớp với tập các câu hỏi để tìm ra câu trả lời phù hợp nhất. Tiếp cận này dễ sử dụng, đơn giản, tuy nhiên cần rất nhiều thời gian trong việc xây dựng tập dữ liệu và việc phụ thuộc vào tập dữ liệu tạo sẵn. Tiếp cận dựa trên corpus: Nhiều nghiên cứu gần đây tiến hành thu thập các corpus dữ liệu để tìm kiếm câu trả lời phù hợp nhất từ yêu cầu từ người dùng. Phương pháp truy hồi thông tin được sử dụng để tìm kiếm những câu trả lời từ danh sách các tài liệu trong Google corpus. Đây là phương pháp có thể sử dụng kết hợp giữa corpus và các bộ trích lọc ngữ nghĩa của dữ liệu FrameNet và Verbnet để tìm kiếm câu trả lời phù hợp nhất. Các phương pháp này có ưu điểm là cho độ chính xác cao và nhược điểm là không thể xử lý được các trường hợp mẫu chưa được quan sát, không có trong bộ luật và tốn nhiều thời gian xử lý. Tiếp cận tự sinh câu trả lời: Phương pháp này huấn luyện mô hình mạng nơron để sinh các câu trả lời một cách tự động. Đây cũng là một trong những phương pháp đạt được nhiều thành công trong thời gian gần đây và được các nhà nghiên cứu đề xuất mô hình mạng nơron hồi tiếp (Recurrent Neural Network) để tạo ra các câu trả lời từ Blogs. Phương pháp này tạo cảm giác cho người dùng như đang trò chuyện với con người. Tuy nhiên, những mô hình này thì rất phức tạp trong việc huấn luyện, có thể dễ bị mắc lỗi về ngữ pháp và đồng thời mô hình cần một lượng lớn dữ liệu huấn luyện. Trong bài viết này, chúng tôi đề xuất xây dựng hệ thống hỏi đáp thủ tục hành chính có thể trả lời tự động cho người dùng các câu hỏi liên quan đến thủ tục hành chính mà đối tượng người dùng thường đặt ra mỗi khi đến cơ quan cung cấp thủ tục hành chính. Hệ thống tiếp nhận từ người dùng câu hỏi hay yêu cầu dạng văn bản, tiến hành tiền xử lý và biểu diễn câu hỏi theo mô hình túi từ, thực hiện phân lớp câu hỏi, xác định câu trả lời là thủ tục hành chính tương ứng với câu hỏi. Để xây dựng hệ thống, chúng tôi đã thu thập và biên soạn tập dữ liệu văn bản gồm 420 câu hỏi và câu trả lời trả lời từ 36 thủ tục hành chính thuộc lĩnh vực Báo chí, Xuất bản - In - Phát hành của đơn vị cung cấp là Sở Thông tin và Truyền thông thành phố Cần Thơ. Tập dữ liệu văn bản câu hỏi sau thu thập được tiền xử lý, tách từ và được biểu diễn về dạng mô hình túi từ. Chúng tôi đã huấn luyện các bộ phân lớp như máy học véctơ hỗ trợ (support vector machines - SVM [Vapnik, 1995]), rừng ngẫu nhiên (random forests - RF [Breiman, 2001]), mạng nơron (neural networks - NN [LeCun, 1985]) cho độ chính xác lần lượt là 89,768 %, 97,101 % và 99,526 %. Kết quả thực nghiệm cho phép chúng tôi chọn bộ phân lớp văn bản mạng nơron cho hệ thống hỏi ...

Tài liệu được xem nhiều:

Tài liệu liên quan: