Danh mục

Phần mềm dịch thuật trực tuyến: Cần quan tâm đến

Số trang: 3      Loại file: pdf      Dung lượng: 126.68 KB      Lượt xem: 9      Lượt tải: 0    
Thu Hiền

Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Đánh vào ô Translate text câu hỏi “Automated language translation – is it an idea whose time has come?” (Dịch thuật tự động – Nó có là một ý tưởng mà thời của nó đã đến không ?) và cho chương trình dịch câu hỏi đó sang tiếng Pháp. Tiếp theo, dịch kết quả từ tiếng Pháp sang tiếng Đức. Và cuối cùng, dịch câu tiếng Đức có được trở lại tiếng Anh. Bạn sẽ có kết quả là “Did language translation automate – is it an idea, from which the time came?” (Dịch thuật tự động hóa – Nó...
Nội dung trích xuất từ tài liệu:
Phần mềm dịch thuật trực tuyến: Cần quan tâm đến Phần mềm dịch thuật trực tuyến: Cần quan tâm đếnĐánh vào ô Translate text câu hỏi “Automated language translation – is it an ideawhose time has come?” (Dịch thuật tự động – Nó có là một ý tưởng mà thời củanó đã đến không ?) và cho chương trình dịch câu hỏi đó sang tiếng Pháp. Tiếptheo, dịch kết quả từ tiếng Pháp sang tiếng Đức. Và cuối cùng, dịch câu tiếng Đứccó được trở lại tiếng Anh. Bạn sẽ có kết quả là “Did language translationautomate – is it an idea, from which the time came?” (Dịch thuật tự động hóa – Nócó là một ý tưởng mà thời gian đến từ đó?).Làm lại giống như vậy với câu “Reboot your computer and try again.” (Khởi độnglại máy tính của bạn và thử lại lần nữa) bạn sẽ có kết quả cuối cùng là “Theircomputer and attempt still again load.” (Máy tính của họ và nỗ lực vẫn còn nhậpvào lần nữa.) Ôi trời ! Đúng là “tam sao thất bản”!!! Có lẽ bạn sẽ thật sự ngánngẫm nếu như những sách hướng dẫn sử dụng thiết bị có nhiều ngôn ngữ đượcdịch theo kiểu như thế này.Tuy vậy, công bằng mà nói thì các công cụ dịch thuật cũng có những hỗ trợ tíchcực ở một số mặt nào đó. Và các nhà nghiên cứu cho biết những cách tiếp cận mớisẽ mang lại nhiều cải thiện về cách thực hiện cho những công cụ dịch thuật.Cập nhật cơ sở dữ liệuHãng xe hơi Ford đã bắt đầu sử dụng phần mềm dịch thuật (machine translation)từ năm 1998, và đến nay hãng này đã dịch được năm triệu câu hướng dẫn lắp ráptừ tiếng Anh sang tiếng Tây Ban Nha, Đức, Bồ Đào Nha và tiếng Tây Ban Nhacủa người Mexico. Các sách hướng dẫn lắp ráp bằng tiếng Anh được cập nhật mỗingày, và những bản dịch của chúng – khoảng 5.000 trang một ngày – được nhanhchóng chuyển đến các nhà máy của Ford trên khắp thế giới.Nestor Rychtyckyj, chuyên gia về trí tuệ nhân tạo (Artificial Intelligence – AI) củahãng Ford, nói: “Bạn không thể làm toàn bộ công việc này một cách thủ côngđược.”Hãng xe hơi này sử dụng phần mềm Enterprise Global Server của SystranSoftware, một công ty chuyên cung cấp các phần mềm dịch thuật có trụ sở ở SanDiego, bang California. Bên cạnh đó, các kỹ sư của Ford cũng tự viết một chươngtrình AI để chuyển ngữ những câu hướng dẫn thuộc về chuyên môn ở cấp độ caomột cách chính xác và rõ ràng. Mỗi một câu hướng dẫn đều được lưu trữ vào cơ sởdữ liệu để dùng cho việc dịch thuật.Hãng Ford cũng phải phát triển những từ điển thuật ngữ chuyên ngành xe hơi.Theo Rychtyckyj, duy trì những từ điển như thế dễ dàng hơn việc tìm kiếm mộtchuyên gia dịch thuật thông thạo các thuật ngữ. Ông nói: “Hầu hết những nỗ lựccủa chúng tôi là xây dựng các bảng thuật ngữ, và thường xuyên thay đổi chúng.Kết quả dịch thuật của bạn sẽ tốt hơn nhiều nếu bạn có sự chuẩn bị trước.”Phần mềm của công ty Systran sử dụng một kỹ thuật đáng tin cậy gọi là dịch theoquy tắc (rules-based translation). Những hệ thống như thế sử dụng những từ điểnsong ngữ kết hợp với cơ sở dữ liệu về cách dùng từ và các quy tắc văn phạm. Cáctrình dịch thuật thương mại thường được bổ sung bằng các bảng thuật ngữ, hoặcnhững cơ sở dữ liệu lưu trữ những câu hoặc đoạn văn mẫu đã được dịch sẵn(translation memory). Những phần bổ sung này thường do người sử dụng lập ratrong quá trình dịch thuật. Nhờ vậy, phần mềm dịch thuật có thể đưa ra những từhoặc câu dịch chính xác hoặc gần đúng nhất so với từ hoặc câu gốc để người dịchdễ dàng xem lại.Huấn luyện phần mềmDịch thuật theo kiểu thống kê (statistical machine translation) là một kỹ thuật mớinhưng chưa được sử dụng rộng rãi. Kỹ thuật này sử dụng những văn bản gốc vàbản dịch của chúng để “huấn luyện” phần mềm. Theo thời gian, những hệ thốngnày sẽ “học” được cách tạo ra một bản dịch tốt, rồi dùng phép tính xác suất vàthống kê để chọn ra một từ hoặc cụm từ gần đúng nhất dựa trên ngữ cảnh.Các hệ thống thống kê đòi hỏi phải có rất nhiều văn bản để huấn luyện các thuậttoán, nhưng chúng không cần các quy tắc văn phạm, từ điển song ngữ hoặctranslation memory. Chúng tự phát triển những quy tắc và tiếp tục tự điều chỉnhcác quy tắc đó theo thời gian.Hãng Google sử dụng phần mềm dịch theo quy tắc của công ty Systran, nhưng họcũng phát triển những hệ thống dựa trên thống kê của chính họ để dịch từ tiếngAnh sang tiếng Ả-Rập, Nga, Hoa, Hàn, Nhật, và ngược lại. Theo chuyên gianghiên cứu Franz Josef Och của Google, những ngôn ngữ này rất khó cho cácphần mềm dịch thuật vì chúng khác với các ngôn ngữ Tây phương có gốc là tiếngLatin bình dân (Vulgar Latin).

Tài liệu được xem nhiều: