Danh mục

Khử dấu phụ bằng 'sed'

Số trang: 3      Loại file: pdf      Dung lượng: 92.98 KB      Lượt xem: 14      Lượt tải: 0    
Thư viện của tui

Hỗ trợ phí lưu trữ khi tải xuống: miễn phí Tải xuống file đầy đủ (3 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Nhiều lúc bạn cần gửi một email nào đó và sợ người nhận không đọc được tiếng Việt có dấu. Sẽ rất mất thời gian nếu bạn phải ngồi... gõ thêm một bản không có dấu. Trong Windows, bạn có thể sử dụng công cụ chuyển mã của Unikey để làm việc này chỉ với vài tổ hợp phím tắt. Nhưng trong Linux, uvconv lại chưa thấy có tuỳ chọn này. Tuy nhiên, chúng ta có thể dùng `sed với lệnh sau: $ sed -e ...
Nội dung trích xuất từ tài liệu:
Khử dấu phụ bằng `sed Khử dấu phụ bằng `sedNhiều lúc bạn cần gửi một email nào đó và sợ người nhận không đọc được tiếngViệt có dấu. Sẽ rất mất thời gian nếu bạn phải ngồi... gõ thêm một bản không códấu.Trong Windows, bạn có thể sử dụng công cụ chuyển mã của Unikey để làm việcnày chỉ với vài tổ hợp phím tắt. Nhưng trong Linux, uvconv lại chưa thấy có tuỳchọn này. Tuy nhiên, chúng ta có thể dùng `sed với lệnh sau:$ sed -e s/[àảãáạằẳẵắặăầẩẫấậâ]/a/g -e s/[èẻẽéẹềểễếệê]/e/g -e s/[ìỉĩíị]/i/g -e s/[òỏõóọồổỗốộôờởỡớợơ]/o/g -e s/[ùủũúụừửữứựư]/u/g -e s/[ỳỷỹýỵ]/y/g -e s/đ/d/g -e s/[ÀẢÃÁẠẰẲẴẮẶĂẦẨẪẤẬÂ]/A/g -e s/[ÈẺẼÉẸỀỂỄẾỆÊ]/E/g -e s/[ÌỈĨÍỊ]/I/g -e s/[ÒỎÕÓỌỒỔỖỐỘÔỜỞỠỚỢƠ]/O/g -e s/[ÙỦŨÚỤỪỬỮỨỰƯ]/U/g -e s/[ỲỶỸÝỴ]/Y/g -e s/Đ/D/g CODAU > KHONGDAUGiải thích:Lệnh trên sẽ mở tập tin CODAU (có dấu), chuyển các kí tự có dấu thành khôngdấu và xuất kết quả ra tập tin KHONGDAU (không dấu).Tuy nhiên, vẫn thật là bất tiện nếu như lần nào bạn cũng phải gõ chính xác từng đókí tự. Có một cách đơn giản là viết một đoạn mã shell có lệnh trên. Bạn tạo tập tinkhudau.sh với nội dung như sau:#!/bin/shsed -e s/[àảãáạằẳẵắặăầẩẫấậâ]/a/g -e s/[èẻẽéẹềểễếệê]/e/g -e s/[ìỉĩíị]/i/g -e s/[òỏõóọồổỗốộôờởỡớợơ]/o/g -e s/[ùủũúụừửữứựư]/u/g -e s/[ỳỷỹýỵ]/y/g -e s/đ/d/g -e s/[ÀẢÃÁẠẰẲẴẮẶĂẦẨẪẤẬÂ]/A/g -e s/[ÈẺẼÉẸỀỂỄẾỆÊ]/E/g -e s/[ÌỈĨÍỊ]/I/g -e s/[ÒỎÕÓỌỒỔỖỐỘÔỜỞỠỚỢƠ]/O/g -e s/[ÙỦŨÚỤỪỬỮỨỰƯ]/U/g -e s/[ỲỶỸÝỴ]/Y/g -e s/Đ/D/g ~/CODAU > ~/KHONGDAUBạn chmod +x cho tập tin khudau.sh và chép nó vào thư mục ~/.Mỗi lần cần khử dấu một văn bản nào đó, bạn chỉ cần mở tập tin ~/CODAU (nếuchưa có tập tin này thì tạo nó trước bằng lệnh touch ~/CODAU), chép đè nội dungcần khử dấu và lưu lại. Sau đó chạy ~/khudau.sh. Và cuối cùng là mở tập tin kếtquả ~/KHONGDAU ra...Đây mới chỉ là một ý tưởng và thực tế thì việc sử dụng cũng hơi mất thời gian. Hivọng ai đó, nếu biết lập trình, có thể viết một chương trình dễ dùng hơn, tương tựcông cụ của Unikey trên Windows ;).

Tài liệu được xem nhiều: