Danh mục

Dùng chữ tiếng Việt bằng Unicode trong Windows

Số trang: 4      Loại file: doc      Dung lượng: 40.00 KB      Lượt xem: 10      Lượt tải: 0    
Thư viện của tui

Phí tải xuống: 4,000 VND Tải xuống file đầy đủ (4 trang) 0
Xem trước 2 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Việc chuyển đổi từ sử dụng các bảng mã riêng biệt sang dùng bảng mã chuẩn quốc tế để soạn thảo và thể hiện Việt ngữ đang gây ra không ít bối rối cho người dùng. Dưới đây là thông tin cơ bản về font chữ và cách xử lý tiếng Việt bằng font Unicode trong hệ điều hành Windows.
Nội dung trích xuất từ tài liệu:
Dùng chữ tiếng Việt bằng Unicode trong Windows Dùng chữ tiếng Việt bằng Unicode trong WindowsViệc chuyển đổi từ sử dụng các bảng mã riêng biệt sang dùng bảng mã chuẩn quốc tếđể soạn thảo và thể hiện Việt ngữ đang gây ra không ít bối rối cho người dùng. Dướiđây là thông tin cơ bản về font chữ và cách xử lý tiếng Việt bằng font Unicode trong hệđiều hành Windows.1. Bảng mã và font chữBảng mã, Font và UnicodeVề mặt cơ bản, máy tính làm việc với con số. Bản thân mỗi chữ cái(mỗi ký tự) cũng được gắn cho một con số nào đó để máy tính có thểhiểu. Hệ thống các con số dùng để thể hiện tất cả các chữ cái và kýhiệu của một (hay nhiều) ngôn ngữ gọi là bảng mã.Bảng mã chuẩn đầu tiên cho máy tính có tên là ASCII (AmericanStandard Code for Information Interchange). ASCII chuẩn 7-bit cho phéphiển thị 128 ký tự (bao gồm chữ cái, số và các ký tự đặc biệt khác như“?”, “.”, “*” v.v.). Mỗi ký tự trong ASCII sử dụng một byte và khi tậphợp lại, ASCII cho phép hiển thị thêm 128 ký tự khác nữa (tổng cộng là256 ký tự). Phần tập hợp này gọi là ASCII mở rộng (Extended ACSII)hay ASCII 8-bit.Một tập hợp các chữ cái và ký hiệu thể hiện tất cả các ký tự trong mộtbảng mã với cùng một kiểu hiển thị được gọi là font. Nói cách khác, fontlà hình thức mà một bảng mã được thể hiện trên màn hình máy tính hoặctrên trang giấy khi in ra. Bất cứ điều gì thuộc về ký hiệu ngôn ngữ đượcthể hiện trên máy tính đều phải theo một font nào đó, thuộc một bảngmã nào đó. Thường font bao giờ cũng có khả năng thể hiện dưới 4 dạngkhác nhau: bình thường, đậm, nghiêng và in hoa.Unicode là một bảng mã mới (có thể gọi là dạng mở rộng (rất rộng) củabảng mã ASCII), sử dụng 2 byte cho mỗi ký tự và có khả năng thể hiện65.536 ký tự khác nhau, cho phép biểu đạt mọi ký tự của tất cả các ngônngữ trên thế giới. Nói cách khác, với Unicode, mỗi ký tự của tất cả cácngôn ngữ trên thế giới sẽ có một con số riêng cho mình trong bảng mã.Các font chữ theo chuẩn Unicode được gọi là font Unicode.Font tiếng Việt kiểu cũCó thể dễ dàng thấy ngay điểm yếu của ASCII, đó là chỉ hỗ trợ tốt bảngchữ cái của tiếng Anh. Để thể hiện nhiều thứ tiếng khác, lập trình viênphải tạo ra các bảng mã khác dựa trên ASCII 8-bit. Một số bảng mã tiêubiểu kiểu này đối với tiếng Việt là TVCN3 (ABC 2.1), VNI, BK HCM...Các bảng mã trên giải quyết được vấn đề thể hiện các ký tự đặc biệttrong tiếng Việt (dấu, dấu móc và dấu mũ), tuy nhiên có cùng mộtnhược điểm rất lớn là không tương thích lẫn nhau và với các font có sẵncủa các hệ điều hành. Cụ thể, một văn bản được soạn thảo bằng font.Vntime (của bảng mã TVCN3) trên máy tính A sẽ không được thể hiệnmột cách chính xác trên máy tính B, nếu máy tính B không có font.Vntime (hoặc tương tự) được cài đặt. Nhiều trường hợp ngay cả khifont này đã được cài đặt, việc thể hiện font vẫn không chính xác (như lỗichữ “ư” phổ biến). Sở dĩ có sự không tương thích lẫn nhau giữa cácbảng mã tồn tại là vì những người sáng lập ra các bảng mã đó không cósự đồng nhất trong việc sắp đặt chữ cái nào sẽ được con số nào thểhiện trong từng bảng mã.Sự không tương thích trên khiến việc trao đổi thông tin (đặc biệt là giữacác miền và giữa trong và ngoài nước) gặp rất nhiều khó khăn, nhất làđối với những người không có chuyên môn về máy tính.Cách giải quyết duy nhất là tất cả cùng sử dụng chung một bảng mã. Vàviệc sử dụng Unicode - bảng mã chuẩn quốc tế - để thể hiện tiếng Việtcó thể nói là hợp lý và “hợp thời” nhất.2. Gõ tiếng Việt với UnicodeVới font tiếng Việt kiểu cũ, để gõ được tiếng Việt cần có hai điều kiện:Font chữ và bộ gõ dành cho font chữ đó. Với font Unicode, thì chỉ còncần bộ gõ thôi. Tuy nhiên, không phải phiên bản nào của hệ điều hànhWindows cũng có sẵn font Unicode.Các hệ điều hành Windows 2000 và Windows XP hỗ trợ rất tốt Unicode(hầu hết các font có sẵn trong hệ thống đều theo chuẩn Unicode). Vớicác hệ điều hành còn lại (Windows 98/95/NT) thì người dùng có thể tảifont Unicode về rồi cài vào máy. Tuy nhiên, nếu có thể thì tốt nhất là nênsử dụng Windows 2000 hoặc Windows XP.Về bộ gõ, hiện thời phổ biến nhất là Vietkey và Unikey. Tuy nhiên,Unikey tốt hơn bởi một số lý do chính sau:- Unikey miễn phí và mã nguồn mở. Người dùng có thể tải mã nguồn vềvà sửa chữa. Vietkey là chương trình thương mại và người dùng phảimua để sử dụng.- Unikey có kèm phần mềm chuyển mã và cho phép chuyển đổi rấtnhiều mã khác nhau- Unikey (phiên bản 3.5) có tùy chọn để không sử dụng “clipboard” củaWindows khi gõ tiếng Việt bằng font Unicode. Điều này tránh được lỗicách chữ hoặc mất chữ mà Vietkey hay mắc phải.Ngoài Unicode ra, cả Vietkey và Unikey đều hỗ trợ các bảng mã cũ khác.Tương tự như Vietkey, Unikey không yêu cầu “cài đặt”. Để sử dụng chỉcần tải phần mềm này về và chạy file có tên UnikeyNT.exe. Hướng dẫncó thể được tìm thấy tại trang web của tác giả Phạm Kim Long.Lưu ý:- Khi gõ tiếng Việt sử dụng bộ mã Unicode, cần đảm bảo font chữ đangdùng phải là thuộc bảng mã Unicode. Tốt nhất là nên sử dụng các font“Arial” hoặc “Times New Roman”.- Không sử dụng các bộ gõ cũ (dành cho các hệ điều hành 16-bit nhưDOS hay Windows 3x) cho các hệ điều hành 32-bit (Windows 9x/NT/2K/XP). Các bộ gõ cũ (ví dụ: ABC 2.1) khi cài đặt thường thay đổi font hệthống của hệ điều hành (thường là Unicode) thành font hệ thống kiểu cũ(ASCII) và khiến hệ điều hành không hỗ trợ được Unicode nữa.3. Đọc tiếng Việt trên mạng với UnicodeĐể đọc tiếng Việt (được soạn thảo bằng font Unicode) trên mạngInternet cần có 2 điều kiện:- Hệ điều hành hỗ trợ Unicode (xem phần trên).- Trình duyệt (browser) hỗ trợ Unicode: Các trình duyệt phổ biến nhưInternet Explorer 5.x (hoặc mới hơn), Netscape 4.7 (hoặc mới hơn) hỗ trợrất tốt Unicode. Trái lại, trình duyệt Opera hỗ trợ Unicode rất kém.Nếu có cả hai điều kiện trên mà vẫn không đọc được thì cần chuyểntrạng thái hiển thị hiện thời sang Unicode. Đối với Internet Explorer,cách làm như sau: Chọn menu “View” -> Encoding… -> More ( ...

Tài liệu được xem nhiều: