Giáo trình hướng dẫn tạo chuỗi dùng phương thức Tostring sử dụng biểu thức quy tắc qua lớp regex p6
Số trang: 5
Loại file: pdf
Dung lượng: 871.71 KB
Lượt xem: 11
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Chuỗi này có thể được tìm thấy trong nội dung của các tập tin log ghi nhận các thông tin ở web server hay từ các kết quả tìm kiếm được trong cơ sở dữ liệu. Trong ví dụ đơn giản này có ba cột, một cột đầu tiên ghi nhận thời gian, cột thứ hai ghi nhận địa chỉ IP, và cột thứ ba ghi nhận địa chỉ web. Mỗi cột được ngăn cách bởi khoảng trắng.
Nội dung trích xuất từ tài liệu:
Giáo trình hướng dẫn tạo chuỗi dùng phương thức Tostring sử dụng biểu thức quy tắc qua lớp regex p6 Ngôn Ngữ Lập Trình C# }// end Main }// end class }// end namespace ----------------------------------------------------------------------------- Ví dụ minh họa 10.8 bắt đầu bằng việc tạo một chuỗi đơn giản để tìm kiếm như sau: string string1 = “10:20:30 127.0.0.0 Dolphin.net”; Chuỗi này có thể được tìm thấy trong nội dung của các tập tin log ghi nhận các thông tin ở web server hay từ các kết quả tìm kiếm được trong cơ sở dữ liệu. Trong ví dụ đơn giản này có ba cột, một cột đầu tiên ghi nhận thời gian, cột thứ hai ghi nhận địa chỉ IP, và cột thứ ba ghi nhận địa chỉ web. Mỗi cột được ngăn cách bởi khoảng trắng. Dĩ nhiên là trong các ứng dụng thực tế ta phải giải quyết những vấn đề phức tạp hơn nữa, chúng ta có thể cần phải thực hiện việc tìm kiếm phức tạp hơn và sử dụng nhiều ký tự ngăn cách hơn nữa. Trong ví dụ này, chúng ta mong muốn là tạo ra một đối tượng Regex để tìm kiếm chuỗi con yêu cầu và phân chúng vào trong ba nhóm: time, địa chỉ IP, và địa chỉ web. Biểu thức quy tắc ở đây cũng khá đơn giản, do đó cũng dễ hiểu. Ở đây chúng ta quan tâm đến những ký tự tạo nhóm như: Ngôn Ngữ Lập Trình C# Console.WriteLine(“IP: {0}”, theMatch.Groups[“ip”]); // hiển thị địa chỉ web site Console.WriteLine(“site: {0}”, theMatch.Groups[“site”]); Ta nhận được kết quả: IP: 127.0.0.0 Site: Dolphin.net Trong ví dụ 10.8 trên thì tập hợp Match chỉ so khớp duy nhất một lần. Tuy nhiên, nó có thể so khớp nhiều hơn nữa trong một chuỗi. Để làm được điều này, chúng ta có thể bổ sung chuỗi tìm kiếm được lấy từ trong một log file như sau: String string1 = “10:20:30 127.0.0.0 Dolphin.net ” + “10:20:31 127.0.0.0 Mun.net ” + “10:20:32 127.0.0.0 Msn.net ”; Chuỗi này sẽ tạo ra ba chuỗi con so khớp được tìm thấy trong MatchCollection. Và kết quả ta có thể thấy được là: theMatch: 10:20:30 127.0.0.0 Dolphin.net Time: 10:20:30 IP: 127.0.0.0 site: Dolphin.net theMatch: 10:20:31 127.0.0.0 Mun.net Time: 10:20:31 IP: 127.0.0.0 Site: Mun.net theMatch: 10:20:32 127.0.0.0 Msn.net time: 10:20:32 IP: 127.0.0.0 Site: Msn.net Trong ví dụ này phần bổ sung, thì theMatches chứa ba đối tượng Match. Mỗi lần lặp thì các chuỗi con được tìm thấy (ba lần) và chúng ta có thể xuất ra chuỗi cũng như từng nhóm riêng bên trong của chuỗi con được tìm thấy. Sử dụng lớp CaptureCollection Mỗi khi một đối tượng Regex tìm thấy một chuỗi con, thì môt thể hiện Capture được tạo ra và được thêm vào trong một tập hợp CaptureCollection. Mỗi một đối tượng Capture thể hiện một chuỗi con riêng. Mỗi nhóm có một tập hợp các Capture được tìm thấy trong chuỗi con có liên hệ với nhóm. 299 Xử Lý Chuỗi Ngôn Ngữ Lập Trình C# Thuộc tính quan trọng của đối tượng Capture là thuộc tính Length, đây chính là chiều dài của chuỗi con được nắm giữ. Khi chúng ta hỏi Match chiều dài của nó, thì chúng ta sẽ nhận được Capture.Length do Match được dẫn xuất từ Group và đến lượt Group lại được dẫn xuất từ Capture. Mô hình kế thừa trong biểu thức quy tắc của .NET cho phép Match thừa hưởng những giao diện phương thức và thuộc tính của những lớp cha của nó. Theo ý nghĩa này, thì một Group là một Capture (Group is-a Capture), là một đối tượng Capture đóng gói các ý tưởng về các nhóm biểu thức. Đến luợt Match, nó cũng là một Group (Match is-a Group), nó đóng gói tất cả các nhóm biểu thức con được so khớp trong biểu thức quy tắc (Xem chi tiết hơn trong chương 5: Kế thừa và đa hình). Thông thường, chúng ta sẽ tìm thấy chỉ một Capture trong tập hợp CaptureCollection; nhưng điều này không phải vậy. Chúng ta thử tìm hiểu vấn đề như sau, ở đây chúng ta sẽ gặp trường hợp là phân tích một chuỗi trong đó có nhóm tên của công ty được xuất hiện hai lần. Để nhóm chúng lại trong chuỗi tìm thấy chúng ta tạo nhóm ? xuất hiện ở hai nơi trong mẫu biểu thức quy tắc như sau: Regex theReg = new Regex(@”(?(\d|\:)+)\s” + @”(?\S+)\s” + @”(?(\d|\.)+)\s” + @”(?\S+)\s”); Biểu thức quy tắc này nhóm bất cứ chuỗi nào hợp với mẫu so khớp time, và cũng như bất cứ chuỗi nào theo nhóm ip. Giả sử chúng ta dùng chuỗi sau để làm chuỗi tìm kiếm: string string1 = “10:20:30 IBM 127.0.0.0 HP”; Chuỗi này chứa tên của hai công ty ở hai vị trí khác nhau, và kết quả thực hiện chương trình là như sau: theMatch: 10:20:30 IBM 127.0.0.0 HP Time: 10:20:30 IP: 127.0.0.0 Company: HP Điều gì xảy ra? Tại sao nhóm Company chỉ thể hiện giá trị HP. Còn chuỗi đầu tiên ở đâu hay là không được tìm thấy? Câu trả lời chính xác là mục thứ hai đã viết chồng mục đầu. Tuy nhiên, Group vẫn lưu giữ cả hai giá trị. Và ta dùng tập hợp Capture để lấy các giá trị này. Ví dụ minh họa 10.9: Tìm hiểu tập hợp CaptureCollection. ----------------------------------------------------------------------------- namespace Programming_CSharp { using System; using System.Text.RegularExpressions; class Test 300 Xử Lý Chuỗi Ngôn Ngữ Lập Trình C# { public static void Main() { // tạo một chuỗi để phân tích // lưu ý là tên công ty được xuất // hiện cả hai nơi string string1 = “10:20:30 IBM 127.0.0.0 HP”; // biểu thức quy tắc với việc nhóm hai lần tên công ty Regex theReg = new Regex(@”(?(\d|\:)+)\s” + @”(?\S+)\s” + @”(?(\d|\ .)+)\s” + @”(?\S+)\s”); // đưa vào tập hợp các chuỗi được tìm thấy MatchCollection theMatches = theReg.Matches( string1 ); // dùng vòng lặp để lấy kết quả ...
Nội dung trích xuất từ tài liệu:
Giáo trình hướng dẫn tạo chuỗi dùng phương thức Tostring sử dụng biểu thức quy tắc qua lớp regex p6 Ngôn Ngữ Lập Trình C# }// end Main }// end class }// end namespace ----------------------------------------------------------------------------- Ví dụ minh họa 10.8 bắt đầu bằng việc tạo một chuỗi đơn giản để tìm kiếm như sau: string string1 = “10:20:30 127.0.0.0 Dolphin.net”; Chuỗi này có thể được tìm thấy trong nội dung của các tập tin log ghi nhận các thông tin ở web server hay từ các kết quả tìm kiếm được trong cơ sở dữ liệu. Trong ví dụ đơn giản này có ba cột, một cột đầu tiên ghi nhận thời gian, cột thứ hai ghi nhận địa chỉ IP, và cột thứ ba ghi nhận địa chỉ web. Mỗi cột được ngăn cách bởi khoảng trắng. Dĩ nhiên là trong các ứng dụng thực tế ta phải giải quyết những vấn đề phức tạp hơn nữa, chúng ta có thể cần phải thực hiện việc tìm kiếm phức tạp hơn và sử dụng nhiều ký tự ngăn cách hơn nữa. Trong ví dụ này, chúng ta mong muốn là tạo ra một đối tượng Regex để tìm kiếm chuỗi con yêu cầu và phân chúng vào trong ba nhóm: time, địa chỉ IP, và địa chỉ web. Biểu thức quy tắc ở đây cũng khá đơn giản, do đó cũng dễ hiểu. Ở đây chúng ta quan tâm đến những ký tự tạo nhóm như: Ngôn Ngữ Lập Trình C# Console.WriteLine(“IP: {0}”, theMatch.Groups[“ip”]); // hiển thị địa chỉ web site Console.WriteLine(“site: {0}”, theMatch.Groups[“site”]); Ta nhận được kết quả: IP: 127.0.0.0 Site: Dolphin.net Trong ví dụ 10.8 trên thì tập hợp Match chỉ so khớp duy nhất một lần. Tuy nhiên, nó có thể so khớp nhiều hơn nữa trong một chuỗi. Để làm được điều này, chúng ta có thể bổ sung chuỗi tìm kiếm được lấy từ trong một log file như sau: String string1 = “10:20:30 127.0.0.0 Dolphin.net ” + “10:20:31 127.0.0.0 Mun.net ” + “10:20:32 127.0.0.0 Msn.net ”; Chuỗi này sẽ tạo ra ba chuỗi con so khớp được tìm thấy trong MatchCollection. Và kết quả ta có thể thấy được là: theMatch: 10:20:30 127.0.0.0 Dolphin.net Time: 10:20:30 IP: 127.0.0.0 site: Dolphin.net theMatch: 10:20:31 127.0.0.0 Mun.net Time: 10:20:31 IP: 127.0.0.0 Site: Mun.net theMatch: 10:20:32 127.0.0.0 Msn.net time: 10:20:32 IP: 127.0.0.0 Site: Msn.net Trong ví dụ này phần bổ sung, thì theMatches chứa ba đối tượng Match. Mỗi lần lặp thì các chuỗi con được tìm thấy (ba lần) và chúng ta có thể xuất ra chuỗi cũng như từng nhóm riêng bên trong của chuỗi con được tìm thấy. Sử dụng lớp CaptureCollection Mỗi khi một đối tượng Regex tìm thấy một chuỗi con, thì môt thể hiện Capture được tạo ra và được thêm vào trong một tập hợp CaptureCollection. Mỗi một đối tượng Capture thể hiện một chuỗi con riêng. Mỗi nhóm có một tập hợp các Capture được tìm thấy trong chuỗi con có liên hệ với nhóm. 299 Xử Lý Chuỗi Ngôn Ngữ Lập Trình C# Thuộc tính quan trọng của đối tượng Capture là thuộc tính Length, đây chính là chiều dài của chuỗi con được nắm giữ. Khi chúng ta hỏi Match chiều dài của nó, thì chúng ta sẽ nhận được Capture.Length do Match được dẫn xuất từ Group và đến lượt Group lại được dẫn xuất từ Capture. Mô hình kế thừa trong biểu thức quy tắc của .NET cho phép Match thừa hưởng những giao diện phương thức và thuộc tính của những lớp cha của nó. Theo ý nghĩa này, thì một Group là một Capture (Group is-a Capture), là một đối tượng Capture đóng gói các ý tưởng về các nhóm biểu thức. Đến luợt Match, nó cũng là một Group (Match is-a Group), nó đóng gói tất cả các nhóm biểu thức con được so khớp trong biểu thức quy tắc (Xem chi tiết hơn trong chương 5: Kế thừa và đa hình). Thông thường, chúng ta sẽ tìm thấy chỉ một Capture trong tập hợp CaptureCollection; nhưng điều này không phải vậy. Chúng ta thử tìm hiểu vấn đề như sau, ở đây chúng ta sẽ gặp trường hợp là phân tích một chuỗi trong đó có nhóm tên của công ty được xuất hiện hai lần. Để nhóm chúng lại trong chuỗi tìm thấy chúng ta tạo nhóm ? xuất hiện ở hai nơi trong mẫu biểu thức quy tắc như sau: Regex theReg = new Regex(@”(?(\d|\:)+)\s” + @”(?\S+)\s” + @”(?(\d|\.)+)\s” + @”(?\S+)\s”); Biểu thức quy tắc này nhóm bất cứ chuỗi nào hợp với mẫu so khớp time, và cũng như bất cứ chuỗi nào theo nhóm ip. Giả sử chúng ta dùng chuỗi sau để làm chuỗi tìm kiếm: string string1 = “10:20:30 IBM 127.0.0.0 HP”; Chuỗi này chứa tên của hai công ty ở hai vị trí khác nhau, và kết quả thực hiện chương trình là như sau: theMatch: 10:20:30 IBM 127.0.0.0 HP Time: 10:20:30 IP: 127.0.0.0 Company: HP Điều gì xảy ra? Tại sao nhóm Company chỉ thể hiện giá trị HP. Còn chuỗi đầu tiên ở đâu hay là không được tìm thấy? Câu trả lời chính xác là mục thứ hai đã viết chồng mục đầu. Tuy nhiên, Group vẫn lưu giữ cả hai giá trị. Và ta dùng tập hợp Capture để lấy các giá trị này. Ví dụ minh họa 10.9: Tìm hiểu tập hợp CaptureCollection. ----------------------------------------------------------------------------- namespace Programming_CSharp { using System; using System.Text.RegularExpressions; class Test 300 Xử Lý Chuỗi Ngôn Ngữ Lập Trình C# { public static void Main() { // tạo một chuỗi để phân tích // lưu ý là tên công ty được xuất // hiện cả hai nơi string string1 = “10:20:30 IBM 127.0.0.0 HP”; // biểu thức quy tắc với việc nhóm hai lần tên công ty Regex theReg = new Regex(@”(?(\d|\:)+)\s” + @”(?\S+)\s” + @”(?(\d|\ .)+)\s” + @”(?\S+)\s”); // đưa vào tập hợp các chuỗi được tìm thấy MatchCollection theMatches = theReg.Matches( string1 ); // dùng vòng lặp để lấy kết quả ...
Tìm kiếm theo từ khóa liên quan:
giáo trình đại học tài liệu mạng giáo trình cơ điện giáo trình thiết kế tài liệu kế toánGợi ý tài liệu liên quan:
-
Giáo trình phân tích một số loại nghiệp vụ mới trong kinh doanh ngân hàng quản lý ngân quỹ p5
7 trang 470 0 0 -
MARKETING VÀ QUÁ TRÌNH KIỂM TRA THỰC HIỆN MARKETING
6 trang 294 0 0 -
122 trang 210 0 0
-
QUY CHẾ THU THẬP, CẬP NHẬT SỬ DỤNG CƠ SỞ DỮ LIỆU DANH MỤC HÀNG HÓA BIỂU THUẾ
15 trang 199 1 0 -
BÀI GIẢNG KINH TẾ CHÍNH TRỊ MÁC - LÊNIN - TS. NGUYỄN VĂN LỊCH - 5
23 trang 196 0 0 -
Giáo trình chứng khoán cổ phiếu và thị trường (Hà Hưng Quốc Ph. D.) - 4
41 trang 190 0 0 -
Giáo trình hướng dẫn phân tích các thao tác cơ bản trong computer management p6
5 trang 186 0 0 -
BÀI GIẢNG LÝ THUYẾT MẠCH THS. NGUYỄN QUỐC DINH - 1
30 trang 168 0 0 -
Giáo trình phân tích giai đoạn tăng lãi suất và giá trị của tiền tệ theo thời gian tích lũy p10
5 trang 164 0 0 -
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - NGÂN HÀNG ĐỀ THI HẾT HỌC PHẦN HỌC PHẦN: TOÁN KINH TẾ
9 trang 160 0 0