Bài giảng Ngôn ngữ hình thức và otomat - Nguyễn Văn Định
Số trang: 85
Loại file: pdf
Dung lượng: 2.79 MB
Lượt xem: 15
Lượt tải: 0
Xem trước 9 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Tập bài giảng Ngôn ngữ hình thức và otomat trang bị cho sinh viên ngành Tin học các khái niệm về ngôn ngữ hình thức, các otomat, máy Turing…Trên cơ sở đó, sinh viên có thể hiểu sâu hơn cấu trúc các ngôn ngữ lập trình, các chương trình dịch cũng như bản chất của thuật toán và độ phức tạp tính toán của chúng. Nội dung chính của bài giảng gồm 4 chương như sau: Văn phạm và ngôn ngữ hình thức, otomat hữu hạn và ngôn ngữ chính quy, otomat đẩy xuống và ngôn ngữ phi ngữ cảnh, máy turing. Mời các bạn cùng tham khảo.
Nội dung trích xuất từ tài liệu:
Bài giảng Ngôn ngữ hình thức và otomat - Nguyễn Văn Định Văn Địn h ng u yễ n Ữ Ứ thuvienpdf.com Bài Giảng Môn học: OTOMAT VÀ NGÔN NGỮ HÌNH THỨC TS. Nguyễn Văn Định, Khoa CNTT Lời nói đầu Ngôn ngữ là phương tiện để giao tiếp, sự giao tiếp có thể hiểu là giao tiếp giữa con người với nhau, giao tiếp giữa người với máy, hay giao tiếp giữa máy với máy. Ngôn ngữ để con người có thể giao tiếp với nhau được gọi là ngôn ngữ tự nhiên, chẳng hạn như tiếng Anh, tiếng Nga, tiếng Việt… là các ngôn ngữ tự nhiên. Các quy tắc cú pháp của ngôn ngữ tự nhiên nói chung rất phức tạp nhưng các yêu cầu nghiêm ngặt về ngữ nghĩa thì lại thiếu chặt chẽ, chẳng hạn cùng một từ hay cùng một câu ta có thể hiểu chúng theo những nghĩa khác nhau tùy theo từng ngữ cảnh cụ thể. Con người muốn giao tiếp với máy tính tất nhiên cũng thông qua ngôn ngữ. Để có sự giao tiếp giữa người với máy hay giữa máy với nhau, cần phải có một ngôn ngữ với các quy tắc cú pháp chặt chẽ hơn so với các ngôn ngữ tự nhiên, nói cách khác, với một từ hay một câu thì ngữ nghĩa của chúng phải là duy nhất mà không phụ thuộc vào ngữ cảnh. Những ngôn ngữ như thế được gọi là ngôn ngữ hình thức. Con người muốn máy tính thực hiện công việc, phải viết các yêu cầu đưa cho máy bằng ngôn ngữ máy hiểu được. Việc viết các yêu cầu như thế gọi là lập trình. Ngôn ngữ dùng để lập trình được gọi là ngôn ngữ lập trình. Các ngôn ngữ lập trình đều là các ngôn ngữ hình thức. Cả ngôn ngữ hình thức lẫn ngôn ngữ tự nhiên đều có thể xem như những tập các từ, tức là các xâu hữu hạn các phần tử của một bộ chữ cái cơ sở nào đó. Về mặt truyền thống, lý thuyết ngôn ngữ hình thức liên quan đến các đặc tả cú pháp của ngôn ngữ nhiều hơn là đến những vấn đề ngữ nghĩa. Một đặc tả về cú pháp của một ngôn ngữ có hữu hạn từ, ít nhất về nguyên tắc, có thể được cho bằng cách liệt kê các từ. Điều đó không thể áp dụng đối với các ngôn ngữ có vô hạn từ. Nhiệm vụ chính của lý thuyết ngôn ngữ hình thức là nghiên cứu các cách đặc tả hữu hạn của các ngôn ngữ vô hạn. Lý thuyết tính toán cũng như của nhiều ngành khác nhau của nó, chẳng hạn mật mã học, có liên quan mật thiết với lý thuyết ngôn ngữ. Các tập vào và ra của một thiết bị tính toán có thể được xem như các ngôn ngữ và nói một cách sâu sắc hơn thì các mô hình tính toán có thể được đồng nhất với các lớp các đặc tả ngôn ngữ theo nghĩa mà trong bài giảng này chúng ta sẽ nêu chính xác hơn. Chẳng hạn, các máy Turing có thể được đồng nhất với các văn phạm cấu trúc câu, các otomat hữu hạn có thể đồng nhất với các văn phạm chính quy. Môn học otomat và ngôn ngữ hình thức nhằm trang bị cho sinh viên các năm cuối của ngành Tin học các khái niệm về ngôn ngữ hình thức, các otomat, máy Turing…Trên cơ sơ đó, sinh viên có thể hiểu sâu hơn cấu trúc các ngôn ngữ lập trình, các chương trình dịch cũng như bản chất của thuật toán và độ phức tạp tính toán của chúng. Trong khi chưa có điều kiện biên soạn một giáo trình cho môn học này, chúng tôi tạm thời cung cấp cho sinh viên ngành Tin học tập bài giảng này, để làm tài liệu tham khảo và học tập. Do thời gian biên soạn có hạn nên chắc rằng tập bài giảng này còn nhiều thiếu sót, rất mong nhận được những ý kiến đóng góp của các em sinh viên và đồng nghiệp. 1 Chương 1 VĂN PHẠM VÀ NGÔN NGỮ HÌNH THỨC Trong chương này, chúng ta đề cập đến một số khái niệm và kết quả cơ bản liên quan đến văn phạm và ngôn ngữ hình thức. § 1. Các khái niệm cơ bản về ngôn ngữ hình thức 1.1 Bảng chữ cái 1.2 Từ 1.3 Ngôn ngữ § 2. Các phép toán trên các từ 2.1 Phép nhân ghép 2.2 Phép lấy từ ngược 2.3 Phép chia từ § 3. Các phép toán trên ngôn ngữ 3.1 Phép hợp 3.2 Phép giao 3.3 Phép lấy phần bù 3.4 Phép nhân ghép 3.5 Phép lặp 3.6 Phép lấy ngôn ngữ ngược 3.7 Phép chia ngôn ngữ § 4. Văn phạm và ngôn ngữ sinh bởi văn phạm 4.1 Định nghĩa văn phạm 4.2 Ngôn ngữ sinh bởi văn pham 4.3 Phân loại văn phạm theo Chomsky § 5. Các tính chất của văn phạm và ngôn ngữ 5.1 Tính chất của văn phạm và dẫn xuất 5.2 Tính đóng của lớp ngôn ngữ sinh bởi văn phạm 2 §1. Các khái niệm cơ bản về ngôn ngữ hình thức 1.1 Bảng chữ cái Định nghĩa 1.1 Tập Σ khác rỗng gồm hũu hạn hay vô hạn các ký hiệu được gọi là bảng chữ cái. Mỗi phần tử a∈ Σ được gọi là một chữ cái hay một ký hiệu. Thí dụ 1.1 Dưới đây là các bảng chữ cái: 1. ∑ = {a, b, c, … , x, y, z} 2. Δ = {α, β, γ, δ, ε, η, ϕ, κ, μ, χ, ν, π, θ, ρ, σ, τ, ω,ξ, ψ}, 3. Г = {0, 1}, 4. W = {if, then, else, a, b, c, d, e, f, +, −, ∗, /, =, ≠}. 1.2 Từ Định nghĩa 1.2 Giả sử có bảng chữ cái Σ = {a1, a2, …, am }, một dãy các chữ cái α = ai1 ai2 …ait, với aij ∈ Σ (1 ≤ j ≤ t) được gọi là một từ hay một xâu trên bảng chữ cái Σ. Tổng số vị trí của các ký hiệu xuất hiện trong xâu α được gọi là độ dài của từ α và ký hiệu là | α |. Như vậy, một từ trên bảng chữ cái Σ là một xâu hữu hạn gồm một số lớn hơn hay bằng không các chữ cái của Σ, trong đó một chữ cái có thể xuất hiện nhiều lần. Xâu không có chữ cái nào được gọi là từ rỗng và được ký hiệu là ε. Rõ ràng từ rỗng là từ thuộc mọi bảng chữ cái. Hai từ α = a1a2…an và β = b1b2…bm được gọi là bằng nhau, và được ký hiệu là α = β, nếu n = m và ai = bi với mọi i = 1, 2, …, n. Nếu α là một từ trên bảng chữ cái Σ, và Σ ⊆ Δ thì α cũng là từ trên bảng chữ cái Δ. Tập mọi từ trên bảng chữ cái Σ được ký hiệu là Σ* , còn tập mọi từ khác rỗng trên bảng chữ cái Σ được ký hiệu là Σ+. Như vậy Σ+ = Σ* \ {ε} và Σ* = Σ+ ∪ {ε}. Dễ thấy rằng các tập Σ* và Σ+ là vô hạn. Về cấu trúc đại số thì Σ* là một vị nhóm tự do sinh bởi Σ với đơn vị là từ rỗng ε, còn Σ+ là một ...
Nội dung trích xuất từ tài liệu:
Bài giảng Ngôn ngữ hình thức và otomat - Nguyễn Văn Định Văn Địn h ng u yễ n Ữ Ứ thuvienpdf.com Bài Giảng Môn học: OTOMAT VÀ NGÔN NGỮ HÌNH THỨC TS. Nguyễn Văn Định, Khoa CNTT Lời nói đầu Ngôn ngữ là phương tiện để giao tiếp, sự giao tiếp có thể hiểu là giao tiếp giữa con người với nhau, giao tiếp giữa người với máy, hay giao tiếp giữa máy với máy. Ngôn ngữ để con người có thể giao tiếp với nhau được gọi là ngôn ngữ tự nhiên, chẳng hạn như tiếng Anh, tiếng Nga, tiếng Việt… là các ngôn ngữ tự nhiên. Các quy tắc cú pháp của ngôn ngữ tự nhiên nói chung rất phức tạp nhưng các yêu cầu nghiêm ngặt về ngữ nghĩa thì lại thiếu chặt chẽ, chẳng hạn cùng một từ hay cùng một câu ta có thể hiểu chúng theo những nghĩa khác nhau tùy theo từng ngữ cảnh cụ thể. Con người muốn giao tiếp với máy tính tất nhiên cũng thông qua ngôn ngữ. Để có sự giao tiếp giữa người với máy hay giữa máy với nhau, cần phải có một ngôn ngữ với các quy tắc cú pháp chặt chẽ hơn so với các ngôn ngữ tự nhiên, nói cách khác, với một từ hay một câu thì ngữ nghĩa của chúng phải là duy nhất mà không phụ thuộc vào ngữ cảnh. Những ngôn ngữ như thế được gọi là ngôn ngữ hình thức. Con người muốn máy tính thực hiện công việc, phải viết các yêu cầu đưa cho máy bằng ngôn ngữ máy hiểu được. Việc viết các yêu cầu như thế gọi là lập trình. Ngôn ngữ dùng để lập trình được gọi là ngôn ngữ lập trình. Các ngôn ngữ lập trình đều là các ngôn ngữ hình thức. Cả ngôn ngữ hình thức lẫn ngôn ngữ tự nhiên đều có thể xem như những tập các từ, tức là các xâu hữu hạn các phần tử của một bộ chữ cái cơ sở nào đó. Về mặt truyền thống, lý thuyết ngôn ngữ hình thức liên quan đến các đặc tả cú pháp của ngôn ngữ nhiều hơn là đến những vấn đề ngữ nghĩa. Một đặc tả về cú pháp của một ngôn ngữ có hữu hạn từ, ít nhất về nguyên tắc, có thể được cho bằng cách liệt kê các từ. Điều đó không thể áp dụng đối với các ngôn ngữ có vô hạn từ. Nhiệm vụ chính của lý thuyết ngôn ngữ hình thức là nghiên cứu các cách đặc tả hữu hạn của các ngôn ngữ vô hạn. Lý thuyết tính toán cũng như của nhiều ngành khác nhau của nó, chẳng hạn mật mã học, có liên quan mật thiết với lý thuyết ngôn ngữ. Các tập vào và ra của một thiết bị tính toán có thể được xem như các ngôn ngữ và nói một cách sâu sắc hơn thì các mô hình tính toán có thể được đồng nhất với các lớp các đặc tả ngôn ngữ theo nghĩa mà trong bài giảng này chúng ta sẽ nêu chính xác hơn. Chẳng hạn, các máy Turing có thể được đồng nhất với các văn phạm cấu trúc câu, các otomat hữu hạn có thể đồng nhất với các văn phạm chính quy. Môn học otomat và ngôn ngữ hình thức nhằm trang bị cho sinh viên các năm cuối của ngành Tin học các khái niệm về ngôn ngữ hình thức, các otomat, máy Turing…Trên cơ sơ đó, sinh viên có thể hiểu sâu hơn cấu trúc các ngôn ngữ lập trình, các chương trình dịch cũng như bản chất của thuật toán và độ phức tạp tính toán của chúng. Trong khi chưa có điều kiện biên soạn một giáo trình cho môn học này, chúng tôi tạm thời cung cấp cho sinh viên ngành Tin học tập bài giảng này, để làm tài liệu tham khảo và học tập. Do thời gian biên soạn có hạn nên chắc rằng tập bài giảng này còn nhiều thiếu sót, rất mong nhận được những ý kiến đóng góp của các em sinh viên và đồng nghiệp. 1 Chương 1 VĂN PHẠM VÀ NGÔN NGỮ HÌNH THỨC Trong chương này, chúng ta đề cập đến một số khái niệm và kết quả cơ bản liên quan đến văn phạm và ngôn ngữ hình thức. § 1. Các khái niệm cơ bản về ngôn ngữ hình thức 1.1 Bảng chữ cái 1.2 Từ 1.3 Ngôn ngữ § 2. Các phép toán trên các từ 2.1 Phép nhân ghép 2.2 Phép lấy từ ngược 2.3 Phép chia từ § 3. Các phép toán trên ngôn ngữ 3.1 Phép hợp 3.2 Phép giao 3.3 Phép lấy phần bù 3.4 Phép nhân ghép 3.5 Phép lặp 3.6 Phép lấy ngôn ngữ ngược 3.7 Phép chia ngôn ngữ § 4. Văn phạm và ngôn ngữ sinh bởi văn phạm 4.1 Định nghĩa văn phạm 4.2 Ngôn ngữ sinh bởi văn pham 4.3 Phân loại văn phạm theo Chomsky § 5. Các tính chất của văn phạm và ngôn ngữ 5.1 Tính chất của văn phạm và dẫn xuất 5.2 Tính đóng của lớp ngôn ngữ sinh bởi văn phạm 2 §1. Các khái niệm cơ bản về ngôn ngữ hình thức 1.1 Bảng chữ cái Định nghĩa 1.1 Tập Σ khác rỗng gồm hũu hạn hay vô hạn các ký hiệu được gọi là bảng chữ cái. Mỗi phần tử a∈ Σ được gọi là một chữ cái hay một ký hiệu. Thí dụ 1.1 Dưới đây là các bảng chữ cái: 1. ∑ = {a, b, c, … , x, y, z} 2. Δ = {α, β, γ, δ, ε, η, ϕ, κ, μ, χ, ν, π, θ, ρ, σ, τ, ω,ξ, ψ}, 3. Г = {0, 1}, 4. W = {if, then, else, a, b, c, d, e, f, +, −, ∗, /, =, ≠}. 1.2 Từ Định nghĩa 1.2 Giả sử có bảng chữ cái Σ = {a1, a2, …, am }, một dãy các chữ cái α = ai1 ai2 …ait, với aij ∈ Σ (1 ≤ j ≤ t) được gọi là một từ hay một xâu trên bảng chữ cái Σ. Tổng số vị trí của các ký hiệu xuất hiện trong xâu α được gọi là độ dài của từ α và ký hiệu là | α |. Như vậy, một từ trên bảng chữ cái Σ là một xâu hữu hạn gồm một số lớn hơn hay bằng không các chữ cái của Σ, trong đó một chữ cái có thể xuất hiện nhiều lần. Xâu không có chữ cái nào được gọi là từ rỗng và được ký hiệu là ε. Rõ ràng từ rỗng là từ thuộc mọi bảng chữ cái. Hai từ α = a1a2…an và β = b1b2…bm được gọi là bằng nhau, và được ký hiệu là α = β, nếu n = m và ai = bi với mọi i = 1, 2, …, n. Nếu α là một từ trên bảng chữ cái Σ, và Σ ⊆ Δ thì α cũng là từ trên bảng chữ cái Δ. Tập mọi từ trên bảng chữ cái Σ được ký hiệu là Σ* , còn tập mọi từ khác rỗng trên bảng chữ cái Σ được ký hiệu là Σ+. Như vậy Σ+ = Σ* \ {ε} và Σ* = Σ+ ∪ {ε}. Dễ thấy rằng các tập Σ* và Σ+ là vô hạn. Về cấu trúc đại số thì Σ* là một vị nhóm tự do sinh bởi Σ với đơn vị là từ rỗng ε, còn Σ+ là một ...
Tìm kiếm theo từ khóa liên quan:
Bài giảng Ngôn ngữ hình thức Ngôn ngữ hình thức Ngôn ngữ lập trình Chương trình dịch Bản chất của thuật toán Otomat hữu hạn Otomat đẩy xuốngGợi ý tài liệu liên quan:
-
Chuyên đề: Nghiên cứu Ngôn ngữ hình thức, Văn phạm phi ngữ cảnh và Automata đẩy xuống
84 trang 349 0 0 -
Giáo trình Lập trình hướng đối tượng: Phần 2
154 trang 256 0 0 -
Kỹ thuật lập trình trên Visual Basic 2005
148 trang 246 0 0 -
Bài thuyết trình Ngôn ngữ lập trình: Hệ điều hành Window Mobile
30 trang 246 0 0 -
Giáo trình Lập trình cơ bản với C++: Phần 1
77 trang 229 0 0 -
Bài giảng Một số hướng nghiên cứu và ứng dụng - Lê Thanh Hương
13 trang 208 0 0 -
Giáo trình Toán rời rạc: Phần 1 - Đỗ Đức Giáo
238 trang 203 0 0 -
Giáo án Tin học lớp 11 (Trọn bộ cả năm)
125 trang 199 1 0 -
NGÂN HÀNG CÂU HỎI TRẮC NGHIỆM THIẾT KẾ WEB
8 trang 185 0 0 -
Giáo trình Lập trình C căn bản: Phần 1
64 trang 159 0 0