Danh mục

Bài giảng Các hệ thống phân tán và ứng dụng: Chương 6 - TS. Đặng Tuấn Linh

Số trang: 47      Loại file: pdf      Dung lượng: 3.40 MB      Lượt xem: 11      Lượt tải: 0    
Jamona

Hỗ trợ phí lưu trữ khi tải xuống: 9,000 VND Tải xuống file đầy đủ (47 trang) 0
Xem trước 5 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng "Các hệ thống phân tán và ứng dụng: Chương 6 - Tính chịu lỗi" trình bày các nội dung chính sau đây: Khả năng phục hồi của các tiến trình; Trao đổi thông tin client-server tin cậy; Trao đổi thông tin nhóm tin cậy; Commit phân tán;... Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Các hệ thống phân tán và ứng dụng: Chương 6 - TS. Đặng Tuấn LinhCÁC HỆ THỐNG PHÂN TÁN VÀ ỨNG DỤNGChương 6: Tính chịu lỗi 2 Nội dung3 1. Mở đầu 2. Khả năng phục hồi của các tiến trình 3. Trao đổi thông tin client-server tin cậy 4. Trao đổi thông tin nhóm tin cậy 5. Commit phân tán 6. Phục hồi1. Mở đầu1.1. Các khái niệm cơ bản1.2. Các mô hình lỗi1.3. Che giấu lỗi bởi sự dư thừa 4 1.1. Khái niệm cơ bản5 ¨ Khả năng chịu lỗi liên quan đến khái niệm hệ thống đáng tin cậy: ¤ Tính sẵn sàng (Availability) ¤ Tính tin cậy (Reliability) ¤ Tính an toàn (Safety) ¤ Khả năng bảo trì được (Maintainability) ¨ Các khái niệm cơ bản: n Fail/Fault n Fault Tolerance n Transient Faults (lỗi tạm thời) n Intermittent Faults (lỗi liên tục) n Permanent Faults (lỗi lâu dài) 1.2. Các mô hình lỗi6 ¨ Các kiểu lỗi khác nhau Kiểu lỗi Mô tả Crash failure A server halts, but is working correctly until it halts Omission failure Aserver fails to respond to incoming requests Receive omission A server falls to receive incoming messages Send omission A server falls to send messages Timing failure A servers response lies outside the specified time interval Response failure A servers response is incorrect Value failure The value of the response is wrong State transition failure The server deviates from the correct flow of control Arbitrary failure A server may produce arbitrary responses at arbitrary times Fail-stop failure A server stops producing output and its halting can be detected by other systems Fail-silent failure Another process may incorrectly conclude that a server has halted Fail-safe A server produces random output which is recognized by other processes as plain junk 1.3. Che giấu lỗi với sự dư thừa7 ¨ 3 kiểu ¤ Dư thừa thông tin ¤ Dư thừa thời gian ¤ Dư thừa thiết bị vật lý ¨ VD1: Triple Modular Redundancy (TMR) ¨ VD2: RAID 12. Khả năng phục hồicủa các tiến trình2.1. Vấn đề thiết kế2.2. Che giấu lỗi và sao lưu2.3. Thống nhất trong hệ thống lỗi2.4. Phát hiện lỗi 8 2.1. Các vấn đề thiết kế (1/3)9 ¨ Nhóm tiến trình ¤ Hướng tiếp cận: Tổ chức nhiều tiến trình giống nhau vào cùng 1 nhóm ¤ Đặc điểm chính: các thông điệp gửi đến nhóm sẽ được gửi cho tất cả các tiến trình trong nhóm ¤ Tính cơ động: tạo, hủy nhóm, thêm, bớt tiến trình 2.1. Các vấn đề thiết kế (2/3)10 • Nhóm phẳng và Nhóm phân cấp ¤ So sánh Ưu điểm Nhược điểm Vai trò ngang hàng Không có điểm đơn chịu lỗi Nhóm phẳng Khó ra quyết định Nhóm vẫn hoạt động nếu có 1 vài tiến trình lỗi Nhóm phân cấp Dễ dàng ra quyết định Điểm đơn chịu lỗi 2.1. Các vấn đề thiết kế (3/3)11 ¤ Server tập trung ¨ Hướng tiếp cận - Các yêu cầu gửi đến server - Quản lý csdl - Quản lý các thành viên ¨ Nhược điểm - Điểm đơn chịu lỗi ¤ Kiểu phân tán Hướng tiếp cận: ngang hàng, các thành viên chủ động liên lạc với nhau Nhược điểm: - Lỗi dừng (fail stop): à không phù hợp - Rời hoặc gia nhập nhóm phải đồng bộ các thông điệp đã được gửi ¤ Vấn đề: Nhiều máy trong nhóm hỏng cùng lúc? àgiao thức xây dựng lại nhóm 2.2. Che giấu lỗi và Nhân bản12 • Giao thức dựa trên primary (Primary-based protocols) - Tổ chức nhóm các tiến trình theo kiểu phân cấp - Nếu coordinator (primary) hỏng thì sử dụng các thuật toán bầu chọn để bầu lại • Giao thức ghi trên các bản sao (Replicated-write protocols) - Sử dụng nhân bản tích cực (active replication) hoặc nhân bản dựa trên định số tối thiểu (quorum-based protocols ) - Tổ chức các tiến trình giống nhau vào 1 nhóm phẳng - Gọi là ‘k fault tolerant’ nếu hệ thống có thể hoạt động tốt với k nút hỏng 2.3. Đồng thuận trong các hệ thống có lỗi (1/3)13 • Các trường hợp khác nhau 1. Đồng bộ vs Không đồng bộ 2. Giao tiếp có ngưỡng thời gian hay không 3. Việc nhận thông điệp theo thứ tự hay không 4. Truyền thông điệp theo kiểu unicasting hay multicasting • Các trường ...

Tài liệu được xem nhiều: