Danh mục

Bài giảng Cấu trúc dữliệu và giải thuật: Nén dữ liệu - Đậu Ngọc Hà Dương

Số trang: 88      Loại file: pptx      Dung lượng: 623.42 KB      Lượt xem: 14      Lượt tải: 0    
10.10.2023

Phí tải xuống: 23,000 VND Tải xuống file đầy đủ (88 trang) 0
Xem trước 9 trang đầu tiên của tài liệu này:

Thông tin tài liệu:

Bài giảng Cấu trúc dữliệu và giải thuật: Nén dữ liệu - Đậu Ngọc Hà Dương có nội dung giới thiệu về nén dữ liệu, một số khái niệm liên quan, giải thuật nén Huffman tĩnh,... Mời các bạn cùng tham khảo!
Nội dung trích xuất từ tài liệu:
Bài giảng Cấu trúc dữliệu và giải thuật: Nén dữ liệu - Đậu Ngọc Hà DươngCấutrúcdữliệuvàgiảithuật NÉN DỮ LiỆU Giảng viên: Đậu Ngọc Hà Dương Nội dung trình bày2 CấutrúcdữliệuvàgiảithuậtHCMUS2011 Giới thiệu3  Thuậtngữ:  Data compression  Encoding  Decoding  Lossless data compression  Lossy data compression  … CấutrúcdữliệuvàgiảithuậtHCMUS2011 Giới thiệu4  Néndữliệu  Nhu cầu xuất hiện ngay sau khi hệ thống máy tính đầu tiên ra đời.  Hiện nay, phục vụ cho các dạng dữ liệu đa phương tiện  Tăng tính bảo mật.  Ứngdụng:  Lưu trữ Cấutrúcd ữliệuvàgiảithuậtHCMUS2011  Truyền dữ liệu Giới thiệu5  Nguyêntắc:  Encode và decode sử dụng cùng một scheme. encode decode CấutrúcdữliệuvàgiảithuậtHCMUS2011 Khái niệm6  Tỷlệnén(Datacompressionratio)  Tỷ lệ giữa kích thước của dữ liệu nguyên thủy và của dữ liệu sau khi áp dụng thuật toán nén.  Gọi: N là kích thước của dữ liệu nguyên thủy,  N1 là kích thước của dữNliệu sau khi nén. R  Tỷ lệ nén R: N1  Ví dụ: Cấutrúcd ữliệuvàgiảithuậtHCMUS2011  Dữ liệu ban đầu 8KB, nén còn 2 KB. Tỷ lệ nén: 4-1 Khái niệm7  Tỷlệnén(Datacompressionratio)  Về khả năng tiết kiệm không gian: Tỷ lệ của việc giảm kích thước dữ liệu sau khi áp dụng thuật toán nén.  Gọi: N là kích thước của dữ liệu nguyên thủy,  N1 là kích thước của dữ N liệu sau khi nén. R 1 1  Tỷ lệ nén R: N  Ví dụ: Cấutrúcd ữliệuvàgiảithuậtHCMUS2011  Dữ liệu ban đầu 8KB, nén còn 2 KB. Tỷ lệ nén: 75% Khái niệm8  Néndữliệukhôngmấtmátthôngtin(Lossless datacompression)  Cho phép dữ liệu nén được phục hồi nguyên vẹn như dữ liệu nguyên thủy (lúc chưa được nén).  Ví dụ:  Run-length encoding  LZW …  Ứng dụng:  Ảnh Cấutrúcd PCX,ảithu ữliệuvàgi GIF, PNG,.. ậtHCMUS2011 Khái niệm9  Néndữliệumấtmátthôngtin(Lossydata compression)  Dữ liệu nén được phục hồi  không giống hoàn toàn với dữ liệu nguyên thủy;  gần đủ giống để có thể sử dụng được.  Ứng dụng:  Dùng để nén dữ liệu đa phương tiện (hình ảnh, âm thanh, video):  Ảnh: JPEG, DjVu; CấutrúcdữliệÂm thanh: ảithuAAC, MP2, MP3;  uvàgi ậtHCMUS201110 Nén Huffman tĩnh CấutrúcdữliệuvàgiảithuậtHCMUS2011 Giới thiệu11  Mongmuốn:  Một giải thuật nén bảo toàn thông tin;  Không phụ thuộc vào tính chất của dữ liệu;  Ứng dụng rộng rãi trên bất kỳ dữ liệu nào, với hiệu suất tốt. CấutrúcdữliệuvàgiảithuậtHCMUS2011 Giới thiệu12  Tưtưởngchính:  Phương pháp cũ: dùng 1 dãy bit cố định để biểu diễn 1 ký tự  David Huffman (1952): tìm ra phương pháp xác định mã tối ưu trên dữ liệu tĩnh :  Sử dụng vài bit để biểu diễn 1 ký tự (gọi là “mã bit” – bit code)  Độ dài “mã bit” cho các ký tự không giống nhau:  Ký tự xuất hiện nhiều lần: biểu diễn bằng mã ngắn; CấutrúcdữliệuvàgiảithuậtHCMUS2011  Ký tự xuất hiện ít : biểu diễn bằng mã dài Giới thiệu13  Giảsửcódữliệusauđây: ADDAABBCCBAAABBCCCBBBCDAADDEEAA Kýtự Tầnsốxuấthiện A 10 B 8 C 6 D 5 E 2  Biểudiễn8bit/kýtựcần: CấutrúcdữliệuvàgiảithuậtHCMUS2011 (10 + 8 + 6 + 5 + 2) * 8 = 248 bit Giới thiệu14  Dữliệu: ADDAABBCCBAAABBCCCBBBCDAADDEEAA  BiểudiễnbKýtự ằngchiềudàithayđ Tầnsố i: ổMã ...

Tài liệu được xem nhiều: