5 cách ép cân dữ liệu
Số trang: 15
Loại file: pdf
Dung lượng: 275.91 KB
Lượt xem: 9
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
5 cách "ép cân" dữ liệu Không chỉ giúp tiết kiệm chi phí, việc giảm dung lượng dữ liệu còn là giải pháp để giảm tải cho hạ tầng mạng và hệ thống sao lưu dữ liệu.Với nhu cầu lưu trữ ngày càng bùng nổ, hầu hết các nhà cung cấp lưu trữ đều yêu cầu người dùng phải giảm tối đa dung lượng dữ liệu cần lưu trữ. Việc này không những giúp giảm chi phí phần cứng, phần mềm, điện năng tiêu thụ và không gian cho trung tâm dữ liệu mà còn giảm áp lực cho hệ...
Nội dung trích xuất từ tài liệu:
5 cách "ép cân" dữ liệu5 cách ép cân dữ liệuKhông chỉ giúp tiết kiệm chi phí, việc giảm dunglượng dữ liệu còn là giải pháp để giảm tải cho hạtầng mạng và hệ thống sao lưu dữ liệu. Với nhu cầu lưu trữ ngày càng bùng nổ, hầuhết các nhà cung cấp lưu trữ đều yêu cầu ngườidùng phải giảm tối đa dung lượng dữ liệu cầnlưu trữ. Việc này không những giúp giảm chi phíphần cứng, phần mềm, điện năng tiêu thụ vàkhông gian cho trung tâm dữ liệu mà còn giảmáp lực cho hệ thống mạng và sao lưu dữ liệu.Nhưng làm thế nào để chọn được k ỹ thuật giảmdung lượng dữ liệu tốt? Trước hết, bạn cần xácđịnh được công ty/doanh nghiệp đang sử dụngdữ liệu như thế nào và các khoản chi phí tiếtkiệm được khi sử dụng phương pháp giảm dunglượng?Chọn được kỹ thuật giảm dung lượng dữ liệu tốtkhông chỉ tùy thuộc vào đặc thù công việc vàloại dữ liệu cần lưu trữ. Chẳng hạn, phươngpháp chống trùng lặp thường không mang lạihiệu quả đáng kể cho dữ liệu X-quang, dữ liệuthử nghiệm kỹ thuật, phim và nhạc; tuy nhiênphương pháp này có thể làm giảm đáng kể chiphí sao lưu trên các máy ảo. Sau đây là 5 kỹthuật giảm dung lượng lưu trữ thường được sửdụng.1. Chống trùng lặpChống trùng lặp là quá trình tìm kiếm và loại bỏdữ liệu trùng nhau được lưu trữ tại nhiều khônggian lưu trữ khác nhau (như đĩa cứng, bộnhớ…), có thể giảm đến 90% dung lượng cầnlưu trữ. Chẳng hạn, thông qua kỹ thuật chốngtrùng lặp, bạn có thể đảm bảo rằng mình chỉ lưu1 bản sao tập tin đính kèm được gửi tới hàngtrăm nhân viên. Chống trùng lặp đã trở thànhmột trong những yêu cầu thực tế trong việc saolưu, lưu trữ cũng như bất kỳ hình thức lưu trữthứ cấp nào, nơi tốc độ truy cập không quantrọng bằng yêu cầu giảm tình trạng giẫm chândữ liệu.Ví dụ, với công cụ Virtual Tape Library của hãngFalconStor, một tổ chức y tế có thể giảm đến 72lần dung lượng lưu trữ nhờ kỹ thuật chống trùnglặp. Trong khi đó, dịch vụ lưu trữ mây củahãng i365 đạt được tỷ lệ từ 30:1 đến 50:1 trongviệc giảm dung lượng của một khối dữ liệu hỗnhợp gồm Microsoft Exchange, SharePoint, SQLServer và các tập tin trên máy ảo VMware.Dữ liệu có thể được loại bỏ ở cấp độ tập tin haykhối (như tập tin nén). Trong hầu hết trườnghợp, việc lọc nội dung trùng lặp càng chặt chẽsẽ càng giúp tiết kiệm chi phí và không gian lưutrữ. Tuy nhiên, khâu lọc các nội dung trùng nhaucó thể cần nhiều thời gian và qua đó kìm hãmtốc độ truy xuất dữ liệu.Chống trùng lặp dữ liệu có thể được xử lý trước(preprocessing/inline) hoặc sau khi dữ liệu đượclưu vào nơi nhất định (postprocessing). Về cơbản, xử lý sau là lựa chọn tốt nhất nếu bạn cầntốc độ truy xuất dữ liệu nhanh, tuy nhiên bạncũng nên xem xét giải pháp xử lý trước nếu cóđủ thời gian và cần giảm chi phí lưu trữ. Ngoàira, k ỹ thuật chống trùng lặp theo phương phápxử lý trước có thể giảm lượng dữ liệu lưu trữxuống tỷ lệ 20:1, tuy nhiên kỹ thuật này có thểlàm ảnh hưởng đến hiệu năng và buộc ngườidùng phải mua nhiều máy chủ hơn. Cạnh đó,chống trùng lặp theo phương pháp xử lý sau đòihỏi nhiều không gian lưu trữ hơn để làm bộđệm, qua đó làm giảm dung lượng lưu trữ chocác nhu cầu sử dụng khác.Đối với những khách hàng có nhiều máy chủ hay nềntảng lưu trữ, việc chống trùng lặp dữ liệu có thể giúptiết kiệm chi phí bằng cách loại bỏ các bản sao dữliệu trên nhiều nền tảng khác nhau. Người dùng hiệnnay cũng quan tâm đến tính năng chống trùng lặp dữliệu trên hệ thống đơn lẻ để dễ dàng sử dụng hơn trênbất kỳ ứng dụng nào hay cho phép người dùng nạplại dữ liệu (đưa dữ liệu về hiện trạng ban đầu) khicần thiết và tránh hiện tượng không tương thích nhiềuhệ thống. Công cụ chống trùng lặp chính (primarydeduplication products) có thể thực hiện trong khâutiền xử lý (preprocessing) cho đến một ngưỡng nhấtđịnh và sau đó chuyển sang khâu hậu xử lý(postprocessing).Một tùy chọn khác là chống trùng lặp dựa trênchính sách (policy-based deduplication), chophép nhà quản lý dữ liệu lưu trữ chọn các tập tinđể chống trùng lặp, dựa trên kích thước của tậptin, mức độ quan trọng và một số tiêu chí khác.Việc nạp lại các tập tin sẽ làm giảm thời giantruy cập đi chút ít nhưng điều này vẫn tốt hơnviệc thông báo cho khách hàng phải chờ 2 ngàyđể truy cập được tất cả tập tin. Một số giải phápchống trùng lặp và nén tập tin có thể giúp tiếtkiệm đến 50% không gian lưu trữ.2. NénNén là quá trình tìm kiếm và loại bỏ các byte dữliệu trùng lặp. Đây có thể được xem là côngnghệ giảm dung lượng dữ liệu nổi tiếng nhất.Công nghệ này làm việc tốt với cơ sở dữ liệu, e-mail và các tập tin, nhưng lại kém hiệu quả vớitập tin ảnh. Tính năng nén thường đi kèm trongcác hệ thống lưu trữ và bạn cũng có thể dễdàng tìm thấy các ứng dụng hay thiết bị nén dữliệu độc lập.Nén dữ liệu ở chế độ thời gian thực sẽ khônglàm gián đoạn truy cập và giảm hiệu năng bằngcách giải nén trước khi dữ liệu này được thayđổi hay truy xuất, do đó phù hợp cho các ứngdụng trực tuyến như cơ sở dữ liệu và xử lý trêncác ...
Nội dung trích xuất từ tài liệu:
5 cách "ép cân" dữ liệu5 cách ép cân dữ liệuKhông chỉ giúp tiết kiệm chi phí, việc giảm dunglượng dữ liệu còn là giải pháp để giảm tải cho hạtầng mạng và hệ thống sao lưu dữ liệu. Với nhu cầu lưu trữ ngày càng bùng nổ, hầuhết các nhà cung cấp lưu trữ đều yêu cầu ngườidùng phải giảm tối đa dung lượng dữ liệu cầnlưu trữ. Việc này không những giúp giảm chi phíphần cứng, phần mềm, điện năng tiêu thụ vàkhông gian cho trung tâm dữ liệu mà còn giảmáp lực cho hệ thống mạng và sao lưu dữ liệu.Nhưng làm thế nào để chọn được k ỹ thuật giảmdung lượng dữ liệu tốt? Trước hết, bạn cần xácđịnh được công ty/doanh nghiệp đang sử dụngdữ liệu như thế nào và các khoản chi phí tiếtkiệm được khi sử dụng phương pháp giảm dunglượng?Chọn được kỹ thuật giảm dung lượng dữ liệu tốtkhông chỉ tùy thuộc vào đặc thù công việc vàloại dữ liệu cần lưu trữ. Chẳng hạn, phươngpháp chống trùng lặp thường không mang lạihiệu quả đáng kể cho dữ liệu X-quang, dữ liệuthử nghiệm kỹ thuật, phim và nhạc; tuy nhiênphương pháp này có thể làm giảm đáng kể chiphí sao lưu trên các máy ảo. Sau đây là 5 kỹthuật giảm dung lượng lưu trữ thường được sửdụng.1. Chống trùng lặpChống trùng lặp là quá trình tìm kiếm và loại bỏdữ liệu trùng nhau được lưu trữ tại nhiều khônggian lưu trữ khác nhau (như đĩa cứng, bộnhớ…), có thể giảm đến 90% dung lượng cầnlưu trữ. Chẳng hạn, thông qua kỹ thuật chốngtrùng lặp, bạn có thể đảm bảo rằng mình chỉ lưu1 bản sao tập tin đính kèm được gửi tới hàngtrăm nhân viên. Chống trùng lặp đã trở thànhmột trong những yêu cầu thực tế trong việc saolưu, lưu trữ cũng như bất kỳ hình thức lưu trữthứ cấp nào, nơi tốc độ truy cập không quantrọng bằng yêu cầu giảm tình trạng giẫm chândữ liệu.Ví dụ, với công cụ Virtual Tape Library của hãngFalconStor, một tổ chức y tế có thể giảm đến 72lần dung lượng lưu trữ nhờ kỹ thuật chống trùnglặp. Trong khi đó, dịch vụ lưu trữ mây củahãng i365 đạt được tỷ lệ từ 30:1 đến 50:1 trongviệc giảm dung lượng của một khối dữ liệu hỗnhợp gồm Microsoft Exchange, SharePoint, SQLServer và các tập tin trên máy ảo VMware.Dữ liệu có thể được loại bỏ ở cấp độ tập tin haykhối (như tập tin nén). Trong hầu hết trườnghợp, việc lọc nội dung trùng lặp càng chặt chẽsẽ càng giúp tiết kiệm chi phí và không gian lưutrữ. Tuy nhiên, khâu lọc các nội dung trùng nhaucó thể cần nhiều thời gian và qua đó kìm hãmtốc độ truy xuất dữ liệu.Chống trùng lặp dữ liệu có thể được xử lý trước(preprocessing/inline) hoặc sau khi dữ liệu đượclưu vào nơi nhất định (postprocessing). Về cơbản, xử lý sau là lựa chọn tốt nhất nếu bạn cầntốc độ truy xuất dữ liệu nhanh, tuy nhiên bạncũng nên xem xét giải pháp xử lý trước nếu cóđủ thời gian và cần giảm chi phí lưu trữ. Ngoàira, k ỹ thuật chống trùng lặp theo phương phápxử lý trước có thể giảm lượng dữ liệu lưu trữxuống tỷ lệ 20:1, tuy nhiên kỹ thuật này có thểlàm ảnh hưởng đến hiệu năng và buộc ngườidùng phải mua nhiều máy chủ hơn. Cạnh đó,chống trùng lặp theo phương pháp xử lý sau đòihỏi nhiều không gian lưu trữ hơn để làm bộđệm, qua đó làm giảm dung lượng lưu trữ chocác nhu cầu sử dụng khác.Đối với những khách hàng có nhiều máy chủ hay nềntảng lưu trữ, việc chống trùng lặp dữ liệu có thể giúptiết kiệm chi phí bằng cách loại bỏ các bản sao dữliệu trên nhiều nền tảng khác nhau. Người dùng hiệnnay cũng quan tâm đến tính năng chống trùng lặp dữliệu trên hệ thống đơn lẻ để dễ dàng sử dụng hơn trênbất kỳ ứng dụng nào hay cho phép người dùng nạplại dữ liệu (đưa dữ liệu về hiện trạng ban đầu) khicần thiết và tránh hiện tượng không tương thích nhiềuhệ thống. Công cụ chống trùng lặp chính (primarydeduplication products) có thể thực hiện trong khâutiền xử lý (preprocessing) cho đến một ngưỡng nhấtđịnh và sau đó chuyển sang khâu hậu xử lý(postprocessing).Một tùy chọn khác là chống trùng lặp dựa trênchính sách (policy-based deduplication), chophép nhà quản lý dữ liệu lưu trữ chọn các tập tinđể chống trùng lặp, dựa trên kích thước của tậptin, mức độ quan trọng và một số tiêu chí khác.Việc nạp lại các tập tin sẽ làm giảm thời giantruy cập đi chút ít nhưng điều này vẫn tốt hơnviệc thông báo cho khách hàng phải chờ 2 ngàyđể truy cập được tất cả tập tin. Một số giải phápchống trùng lặp và nén tập tin có thể giúp tiếtkiệm đến 50% không gian lưu trữ.2. NénNén là quá trình tìm kiếm và loại bỏ các byte dữliệu trùng lặp. Đây có thể được xem là côngnghệ giảm dung lượng dữ liệu nổi tiếng nhất.Công nghệ này làm việc tốt với cơ sở dữ liệu, e-mail và các tập tin, nhưng lại kém hiệu quả vớitập tin ảnh. Tính năng nén thường đi kèm trongcác hệ thống lưu trữ và bạn cũng có thể dễdàng tìm thấy các ứng dụng hay thiết bị nén dữliệu độc lập.Nén dữ liệu ở chế độ thời gian thực sẽ khônglàm gián đoạn truy cập và giảm hiệu năng bằngcách giải nén trước khi dữ liệu này được thayđổi hay truy xuất, do đó phù hợp cho các ứngdụng trực tuyến như cơ sở dữ liệu và xử lý trêncác ...
Tìm kiếm theo từ khóa liên quan:
mẹo vặt máy tính mẹo khi sử dụng laptop tăng tốc firefox Phím tắt hữu dụng trong máy tính cài đặt phần mềmGợi ý tài liệu liên quan:
-
Thủ thuật chặn web đen bằng phần mềm
10 trang 213 0 0 -
Sửa lỗi các chức năng quan trọng của Win với ReEnable 2.0 Portable Edition
5 trang 211 0 0 -
Giáo trình Bảo trì hệ thống và cài đặt phần mềm
68 trang 205 0 0 -
Sao lưu dữ liệu Gmail sử dụng chế độ Offline
8 trang 200 0 0 -
Đề cương môn học Phân tích thiết kế phần mềm
143 trang 150 0 0 -
YouTube Downloader là phần mềm cho phép bạn tải video từ YouTube
2 trang 148 0 0 -
Cách khắc phục lỗi không thể khởi động ở Windows
11 trang 86 0 0 -
Sử dụng đèn flash thế nào khi chụp ảnh?
3 trang 73 0 0 -
116 trang 54 0 0
-
Giáo trình lắp ráp, cài đặt máy vi tính - Bài 1
9 trang 45 0 0