Thông tin tài liệu:
Nội dung kép và phương pháp phát hiện mới cùa Google Google không thích các nội dung kép. Lý do là Google muốn trong trang kết quả tìm kiếm, mười kết quả đầu tiên sẽ là mười trang khác nhau với nội dung khác nhau. Điều này giúp cho người tìm kiếm có nhiều lựa chọn chính xác và đa dạng, hơn là một loạt các nội dung trùng lặp trong top mười này.
Nội dung trích xuất từ tài liệu:
Nội dung kép và phương pháp phát hiện mới cùa GoogleNội dung kép và phương pháp phát hiện mới cùa GoogleGoogle không thích các nội dung kép. Lý do làGoogle muốn trong trang kết quả tìm kiếm, mười kếtquả đầu tiên sẽ là mười trang khác nhau với nội dungkhác nhau. Điều này giúp cho người tìm kiếm cónhiều lựa chọn chính xác và đa dạng, hơn là một loạtcác nội dung trùng lặp trong top mười này.Google sử dụng mô hình ứng dụng mới để xác địnhcác nội dung trùng lặp, nội dung kép. Bọ lọc này sẽgiúp người tìm kiếm không phải chọn phải các nộidung trùng nhau trong trang kết quả tìm kiếm.Nội dung bị trùng lặp như thế nào?Có rất nhiều lý do để nội dung bị lặp lại trên nhiều địachỉ khác nhau, hoặc các tài liệu này có nội dungtương tự :Nội dung trang Web tồn tại dưới nhiều định dạng :Trang Web, phiên bản in, phiên bản PDF, phiên bảnW ord, phiên bản PDA, mobile phone page, v.vNội dung được truyền đi từ trang Web : Ví dụ RSS,XML của các blog cá nhân hay bài viết mới.Hệ thống quản trị tách lọc nội dung (CMS) hiển thịcùng một nội dung cho nhiều lựa chọn khác nhau. Vídụ các mục được sắp xếp theo ngày tháng, tiêu đề,tên hay thể loại.Trang W eb có một phiên bản dự phòng hay một bảnsao nhằm tránh trường hợp trang chính không truycập được hoặc khi có quá nhiều người truy cập vàocùng một trang.Trường hợp ai đó đánh cắp hay lưu lại nội dung trangcủa bạn để rồi đặt nội dung đó trên một trang W ebkhác.Để tránh hiển thị cùng một nội dung nhiều lần trongtrang kết quả tìm kiếm, các máy tìm kiếm sẽ xác địnhnhững trang trùng lặp này.Mô hình ứng dụng lọc nội dung képMô hình ứng dụng lọc nội dung kép mà Google sửdụng được kết hợp từ nhiều phương pháp đã tồn tạitrước đây. Nó cho phép xác định nhưng nội dung saochép, trùng lặp trên Internet.Mô hình ứng dụng mới này cho thấy Google rất coitrọng việc lọc nội dung kép. Đây có lẽ là bước cuốicùng trong kế hoặc tách lọc nội dung kép của Google.Google làm gì khi phát hiện ra nội dung kép?Rất khó có thể nói chính xác Google sẽ làm gì khi tìmthấy nội dung kép. Có rất nhiều nguyên nhân mà việcnhân bản nội dung là hợp lý.Nếu như Google chỉ bỏ nội dung kép khỏi một vàilệnh tìm kiếm thì đó là điều chấp nhận được. Nhưngnếu Google áp dụng các mức phạt bằng cách loại bỏnhững trang này ra khỏi chỉ mục Web thì kết quả tìmkiếm của Google sẽ không còn chính xác đối với mộtsố lệnh tìm kiếm nhất định. Và đương nhiên khi đó,Google có thể phạt nhầm các trang Web mà nội dunghoàn toàn hợp lý.Có vẻ như Google sẽ hiển thị trang Web nổi tiếngnhất với nhiều liên kết trỏ đến nhất trong kết quả tìmkiếm khi nó tìm thấy nội dung kép trên nhiều địa chỉkhác nhau.Làm gì với Website của bạnNếu như bạn muốn trang Web của mình có thứ hạngcao thì bạn nên loại bỏ các nội dung trùng lặp (Sẽquay trở lại với bài viết về cách loại bỏ nội dung trunglặp với thẻ nofollow, meta, robots.txt, remove URL.Hãy tạo ra những nội dung có ích và phong phú trêntrang của mình. Đây là cách làm tốt nhất vì tớ luônquan niệm “Content is King“.Ngoài ra, nếu trang Web của bạn sử dụng cùng nộidung như nhiều trang khác thì hãy cố gắng có nhiềuliên kết trỏ đến hơn tất cả những trang còn lại mà cócùng một nội dung.