Thông tin tài liệu:
Ý kiến của Google về trùng lặp nội dung Trùng lặp nội dung luôn là một đề tài nhiều webmaster quan tâm, chúng tôi nghĩ rằng đây là thời điểm thích hợp nhất để giải thích vài lời về những thắc mắc chung của các webmaster mà chúng tôi hay gặp trên các conference và Webmaster Help Group. Trước khi đi vào vấn đề chính, tôi muốn nói sơ qua về lo lắng chung của các webmaster: hầu hết các webmaster không muốn một bên thứ 3 (third-party) lấy các nội dung trên site của họ và đăng lên một...
Nội dung trích xuất từ tài liệu:
Ý kiến của Google về trùng lặp nội dung Ý kiến của Google về trùng lặp nội dung Trùng lặp nội dung luôn là một đề tài nhiều webmaster quan tâm, chúng tôi nghĩ rằng đây là thời điểm thích hợp nhất để giải thích vài lời về những thắc mắc chung của các webmaster mà chúng tôi hay gặp trên các conference và Webmaster Help Group.Trước khi đi vào vấn đề chính, tôi muốn nói sơqua về lo lắng chung của các webmaster: hầu hếtcác webmaster không muốn một bên thứ 3(third-party) lấy các nội dung trên site của họ vàđăng lên một site khác mà không có sự đồng ýcủa họ(scrap). Chúng tôi nhận thấy rằng đây làkhông hẳn là lỗi cúa webmaster site đã mượnnội dung của bạn, các nội dung tương tự xuấthiện trên các site khác nhau không bị coi là viphạm webmaster guidelines của Google. Vì vậychúng tôi luôn thực hiện quá trình xác địnhnguồn gốc của nội dung đó, trong đa số trườnghợp nội dung gốc được xác định chính xác,không có nhầm lẫn giữa đâu là gốc đâu là copylại.Nói chung, chúng tôi chia vấn đề trùng lặp nộidung thành 2 trường hợp:1. Sao chép nội dung ngay trong site của bạn:cùng một bài viết xuất hiện ở nhiều nơi khácnhau trên site của bạn (thường là không cố ý)2. Sao chép nội dung từ các site khác: bài viếttrên site của bạn xuất hiện trên các site khác(cũng là không cố ý)Trong trường hợp đầu tiên, bạn có thể tự xử lýđể tránh Google index các nội dung trùng lặptrên site của bạn. Hãy tham khảo bài viết Deftlydealing with duplicate content của Adam Lasnikvà Duplicate content summit at SMX Advancedcủa Vanessa Fox, cả hai đã đưa ra một số mẹohay giúp bạn giải quyết vấn đề trùng lặp nộidung trên site của bạn. Tôi xin bổ sung một mẹonhỏ để giúp site của bạn tránh bị Google crawlvề nội dung trùng lặp: đưa URL của nội dunggốc vào sitemap. Khi gặp một page khác cócùng nội dung, bạn sẽ nhận ra ngay lập tức, từđó quyết định giữ lại bản nào, xoá đi bản nào.Bạn có thể tìm thêm thông tin bổ sung trên HelpCenter article.Trong trường hợp thứ hai, một ai đó lấy nộidung của bạn post lên một site khác, thường đểkiếm lợi từ nội dung đó. Ví dụ điển hình: rấtnhiều trang web proxy đã dùng một phần khônggian trên site của mình để hiển thị một site khác.Khi gặp một nội dung xuất hiện trên các sitekhác nhau như vậy, chúng tôi dựa vào rất nhiềudấu hiệu khác nhau để xác định đâu là bản gốc.Vì thế, bạn không nên quá lo lắng rằng site củamình sẽ không được hiển thị trên kết quả tìmkiếm của Google khi có một site khác scrap nộidung của bạn.Cũng có những trường hợp bạn sẵn sàng sharenội dung của mình (syndicate) nhưng cũngmuốn chắc chắn rằng site của bạn được xác địnhlà nội dung nguyên bản, hãy yêu cầu các đối táccung cấp nội dung của bạn đính kèm một đườnglink đến nội dung nguyên bản của bạn. Bạn cóthể tìm được thêm một số hướng dẫn về cungcấp nội dung trong bài viết Ranking as theoriginal source for content you syndicate.củaVanessa Fox.