Caffeine: Search index mới của Google
Số trang: 3
Loại file: pdf
Dung lượng: 227.11 KB
Lượt xem: 12
Lượt tải: 0
Xem trước 2 trang đầu tiên của tài liệu này:
Thông tin tài liệu:
Caffeine: Search index mới của GoogleGoogle thông báo đã hoàn thành hệ thống search index (đánh chỉ mục) website mới có tên là Caffeine. Caffeine mang lại nhiều hơn 50% kết quả tìm kiếm cấp nhật nhất so với hệ thống cũ, nó là tập hợp nội dung web lớn nhất chúng tôi cung cấp. Nếu blog, forum của bạn có bài post mới bạn có thể tìm thấy ngay trên kết quả tìm kiếm trong thời gian nhanh hơn nhiều so với trước đây. Khi bạn search Google thực chất bạn không tìm kiếm các website thật mà bạn...
Nội dung trích xuất từ tài liệu:
Caffeine: Search index mới của Google Caffeine: Search index mới của GoogleGoogle thông báo đã hoàn thành hệ thống search index (đánh chỉ mục)website mới có tên là Caffeine. Caffeine mang lại nhiều hơn 50% kếtquả tìm kiếm cấp nhật nhất so với hệ thống cũ, nó là tập hợp nội dungweb lớn nhất chúng tôi cung cấp. Nếu blog, forum của bạn có bài postmới bạn có thể tìm thấy ngay trên kết quả tìm kiếm trong thời giannhanh hơn nhiều so với trước đây.Khi bạn search Google thực chất bạn không tìm kiếm các website thật màbạn chỉ đang tìm kiếm những website Google đã Index (Search Index),giống như mục lục ở mỗi cuốn sách giúp bạn tìm kiếm chính xác nội dungmình cần ở trang nào. (Bạn có thể tìm hiểu kỹ hơn về nguyên lý hoạt độngcủa SE tại đây)Tại sao chúng tôi xây dựng hệ thống Index mới? Nội dung website phát triểnchóng mặt, nó không chỉ phát triển về số lượng nội dung mà còn phát triểnnhiều hình thức khác nhau như video, ảnh, tin tức cập nhật thời gian thực.Các webpage nhiều nội dung hơn và ngày càng phức tạp hơn. Hơn nữangười dùng Google cũng đòi hỏi ngày càng cao hơn, họ đòi hỏi tìm thấy nộidung mới nhất và phù hợp nhất. Người xuất bản nội dung thì mong muốnnội dung của họ phải được tìm thấy ngay sau khi xuất bản.Để theo kịp sự tiến hoá của web và đáp ứng nhu cầu của người dùng chúngtôi xây dựng Caffeine. Ảnh dưới đây mô tả sự khác nhau giữa hệ thốngindex cũ và caffein.Hệ thống cũ có vài lớp, một vài thông tin mới cập nhật sẽ nhanh hơn sốkhác. Lớp cơ bản sẽ update trong vòng 2 tuần. Để cập nhật một lớp cũ chúngtôi sẽ phân tích toàn bộ website, điều đó có nghĩa là sẽ có thời gian trễ từ lúctìm thấy website cho đến lúc đưa kết quả đến với người dùng.Với Caffeine, chúng tôi sẽ phân tích website theo từng mảnh nhỏ và updatenội dung trong Search Index một cách liên tục. Khi tìm thấy một webpagesmới hoặc một thông tin mới trên một trang cũ, chúng tôi sẽ đưa trực tiếp vàoSearch Index. Điều đó có nghĩa là bạn sẽ tìm được nội dung cập nhật nhấtcủa một website.Caffeine cho phép chúng tôi Index một khối lượng lớn webpages. Mỗi giâyCaffeine xử lý song song hàng trăm nghìn web pages . Nếu quy lượng thôngtin ra giấy thì mỗi giây Caffeine xử lý một chồng giấy tờ cao 3 miles (khoảng 5km). Caffein cũng sử dụng 100 triệu Gigabyte bộ nhớ trên mộtdatabase và thêm vào 100 đến 1.000 Gigabyte mỗi ngày. Bạn cần 625.000chiếc iPod để lưu trữ lượng thông tin đó, nếu xếp số iPod đó bạn sẽ đượcmột cây iPod cao 40 miles (khoảng 70km).Chúng tôi xây dựng Caffeine với tầm nhìn cho tương lai. Không chỉ cập nhậthơn, nó là một nền tảng mạnh mẽ cho phép chúng tôi xây dựng một SearchEngine đủ sức đáp ứng được sự phát triển thông tin trên Internet và đưa kếtquả tìm kiếm tới bạn.
Nội dung trích xuất từ tài liệu:
Caffeine: Search index mới của Google Caffeine: Search index mới của GoogleGoogle thông báo đã hoàn thành hệ thống search index (đánh chỉ mục)website mới có tên là Caffeine. Caffeine mang lại nhiều hơn 50% kếtquả tìm kiếm cấp nhật nhất so với hệ thống cũ, nó là tập hợp nội dungweb lớn nhất chúng tôi cung cấp. Nếu blog, forum của bạn có bài postmới bạn có thể tìm thấy ngay trên kết quả tìm kiếm trong thời giannhanh hơn nhiều so với trước đây.Khi bạn search Google thực chất bạn không tìm kiếm các website thật màbạn chỉ đang tìm kiếm những website Google đã Index (Search Index),giống như mục lục ở mỗi cuốn sách giúp bạn tìm kiếm chính xác nội dungmình cần ở trang nào. (Bạn có thể tìm hiểu kỹ hơn về nguyên lý hoạt độngcủa SE tại đây)Tại sao chúng tôi xây dựng hệ thống Index mới? Nội dung website phát triểnchóng mặt, nó không chỉ phát triển về số lượng nội dung mà còn phát triểnnhiều hình thức khác nhau như video, ảnh, tin tức cập nhật thời gian thực.Các webpage nhiều nội dung hơn và ngày càng phức tạp hơn. Hơn nữangười dùng Google cũng đòi hỏi ngày càng cao hơn, họ đòi hỏi tìm thấy nộidung mới nhất và phù hợp nhất. Người xuất bản nội dung thì mong muốnnội dung của họ phải được tìm thấy ngay sau khi xuất bản.Để theo kịp sự tiến hoá của web và đáp ứng nhu cầu của người dùng chúngtôi xây dựng Caffeine. Ảnh dưới đây mô tả sự khác nhau giữa hệ thốngindex cũ và caffein.Hệ thống cũ có vài lớp, một vài thông tin mới cập nhật sẽ nhanh hơn sốkhác. Lớp cơ bản sẽ update trong vòng 2 tuần. Để cập nhật một lớp cũ chúngtôi sẽ phân tích toàn bộ website, điều đó có nghĩa là sẽ có thời gian trễ từ lúctìm thấy website cho đến lúc đưa kết quả đến với người dùng.Với Caffeine, chúng tôi sẽ phân tích website theo từng mảnh nhỏ và updatenội dung trong Search Index một cách liên tục. Khi tìm thấy một webpagesmới hoặc một thông tin mới trên một trang cũ, chúng tôi sẽ đưa trực tiếp vàoSearch Index. Điều đó có nghĩa là bạn sẽ tìm được nội dung cập nhật nhấtcủa một website.Caffeine cho phép chúng tôi Index một khối lượng lớn webpages. Mỗi giâyCaffeine xử lý song song hàng trăm nghìn web pages . Nếu quy lượng thôngtin ra giấy thì mỗi giây Caffeine xử lý một chồng giấy tờ cao 3 miles (khoảng 5km). Caffein cũng sử dụng 100 triệu Gigabyte bộ nhớ trên mộtdatabase và thêm vào 100 đến 1.000 Gigabyte mỗi ngày. Bạn cần 625.000chiếc iPod để lưu trữ lượng thông tin đó, nếu xếp số iPod đó bạn sẽ đượcmột cây iPod cao 40 miles (khoảng 70km).Chúng tôi xây dựng Caffeine với tầm nhìn cho tương lai. Không chỉ cập nhậthơn, nó là một nền tảng mạnh mẽ cho phép chúng tôi xây dựng một SearchEngine đủ sức đáp ứng được sự phát triển thông tin trên Internet và đưa kếtquả tìm kiếm tới bạn.
Tìm kiếm theo từ khóa liên quan:
Tối ưu hoá Công cụ Tìm kiếm Công cụ Tìm kiếm Google tài liệu quản trị web cải thiện tương tác trang web chiến lược SEOTài liệu cùng danh mục:
-
Chương trình khung trình độ trung cấp nghề nghề Thiết kế trang Web - Trường CĐN GTVT Đường Thuỷ 1
6 trang 387 0 0 -
45 trang 370 4 0
-
Elasticity for MQTT brokers in IoT applications
13 trang 288 0 0 -
13 trang 271 0 0
-
Đề thi thực hành môn Thiết kế Web - Trường Cao đẳng nghề Vĩnh Phúc
3 trang 254 2 0 -
A study on cloud computing security
15 trang 254 0 0 -
EBay - Internet và câu chuyện thần kỳ: Phần 1
143 trang 250 0 0 -
14 trang 232 0 0
-
8 trang 196 0 0
-
Tìm kiếm thông minh hơn với Google
4 trang 187 0 0
Tài liệu mới:
-
Mạng xã hội 2011: nhiều bất ngờ chờ phía trước
10 trang 0 0 0 -
DỰ TOÁN NGẮN HẠN, PHÂN BỔ NGUỒN LỰC VÀ CHI PHÍ NĂNG LỰC
48 trang 1 0 0 -
111 trang 0 0 0
-
111 trang 0 0 0
-
Bài giảng Công nghệ gia công cơ - Trường Đại học Kỹ thuật Công nghiệp
78 trang 0 0 0 -
91 trang 0 0 0
-
Bài giảng Mạng máy tính - Trường Đại học Kỹ thuật Công nghiệp
155 trang 0 0 0 -
Bài giảng Kiến trúc máy tính nâng cao - Tăng Cẩm Nhung
102 trang 1 0 0 -
Quyết định số 3198/2019/QĐ-BCT
13 trang 1 0 0 -
Luận văn Thạc sĩ Quản lý kinh tế: Thanh tra ngân sách huyện của Sở tài chính tỉnh Lào Cai
99 trang 0 0 0