Bộ Máy Tìm Kiếm Hoạt Động Thế Nào?

Công cụ tìm kiếm có một danh sách ngắn các hoạt động quan trọng, cho phép họ cung cấp kết quả tìm kiếm web có liên quan, khi người dùng sử dụng hệ thống của họ để tìm kiếm thông tin. Các thuật ngữ chuyên ngành xin được phép không dịch ra để không làm lệch ý nghĩa ban đầu.



Crawling the Web

Search Engines sẽ chạy những chương trình tự động đặc biệt được gọi là “bots” hoặc “spiders”,những chương trình này sử dụng cấu trúc hyperlink của website để “crawl” các page và document. Theo ước lượng thì hiện tại trên thế giới có khoảng 20 tỉ trang web nhưng không phải Search Engines crawl toàn bộ mà chỉ từ 8 đến 10 tỉ trang.

Indexing Documents

Một trang web sau khi được crawl thì nội dung của nó được “indexed” và được lưu trữ trong một database
khổng lồ của search engines. “Index” ở đây ta có thể tạm dịch là chỉ mục (dạng như danh mục).
Các index này được quản lý rất chặc chẽ để mỗi khi có 1 request đến thì trong hàng tỉ document, nó biết chọn lọc ra cái nào cần thiết và hiển thị còn hiển thị như thế nào sẽ trình bày ở phần sau.

Processing Queries

Khi 1 request tìm kiếm thông tin được đưa đến search engines, search engines sẽ lấy kết quả từ các index của tất cả document phù hợp. Một kết quả được xác định và so sánh nếu 1 từ hoặc 1 cụm từ được tìm thấy trên
trang và được định nghĩa xác thực bởi người dùng.
Ví dụ: Khi bạn search từ thu thuat wordpress thì sẽ được kết quả như sau: 463.000 cho thu thuat wordpress. (0,06 giây)
Nhưng khi bạn search cụm từ ( “thu thuat wordpress”) thì kết quả khác hẳn: 84.600 cho “thu thuat wordpress”. (0,06 giây)
Vì sao lại như vậy ? Với lần search đầu tiên, search engines cho ra các trang có chứa các từ đơn lẻ “thu” “thuat” “wordpress”. Còn với lần search thứ 2 nó sẽ tìm ra những trang nào có chứa nguyên cả cụm từ “thu thuat wordpress”.

Một khi search engines xác định được kết quả nào trả về cho truy vấn nào, lúc này 1 thuật toán của engines sẽ được thực thi và tính toán từ các kết quả tìm được, để xác định kết quả nào phù hợp nhất đối với mỗi truy vấn. Sau đó, các kết quả sẽ được phân loại, nhưng người dùng vẫn có thể thay đổi cách phân loại này tùy theo mục đích của mình.
Bộ Máy Tìm Kiếm Hoạt Động Thế Nào?
Xem: 465 lượt
Đăng: 11 tháng 07, 2019
Người Gửi: Admin
Bình Luận
Chia Sẻ Zalo
Link:
BBcode:
HTML:
Cùng Chuyên Mục
Ngẫu nhiên
back to top