Thuật toán của Google: Cơ chế tìm kiếm Search Engine

Lời giới thiệu !

Đây là bài tập tổng hợp của học viên khóa SEO 02 sau khi học xong bài “Cơ chế tìm kiếm Search Engine“. Những kiến thức Publish tại đây các bạn có thể tham khảo. Nếu như có bất cứ nội dung nào khó hiểu thì các bạn có thể “Gửi phản hồi/Ý kiến” để được giải đáp ngay. Chuyên mục: Tu hoc seo / Viện dao tao seo Nữ Hoàng Seo

CƠ CHẾ HOẠT ĐỘNG CỦA SEARCH ENGINE

- Có 3 cơ chế chính của Search Engine là: Crawling -> Indexing -> Ranking
1. Crawling là quá trình Spider thu thập thông tin. Đầu tiên con bọ (spider) sẽ bò đi vào các website dựa vào hyperlink và meta. Nếu meta mà không xác định gì thì spider sẽ bò đi theo link.
+ Sau đó thông tin được đem về để phân tích dữ liệu (phân tích thẻ tittle, thẻ meta, nội dung, …”khoảng 400 tiêu chí”) và xếp hạng trong các cơ sở dữ liệu (gọi là bảng caching)

con bọ của Google

Những con bọ của Google hoạt động vô cùng thông minh

* Google Crawling nhƣ thế nào:
– Crawling qua link trên các site đã index theo chỉ định của meta name
– Crawling qua Add URL form
– Crawling qua IP server reversed, DNS reversed
– Crawling qua full domain search

2. Indexing là hệ thống lập chỉ mục trong công cụ tìm kiếm thực hiện việc phân tích, chọn lựa và lưu trữ những thông tin cần thiết (thường là các từ khóa hay cụm từ khóa) một cách nhanh chóng và chính xác từ những dữ liệu mà robot thu được.

indexing

Quá trình indexing là một thách thức đối với mọi cơ sở dữ liệu

+ Tốc độ indexing phụ thuộc vào độ truth (độ tin cậy) nơi đặt link. Những websites có độ truth càng lớn hoặc nổi tiếng thì xuất hiện ngay trên Google rất sớm.
+ Google index dần dần chứ không index đầy đủ.

3. Ranking là quá trình xếp hạng các kết quả tìm kiếm.

ranking google

Bảng xếp hạng của Google luôn luôn thay đổi

+ Google có khoảng 420 thuật toán chuyên để tính toán và xếp hạng.
+ Google có 2 hệ thống tính toán là Instant ranking và Full deep ranking
. Instant ranking là hệ thống tính toán bên ngoài và tương tác với người dùng (khi người dùng search thì nó tính toán và đưa ra kết quả luôn).
. Full deep ranking là hệ thống tính toán bên trong, sau 1 thời gian nhất định thì các kết quả của Instant search sẽ được chuyển dần vào bên trong . Và Google xếp hạng các website từ 3 đến 6 tháng 1 lần và xếp theo 1 lĩnh vực nhất định. Tuy nhiên khi google xuất kết quả ra thì google sẽ trộn dữ liệu với hệ thống bên ngoài.
+ Mỗi một quốc gia có một server thuật toán địa phương riêng, cho nên chỉ số ranking của các website trong quốc gia được ưu tiên hơn (ví dụ khi search ở Việt Nam thì các tên miền “.vn” hoặc các tên miền tiếng việt được ưu tiên hơn).
+ Tính năng gợi ý từ khóa cho người dùng là thuộc hệ thống instant ranking, được sử dụng dựa vào “log search” của người dùng. Hệ thống “Log search” này sử dụng dữ liệu có sẵn không tính toán gì cả.
+ Một điều cần lưu ý khi làm SEO là nên tắt tính năng lịch sử tìm kiếm trên google để khỏi bị nhầm lẫn.

Biên tập: Học viên Nghĩa (K02)
Tham khảo: Tuan Ha Vinalink
Chịu trách nhiệm nội dung: GV Nữ Hoàng Seo

(Nếu bạn muốn trích lại xin ghi rõ nguồn Viện đào tạo seo Nữ Hoàng Seo. Xin cảm ơn)

Related posts: