Khai báo file Robots.txt giúp website bạn có số má cao trong bộ máy tìm kiếm

Khi một search engine tìm đến (nguyên văn Crawler) Website nào đó, nó sẽ tìm một file đặc biệt trước tiên, đó là file robots.txt. File robots.txt cho search engine đó biết rằng, Website này có thể index hoặc không (tùy theo lệnh được viết trong file robots.txt).
Ví dụ:
User-agent: *
Disallow: /support
Disallow: /cgi-bin/
Disallow: /images/
 ----------------------------------------
User-agent: *
Disallow: /images/
Disallow: /cgi-bin/
 ----------------------------------------
User-agent: Googlebot-Image
Disallow: / 
Disallow: /images/mymugshot.jpg

+Phải chắc chắn các mệnh đề, từ sử dụng trong lệnh là đúng. Ví dụ  thư mục là "image" (viết thường), nhưng khí vào lệnh, bạn lại viết là "Image" (Viết hoa chữ I) thì các spider sẽ không hiểu. Nói chung phải chính xác tuyệt đối. Xem thêm ở search engine of google để biết nhiều hơn.

Nhận xét

Bài đăng phổ biến từ blog này

dung lượng RAM lớn nhất mà HĐH cấu trúc 32-bit nhận được

Ký tự viết tắt trong chat & email

Ubuntu LAMP Server