Khai báo file Robots.txt giúp website bạn có số má cao trong bộ máy tìm kiếm
Khi một search engine tìm đến (nguyên văn Crawler) Website nào đó, nó sẽ tìm một file đặc biệt trước tiên, đó là file robots.txt. File robots.txt cho search engine đó biết rằng, Website này có thể index hoặc không (tùy theo lệnh được viết trong file robots.txt).
Ví dụ:
User-agent: *
Disallow: /support
Disallow: /cgi-bin/
Disallow: /images/
----------------------------------------
User-agent: *
Disallow: /images/
Disallow: /cgi-bin/
----------------------------------------
User-agent: Googlebot-Image
Disallow: /
Disallow: /images/mymugshot.jpg
+Phải chắc chắn các mệnh đề, từ sử dụng trong lệnh là đúng. Ví dụ thư mục là "image" (viết thường), nhưng khí vào lệnh, bạn lại viết là "Image" (Viết hoa chữ I) thì các spider sẽ không hiểu. Nói chung phải chính xác tuyệt đối. Xem thêm ở search engine of google để biết nhiều hơn.
Ví dụ:
User-agent: *
Disallow: /support
Disallow: /cgi-bin/
Disallow: /images/
----------------------------------------
User-agent: *
Disallow: /images/
Disallow: /cgi-bin/
----------------------------------------
User-agent: Googlebot-Image
Disallow: /
Disallow: /images/mymugshot.jpg
+Phải chắc chắn các mệnh đề, từ sử dụng trong lệnh là đúng. Ví dụ thư mục là "image" (viết thường), nhưng khí vào lệnh, bạn lại viết là "Image" (Viết hoa chữ I) thì các spider sẽ không hiểu. Nói chung phải chính xác tuyệt đối. Xem thêm ở search engine of google để biết nhiều hơn.
Nhận xét
Đăng nhận xét