Khai báo file Robots.txt giúp website bạn có số má cao trong bộ máy tìm kiếm

tháng 1 08, 2010

Khi một search engine tìm đến (nguyên văn Crawler) Website nào đó, nó sẽ tìm một file đặc biệt trước tiên, đó là file robots.txt. File robots.txt cho search engine đó biết rằng, Website này có thể index hoặc không (tùy theo lệnh được viết trong file robots.txt).
Ví dụ:
User-agent: *
Disallow: /support
Disallow: /cgi-bin/
Disallow: /images/
----------------------------------------
User-agent: *
Disallow: /images/
Disallow: /cgi-bin/
----------------------------------------
User-agent: Googlebot-Image
Disallow: /
Disallow: /images/mymugshot.jpg

+Phải chắc chắn các mệnh đề, từ sử dụng trong lệnh là đúng. Ví dụ thư mục là "image" (viết thường), nhưng khí vào lệnh, bạn lại viết là "Image" (Viết hoa chữ I) thì các spider sẽ không hiểu. Nói chung phải chính xác tuyệt đối. Xem thêm ở search engine of google để biết nhiều hơn.

Tìm kiếm Blog này

Nhật Ký Online

Khai báo file Robots.txt giúp website bạn có số má cao trong bộ máy tìm kiếm

Nhận xét

Đăng nhận xét

Bài đăng phổ biến từ blog này

Tổng quan về overclock

Intel Core 2 Duo E4300 Review and Overclocking Analysis

xajax dhtmlHistory-Extension (Bookmark and Backbutton)