Chuyển đổi miễn phí

robot.txt Máy phát điện

Tạo tệp robots.txt cho trang web của bạn ngay lập tức. Thêm quy tắc tác nhân người dùng, cho phép/không cho phép đường dẫn, độ trễ thu thập dữ liệu và URL sơ đồ trang web. Trình tạo robots.txt miễn phí, theo thời gian thực.

Thêm quy tắc

Đã tạo robots.txt

Về công cụ này

robots.txt là một tệp văn bản thuần túy nằm ở thư mục gốc của trang web, cho trình thu thập thông tin biết đường dẫn nào chúng có thể truy cập và đường dẫn nào chúng nên tránh. Định dạng này có từ năm 1994 và được hầu hết mọi công cụ tìm kiếm và trình thu thập thông tin hoạt động tốt hỗ trợ. Tệp này mang tính chất tư vấn — các trình thu thập thông tin độc hại bỏ qua nó — nhưng các trình thu thập thông tin hợp pháp (Google, Bing, v.v.) tôn trọng các chỉ thị của nó một cách đáng tin cậy.

Các cách sử dụng phổ biến: chặn trình thu thập thông tin khỏi khu vực quản trị (/wp-admin/, /admin/), loại trừ các tham số URL tìm kiếm theo khía cạnh tạo ra nội dung trùng lặp, ngăn lập chỉ mục đường dẫn dàn dựng hoặc phát triển, khai báo vị trí sơ đồ trang web và cho phép các tác nhân người dùng cụ thể trong khi chặn những người khác. Tệp được đọc vào đầu mỗi phiên thu thập thông tin.

Trình tạo này xây dựng một tệp robots.txt đúng cú pháp từ thông tin đầu vào của biểu mẫu. Các mẫu phổ biến (cho phép tất cả, chặn tất cả, chặn các đường dẫn cụ thể) là các mẫu; quy tắc tùy chỉnh có thể được thêm vào cho mỗi tác nhân người dùng. Đầu ra nằm ở /robots.txt của thư mục gốc trang web của bạn.

Tại sao nên sử dụng Trình tạo robots.txt

Robot.txt viết tay dễ bị lỗi. Các lỗi cú pháp (phân biệt chữ hoa chữ thường, khớp đường dẫn chính xác, thứ tự quy tắc) âm thầm tạo ra hành vi sai — các đường dẫn bạn muốn chặn vẫn được thu thập thông tin hoặc các đường dẫn bạn muốn lập chỉ mục sẽ bị loại trừ. Một trình tạo tạo cú pháp đúng sẽ tránh được những cạm bẫy này.

robots.txt cũng có những tương tác tinh tế với các công cụ SEO khác. Việc không cho phép đường dẫn trong robots.txt không ngăn đường dẫn đó xuất hiện trong kết quả tìm kiếm (Google có thể lập chỉ mục URL mà không cần thu thập dữ liệu); meta noindex yêu cầu trang phải được thu thập dữ liệu trước. Biết sử dụng công cụ nào cho mục đích nào quan trọng; máy phát điện có thể hướng dẫn bạn.

Cách sử dụng

Chọn một mẫu, tùy chỉnh, triển khai.

  1. Chọn mẫu bắt đầu: Cho phép tất cả (tư thế thu thập thông tin mọi thứ mặc định), Chặn tất cả (chặn mọi thứ khỏi lập chỉ mục) hoặc Tùy chỉnh (bắt đầu từ các quy tắc bạn chỉ định).
  2. Thêm quy tắc tác nhân người dùng: Không cho phép các đường dẫn cụ thể đối với tất cả các trình thu thập thông tin hoặc đối với các bot có tên cụ thể (Googlebot, Bingbot, GPTBot). Mỗi khối tác nhân người dùng có một bộ chỉ thị Cho phép và Không cho phép riêng.
  3. Thêm URL sơ đồ trang web: Bao gồm URL tuyệt đối của sơ đồ trang web XML của bạn. Trình thu thập thông tin sử dụng điều này để khám phá các URL mà họ có thể bỏ lỡ.
  4. Lưu và triển khai: Tải xuống tập tin được tạo. Tải lên thư mục gốc của miền của bạn (để nó xuất hiện tại https://example.com/robots.txt). Xác minh bằng cách truy cập URL đó trong trình duyệt.

Các trường hợp sử dụng phổ biến

Chi tiết kỹ thuật

Định dạng: Tác nhân người dùng: <name> theo sau là chỉ thị Cho phép/Không cho phép. * phù hợp với tất cả các bot. Tên cụ thể (Googlebot, Bingbot) nhắm mục tiêu các trình thu thập thông tin cụ thể. Nhiều khối tác nhân người dùng có thể xếp chồng các quy tắc.

Không cho phép: <path> chặn các đường dẫn bắt đầu bằng tiền tố đã cho. Disallow: / chặn toàn bộ trang web. Không cho phép: /admin/ chặn mọi thứ trong /admin/. Dấu gạch chéo có vấn đề; Không cho phép: /admin (không có dấu gạch chéo) cũng khớp với /administrator.

Độ trễ thu thập dữ liệu (tính bằng giây) yêu cầu thu thập thông tin chậm hơn. Sơ đồ trang web (URL tuyệt đối) khai báo vị trí sơ đồ trang web của bạn. # bắt đầu một dòng bình luận.

Thực tiễn tốt nhất

Câu hỏi thường gặp

Tôi có thể tùy chỉnh đầu ra được tạo không?
Đúng. Công cụ này cung cấp nhiều tùy chọn tùy chỉnh khác nhau để điều chỉnh đầu ra theo nhu cầu cụ thể của bạn. Điều chỉnh cài đặt trước khi tạo hoặc tạo lại với các tùy chọn khác nhau.
Nội dung được tạo có được sử dụng miễn phí không?
Đúng. Mọi thứ bạn tạo bằng công cụ này đều là của bạn để sử dụng cho mục đích cá nhân, giáo dục hoặc thương mại mà không có bất kỳ hạn chế hoặc yêu cầu ghi nhận tác giả nào.
Điều này có yêu cầu một tài khoản?
Không. Công cụ này sẵn sàng để sử dụng ngay lập tức mà không cần đăng ký, không cần email và không cần đăng ký. Chỉ cần mở trang và bắt đầu tạo.
Dữ liệu đầu vào của tôi có được giữ kín không?
Đúng. Tất cả quá trình xử lý diễn ra trong trình duyệt của bạn. Dữ liệu đầu vào và đầu ra được tạo của bạn không bao giờ được gửi đến bất kỳ máy chủ bên ngoài nào.
Làm cách nào để chặn một bot nhưng cho phép những bot khác?
Các khối tác nhân người dùng riêng biệt. Tác nhân người dùng: BadBot theo sau là Disallow: /block BadBot. Tác nhân người dùng: * với Cho phép: / cho phép người khác.
Robot.txt có phân biệt chữ hoa chữ thường không?
Khớp đường dẫn có phân biệt chữ hoa chữ thường. Không cho phép: /Admin không khớp với /admin. Khớp trường hợp thực tế của URL của bạn.
Độ trễ thu thập dữ liệu có thực sự làm chậm Google không?
Google không tôn trọng việc trì hoãn thu thập thông tin. Nó tôn trọng cài đặt tốc độ thu thập dữ liệu trong Search Console. Các trình thu thập thông tin khác (Bing, Yandex) tôn trọng độ trễ thu thập dữ liệu.
Dữ liệu của tôi có được tải lên không?
Không. Việc tạo diễn ra trong trình duyệt của bạn.