免費轉換器

robots.txt 產生器

立即為您的網站生成robots.txt檔案。新增使用者代理規則、允許/禁止路徑、爬取延遲和網站地圖URL。免費即時robots.txt產生器。

新增規則

產生的robots.txt

關於此工具

robots.txt 是網站根目錄下的純文字文件,它告訴爬蟲它們可以存取哪些路徑以及應該避免哪些路徑。該格式可以追溯到 1994 年,幾乎所有搜尋引擎和行為良好的爬蟲都支援該格式。該文件是建議性的——惡意爬蟲會忽略它——但合法的爬蟲(Google、Bing 等)會可靠地遵守其指示。

常見用途:阻止爬蟲進入管理區域(/wp-admin/、/admin/)、排除產生重複內容的分面搜尋 URL 參數、防止對暫存或開發路徑建立索引、聲明網站地圖位置以及允許特定使用者代理同時阻止其他使用者代理。在每個爬網會話開始時都會讀取該檔案。

此生成器根據表單輸入建置語法正確的 robots.txt。常見模式(允許所有、阻止所有、阻止特定路徑)是範本;可以為每個使用者代理程式新增自訂規則。輸出位於網站根目錄的 /robots.txt。

為什麼要使用 robots.txt 產生器

手寫 robots.txt 很容易出錯。語法錯誤(區分大小寫、精確路徑匹配、規則排序)會默默地產生錯誤行為 - 您想要阻止的路徑仍然被爬行,或者您想要索引的路徑被排除。產生正確語法的生成器可以避免這些陷阱。

robots.txt 也與其他 SEO 工具有微妙的互動。禁止 robots.txt 中的路徑並不會阻止它出現在搜尋結果中(Google 可能會在不抓取 URL 的情況下將其編入索引); meta noindex 要求首先抓取頁面。知道使用哪個工具來實現哪個意圖很重要;生成器可以指導您。

使用方法

選擇模板、自訂、部署。

  1. 選擇起始模板: 允許所有(預設抓取所有內容姿勢)、阻止所有(阻止索引中的所有內容)或自訂(從您指定的規則開始)。
  2. 新增使用者代理規則: 禁止所有抓取工具或特定命名的機器人(Googlebot、Bingbot、GPTBot)使用特定路徑。每個用戶代理塊都有自己的一組允許和禁止指令。
  3. 新增網站地圖 URL: 包括 XML 網站地圖的絕對 URL。爬蟲使用它來發現他們可能會錯過的 URL。
  4. 儲存並部署: 下載產生的檔案。上傳到您的網域的根目錄(因此它顯示在 https://example.com/robots.txt)。透過在瀏覽器中存取該 URL 進行驗證。

常見用例

技術細節

格式:使用者代理:<名稱>,後面接著允許/禁止指令。 * 配對所有機器人。特定名稱(Googlebot、Bingbot)針對特定的抓取工具。多個用戶代理塊可以堆疊規則。

禁止:<path> 阻止以給定前綴開頭的路徑。禁止:/ 阻止整個網站。禁止:/admin/ 阻止 /admin/ 下的任何內容。尾部斜線很重要;禁止:/admin(無斜線)也匹配/administrator。

爬行延迟(以秒为单位)请求较慢的爬行。站点地图(绝对 URL)声明您的站点地图位置。 # 開始註解行。

最佳實踐

常見問題

我可以自訂生成的輸出嗎?
是的。該工具提供了各種自訂選項,可根據您的特定需求自訂輸出。在生成之前調整設置,或使用不同的選項重新生成。
產生的內容可以免費使用嗎?
是的。您使用此工具產生的所有內容都可以用於個人、教育或商業目的,沒有任何限製或歸屬要求。
這個需要帳號嗎?
不需要。該工具無需註冊、無需電子郵件、無需註冊即可立即使用。只需打開頁面並開始生成。
我的輸入資料是否保密?
是的。所有處理都發生在您的瀏覽器中。您的輸入資料和產生的輸出永遠不會發送到任何外部伺服器。
如何阻止一個機器人但允許其他機器人?
单独的用户代理块。使用者代理:BadBot 後面跟著 Disallow: / 封鎖 BadBot。使用者代理:* 與允許:/ 允許其他人。
robots.txt 区分大小写吗?
路径匹配区分大小写。不允许:/Admin 与/admin 不匹配。匹配您 URL 的实际大小写。
抓取延遲實際上會減慢 Google 的速度嗎?
Google 不尊重抓取延迟。它遵循 Search Console 中的抓取速度設定。其他爬蟲(Bing、Yandex)尊重爬行延遲。
我的數據上傳了嗎?
不會。生成發生在您的瀏覽器中。