Convertor gratuit

robots.txt Generator

Generați instantaneu un fișier robots.txt pentru site-ul dvs. web. Adăugați reguli user-agent, permiteți/dezactivați căi, întârzierea accesării cu crawlere și adresa URL a sitemapului. Generator robots.txt gratuit, în timp real.

Adăugați o regulă

Robots.txt generat

Despre acest instrument

robots.txt este un fișier text simplu de la rădăcina unui site web care le spune crawlerilor ce căi pot vizita și pe care ar trebui să le evite. Formatul datează din 1994 și este acceptat de aproape orice motor de căutare și crawler bine comportat. Fișierul este consultativ - crawlerele rău intenționate îl ignoră - dar crawlerele legitime (Google, Bing etc.) își respectă directivele în mod fiabil.

Utilizări obișnuite: blocarea crawlerelor din zonele de administrare (/wp-admin/, /admin/), excluderea parametrilor URL de căutare cu fațete care produc conținut duplicat, prevenirea indexării căilor de dezvoltare sau punere în scenă, declararea locației sitemapului și permiterea anumitor agenți de utilizator în timp ce blochează alții. Fișierul este citit la începutul fiecărei sesiuni de accesare cu crawlere.

Acest generator creează un robots.txt corect din punct de vedere sintactic din intrările de formular. Modelele obișnuite (permiteți toate, blocați toate, blocați căile specifice) sunt șabloane; regulile personalizate pot fi adăugate pentru fiecare agent de utilizator. Ieșirea ajunge la /robots.txt al rădăcinii site-ului dvs.

De ce să folosiți un generator robots.txt

Robots.txt scris de mână este predispus la erori. Greșelile de sintaxă (sensibilitatea majusculelor, potrivirea exactă a căilor, ordonarea regulilor) produc în tăcere un comportament greșit - căile pe care intenționați să le blocați rămân accesate cu crawlere sau căile pe care doriți să le indexați sunt excluse. Un generator care produce o sintaxă corectă evită aceste capcane.

robots.txt are, de asemenea, interacțiuni subtile cu alte instrumente SEO. Interzicerea unei căi în robots.txt nu împiedică apariția acesteia în rezultatele căutării (Google poate indexa adresa URL fără a o accesa cu crawlere); meta noindex necesită ca pagina să fie accesată cu crawlere mai întâi. Să știi ce instrument să folosești pentru care intenție contează; generatorul te poate ghida.

Cum se utilizează

Alegeți un șablon, personalizați, implementați.

  1. Alegeți un șablon de pornire: Permiteți toate (poziția implicită de accesare cu crawlere-totul), Blocați totul (blocați totul de la indexare) sau Personalizat (începeți de la regulile specificate de dvs.).
  2. Adăugați reguli de agent de utilizator: Nu permiteți anumite căi pentru toate crawlerele sau pentru anumiți roboți cu nume (Googlebot, Bingbot, GPTBot). Fiecare bloc de agent utilizator are propriul set de directive Allow și Disallow.
  3. Adăugați adresa URL a sitemapului: Includeți adresa URL absolută a sitemap-ului dvs. XML. Crawlerele folosesc aceasta pentru a descoperi adrese URL pe care altfel le-ar putea rata.
  4. Salvați și implementați: Descărcați fișierul generat. Încărcați la rădăcina domeniului dvs. (deci apare la https://example.com/robots.txt). Verificați accesând acea adresă URL într-un browser.

Cazuri comune de utilizare

Detalii tehnice

Format: User-agent: <nume> urmat de directivele Allow/Disallow. * se potrivește cu toți roboții. Nume specifice (Googlebot, Bingbot) vizează anumite crawlere. Mai multe blocuri User-agent pot stivui reguli.

Disallow: <cale> blochează căile care încep cu prefixul dat. Disallow: / blochează întregul site. Disallow: /admin/ blochează orice sub /admin/. Slash-ul final contează; Disallow: /admin (fără bară oblică) se potrivește și cu /administrator.

Întârzierea accesului cu crawlere (în secunde) solicită accesarea cu crawlere mai lentă. Sitemap (adresa URL absolută) declară locația sitemap-ului dvs. # începe o linie de comentarii.

Cele mai bune practici

Întrebări frecvente

Pot personaliza rezultatul generat?
Da. Instrumentul oferă diverse opțiuni de personalizare pentru a adapta rezultatul la nevoile dumneavoastră specifice. Ajustați setările înainte de a genera sau regenerați cu diferite opțiuni.
Conținutul generat este folosit gratuit?
Da. Tot ceea ce generați cu acest instrument vă aparține pentru a le utiliza în scopuri personale, educaționale sau comerciale, fără restricții sau cerințe de atribuire.
Acest lucru necesită un cont?
Nu. Instrumentul este gata de utilizare imediat, fără înregistrare, fără e-mail și fără înregistrare. Doar deschideți pagina și începeți să generați.
Datele mele de intrare sunt păstrate private?
Da. Toate procesările au loc în browserul dvs. Datele dvs. de intrare și ieșirile generate nu sunt niciodată trimise la niciun server extern.
Cum blochez un bot, dar permit altora?
Blocuri separate User-agent. Agent utilizator: BadBot urmat de Disallow: / blochează BadBot. User-agent: * cu Allow: / permite altora.
Robots.txt diferențiază majuscule și minuscule?
Potrivirea căilor face distincție între majuscule și minuscule. Disallow: /Admin nu se potrivește cu /admin. Potriviți casele reale ale adreselor URL.
Întârzierea cu crawl încetinește de fapt Google?
Google nu onorează Crawl-delay. Respectă setările pentru rata de accesare cu crawlere din Search Console. Alte crawler-uri (Bing, Yandex) respectă Crawl-delay.
Sunt datele mele încărcate?
Nu. Generarea are loc în browserul dvs.