robots.txt Generator
Genereer direct een robots.txt-bestand voor uw website. Voeg user-agentregels toe, paden toestaan/niet toestaan, crawlvertraging en sitemap-URL. Gratis, realtime robots.txt-generator.
Genereer direct een robots.txt-bestand voor uw website. Voeg user-agentregels toe, paden toestaan/niet toestaan, crawlvertraging en sitemap-URL. Gratis, realtime robots.txt-generator.
robots.txt is een tekstbestand in de root van een website dat crawlers vertelt welke paden ze mogen bezoeken en welke ze moeten vermijden. Het formaat dateert uit 1994 en wordt ondersteund door vrijwel elke zoekmachine en goed opgevoede crawler. Het bestand is adviserend (kwaadwillige crawlers negeren het), maar legitieme crawlers (Google, Bing, enz.) respecteren de richtlijnen op betrouwbare wijze.
Veelvoorkomend gebruik: het blokkeren van crawlers uit beheerdersgebieden (/wp-admin/, /admin/), het uitsluiten van gefacetteerde zoek-URL-parameters die dubbele inhoud produceren, het voorkomen van indexering van staging- of ontwikkelingspaden, het aangeven van de sitemaplocatie en het toestaan van specifieke user-agents terwijl andere worden geblokkeerd. Het bestand wordt aan het begin van elke crawlsessie gelezen.
Deze generator bouwt een syntactisch correcte robots.txt op basis van formulierinvoer. Algemene patronen (alles toestaan, alles blokkeren, specifieke paden blokkeren) zijn sjablonen; aangepaste regels kunnen per user-agent worden toegevoegd. De uitvoer gaat naar /robots.txt van de hoofdmap van uw site.
Handgeschreven robots.txt is foutgevoelig. Syntaxisfouten (hoofdlettergevoeligheid, exacte padafstemming, volgorde van regels) veroorzaken stilletjes verkeerd gedrag: paden die u wilde blokkeren, blijven gecrawld, of paden die u wilde indexeren, worden uitgesloten. Een generator die de juiste syntaxis produceert, vermijdt deze valkuilen.
robots.txt heeft ook subtiele interacties met andere SEO-tools. Het niet toestaan van een pad in robots.txt verhindert niet dat het in de zoekresultaten verschijnt (Google kan de URL indexeren zonder deze te crawlen); meta noindex vereist dat de pagina eerst wordt gecrawld. Weten welk hulpmiddel je moet gebruiken en met welke intentie er toe doet; de generator kan u begeleiden.
Kies een sjabloon, pas het aan, implementeer het.
Formaat: User-agent: <naam> gevolgd door richtlijnen Toestaan/Niet toestaan. * komt overeen met alle bots. Specifieke namen (Googlebot, Bingbot) targeten specifieke crawlers. Meerdere User-agent-blokken kunnen regels stapelen.
Disallow: <pad> blokkeert paden die beginnen met het opgegeven voorvoegsel. Niet toestaan: / blokkeert de hele site. Disallow: /admin/ blokkeert alles onder /admin/. Trailing Slash is belangrijk; Disallow: /admin (geen schuine streep) komt ook overeen met /administrator.
Crawl-delay (in seconds) requests slower crawling. Sitemap (absolute URL) declares your sitemap location. # start een commentaarregel.