robots.txt Generator
Generer en robots.txt-fil til dit websted med det samme. Tilføj brugeragentregler, tillad/ikke tillad stier, crawl-forsinkelse og sitemap-URL. Gratis robots.txt-generator i realtid.
Generer en robots.txt-fil til dit websted med det samme. Tilføj brugeragentregler, tillad/ikke tillad stier, crawl-forsinkelse og sitemap-URL. Gratis robots.txt-generator i realtid.
robots.txt er en almindelig tekstfil i roden af et websted, der fortæller crawlere, hvilke stier de kan besøge, og hvilke de bør undgå. Formatet dateres til 1994 og understøttes af stort set alle søgemaskiner og velopdragne crawlere. Filen er rådgivende - ondsindede crawlere ignorerer den - men legitime crawlere (Google, Bing osv.) respekterer dens direktiver pålideligt.
Almindelige anvendelser: blokering af crawlere fra administratorområder (/wp-admin/, /admin/), ekskludering af facetterede søge-URL-parametre, der producerer duplikeret indhold, forhindre indeksering af iscenesættelse eller udviklingsstier, erklære sitemapplacering og tillade specifikke brugeragenter, mens andre blokerer. Filen læses i starten af hver crawl-session.
Denne generator bygger en syntaktisk korrekt robots.txt ud fra formularinput. Almindelige mønstre (tillad alle, bloker alle, bloker specifikke stier) er skabeloner; brugerdefinerede regler kan tilføjes pr. brugeragent. Outputtet går til /robots.txt på dit websteds rod.
Håndskrift robots.txt er udsat for fejl. Syntaksfejl (følsomhed over for store og små bogstaver, nøjagtig stimatchning, rækkefølge af regler) producerer stille og roligt forkert adfærd - stier, du havde til hensigt at blokere, forbliver gennemgået, eller stier, du ønskede indekseret, bliver ekskluderet. En generator, der producerer korrekt syntaks, undgår disse faldgruber.
robots.txt har også subtile interaktioner med andre SEO-værktøjer. Disallowing a path in robots.txt does not prevent it from appearing in search results (Google may index the URL without crawling it); meta noindex kræver, at siden crawles først. At vide, hvilket værktøj der skal bruges til hvilken hensigt, der betyder noget; generatoren kan guide dig.
Vælg en skabelon, tilpas, implementer.
Format: User-agent: <navn> efterfulgt af Tillad/Disallow-direktiver. * matcher alle bots. Specifikke navne (Googlebot, Bingbot) målretter mod specifikke crawlere. Flere User-agent blokke kan stable regler.
Disallow: <sti> blokerer stier, der starter med det givne præfiks. Disallow: / blocks the entire site. Disallow: /admin/ blokerer alt under /admin/. Efterfølgende skråstreg har betydning; Disallow: /admin (ingen skråstreg) matcher også /administrator.
Crawl-forsinkelse (i sekunder) anmoder om langsommere crawl. Sitemap (absolut URL) angiver dit sitemapplacering. # starter en kommentarlinje.