robots.txt Generator
Generieren Sie sofort eine robots.txt-Datei für Ihre Website. Fügen Sie User-Agent-Regeln, Pfade zulassen/verbieten, Crawling-Verzögerung und Sitemap-URL hinzu. Kostenloser Echtzeit-Robots.txt-Generator.
Generieren Sie sofort eine robots.txt-Datei für Ihre Website. Fügen Sie User-Agent-Regeln, Pfade zulassen/verbieten, Crawling-Verzögerung und Sitemap-URL hinzu. Kostenloser Echtzeit-Robots.txt-Generator.
robots.txt ist eine reine Textdatei im Stammverzeichnis einer Website, die Crawlern mitteilt, welche Pfade sie besuchen dürfen und welche sie meiden sollten. Das Format stammt aus dem Jahr 1994 und wird von praktisch jeder Suchmaschine und jedem gut funktionierenden Crawler unterstützt. Bei der Datei handelt es sich um eine Empfehlungsdatei – böswillige Crawler ignorieren sie –, aber seriöse Crawler (Google, Bing usw.) befolgen ihre Anweisungen zuverlässig.
Häufige Verwendungszwecke: Blockieren von Crawlern aus Admin-Bereichen (/wp-admin/, /admin/), Ausschließen facettierter Such-URL-Parameter, die doppelten Inhalt erzeugen, Verhindern der Indizierung von Staging- oder Entwicklungspfaden, Deklarieren des Sitemap-Speicherorts und Zulassen bestimmter Benutzeragenten, während andere blockiert werden. Die Datei wird zu Beginn jeder Crawl-Sitzung gelesen.
Dieser Generator erstellt aus Formulareingaben eine syntaktisch korrekte robots.txt. Gängige Muster (alle zulassen, alle blockieren, bestimmte Pfade blockieren) sind Vorlagen; Benutzerdefinierte Regeln können pro Benutzeragent hinzugefügt werden. Die Ausgabe erfolgt unter /robots.txt Ihres Site-Roots.
Das Schreiben von robots.txt per Hand ist fehleranfällig. Syntaxfehler (Groß-/Kleinschreibung, genaue Pfadzuordnung, Reihenfolge der Regeln) führen stillschweigend zu falschem Verhalten – Pfade, die Sie blockieren wollten, bleiben gecrawlt, oder Pfade, die Sie indizieren wollten, werden ausgeschlossen. Ein Generator, der die korrekte Syntax erzeugt, vermeidet diese Fallstricke.
robots.txt hat auch subtile Interaktionen mit anderen SEO-Tools. Das Verbot eines Pfads in robots.txt verhindert nicht, dass er in den Suchergebnissen angezeigt wird (Google indiziert die URL möglicherweise, ohne sie zu crawlen); Meta Noindex erfordert, dass die Seite zuerst gecrawlt wird. Zu wissen, welches Tool für welchen Zweck verwendet werden soll, ist wichtig; Der Generator kann Sie führen.
Wählen Sie eine Vorlage aus, passen Sie sie an und stellen Sie sie bereit.
Format: Benutzeragent: <Name> gefolgt von Allow/Disallow-Anweisungen. * entspricht allen Bots. Spezifische Namen (Googlebot, Bingbot) zielen auf bestimmte Crawler ab. Mehrere User-Agent-Blöcke können Regeln stapeln.
Nicht zulassen: <Pfad> blockiert Pfade, die mit dem angegebenen Präfix beginnen. Disallow: / blockiert die gesamte Website. Nicht zulassen: /admin/ blockiert alles unter /admin/. Der abschließende Schrägstrich ist wichtig; Nicht zulassen: /admin (kein Schrägstrich) stimmt auch mit /administrator überein.
Crawl-Verzögerung (in Sekunden) fordert langsameres Crawlen an. Sitemap (absolute URL) gibt Ihren Sitemap-Standort an. # startet eine Kommentarzeile.