Convertitore gratuito

robots.txt Generatore

Genera immediatamente un file robots.txt per il tuo sito web. Aggiungi regole user-agent, consenti/non consenti percorsi, ritardo di scansione e URL della mappa del sito. Generatore di robots.txt gratuito e in tempo reale.

Aggiungi regola

Robots.txt generato

Informazioni su questo strumento

robots.txt è un file di testo semplice alla radice di un sito Web che indica ai crawler quali percorsi possono visitare e quali dovrebbero evitare. Il formato risale al 1994 ed è supportato praticamente da ogni motore di ricerca e crawler ben educato. Il file è consultivo: i crawler dannosi lo ignorano, ma i crawler legittimi (Google, Bing, ecc.) rispettano le sue direttive in modo affidabile.

Usi comuni: blocco dei crawler dalle aree di amministrazione (/wp-admin/, /admin/), esclusione dei parametri URL di ricerca sfaccettata che producono contenuti duplicati, impedendo l'indicizzazione di percorsi di gestione temporanea o di sviluppo, dichiarando la posizione della mappa del sito e consentendo agenti utente specifici bloccandone altri. Il file viene letto all'inizio di ogni sessione di scansione.

Questo generatore crea un robots.txt sintatticamente corretto dagli input del modulo. I modelli comuni (consenti tutto, blocca tutto, blocca percorsi specifici) sono modelli; è possibile aggiungere regole personalizzate per agente utente. L'output va su /robots.txt della root del tuo sito.

Perché utilizzare un generatore di robots.txt

La scrittura manuale del file robots.txt è soggetta a errori. Gli errori di sintassi (distinzione tra maiuscole e minuscole, corrispondenza esatta del percorso, ordinamento delle regole) producono silenziosamente un comportamento sbagliato: i percorsi che intendevi bloccare rimangono sottoposti a scansione oppure i percorsi che volevi indicizzare vengono esclusi. Un generatore che produce una sintassi corretta evita queste trappole.

robots.txt ha anche sottili interazioni con altri strumenti SEO. Non consentire un percorso nel file robots.txt non ne impedisce la visualizzazione nei risultati di ricerca (Google potrebbe indicizzare l'URL senza eseguirne la scansione); meta noindex richiede che la pagina venga prima scansionata. Sapere quale strumento utilizzare per quale intento conta; il generatore può guidarti.

Come usarlo

Scegli un modello, personalizza, distribuisci.

  1. Scegli un modello iniziale: Consenti tutto (possura predefinita di scansione di tutto), Blocca tutto (blocca tutto dall'indicizzazione) o Personalizzato (inizia dalle regole specificate).
  2. Aggiungi regole agente utente: Non consentire percorsi specifici per tutti i crawler o per bot con nomi specifici (Googlebot, Bingbot, GPTBot). Ogni blocco dell'agente utente ha il proprio set di direttive Consenti e Disallow.
  3. Aggiungi l'URL della mappa del sito: Includi l'URL assoluto della tua mappa del sito XML. I crawler lo utilizzano per scoprire URL che altrimenti potrebbero non essere rilevati.
  4. Salva e distribuisci: Scarica il file generato. Carica nella root del tuo dominio (così apparirà su https://example.com/robots.txt). Verifica visitando l'URL in un browser.

Casi d'uso comuni

Dettagli tecnici

Formato: agente utente: <nome> seguito dalle direttive Consenti/Disallow. * corrisponde a tutti i bot. Nomi specifici (Googlebot, Bingbot) prendono di mira crawler specifici. Più blocchi user-agent possono impilare le regole.

Disallow: <percorso> blocca i percorsi che iniziano con il prefisso specificato. Disallow: /blocca l'intero sito. Disallow: /admin/ blocca qualsiasi cosa sotto /admin/. La barra finale è importante; Disallow: /admin (senza barra) corrisponde anche a /administrator.

Il ritardo della scansione (in secondi) richiede una scansione più lenta. Sitemap (URL assoluto) dichiara la posizione della mappa del sito. # inizia una riga di commento.

Migliori pratiche

Domande frequenti

Posso personalizzare l'output generato?
SÌ. Lo strumento fornisce varie opzioni di personalizzazione per adattare l'output alle vostre esigenze specifiche. Regola le impostazioni prima di generare o rigenera con opzioni diverse.
Il contenuto generato è gratuito?
SÌ. Tutto ciò che generi con questo strumento può essere utilizzato per scopi personali, educativi o commerciali senza alcuna restrizione o requisito di attribuzione.
Ciò richiede un account?
No. Lo strumento è pronto per l'uso immediatamente senza registrazione, e-mail o registrazione. Basta aprire la pagina e iniziare a generare.
I miei dati inseriti vengono mantenuti privati?
SÌ. Tutta l'elaborazione avviene nel tuo browser. I tuoi dati di input e l'output generato non vengono mai inviati a nessun server esterno.
Come posso bloccare un bot ma consentirne altri?
Blocchi utente-agente separati. Agente utente: BadBot seguito da Disallow: / blocca BadBot. User-agent: * con Consenti: / consente ad altri.
Il file robots.txt fa distinzione tra maiuscole e minuscole?
La corrispondenza del percorso fa distinzione tra maiuscole e minuscole. Non consentire: /Admin non corrisponde a /admin. Corrisponde al caso reale dei tuoi URL.
Il ritardo della scansione rallenta effettivamente Google?
Google non rispetta il ritardo di scansione. Rispetta le impostazioni della velocità di scansione in Search Console. Altri crawler (Bing, Yandex) rispettano il Crawl-delay.
I miei dati sono caricati?
No. La generazione avviene nel tuo browser.