O tym narzędziu
robots.txt to zwykły plik tekstowy znajdujący się w katalogu głównym witryny internetowej, który informuje roboty indeksujące, jakie ścieżki mogą odwiedzać, a których powinny unikać. Format pochodzi z 1994 roku i jest obsługiwany przez praktycznie każdą wyszukiwarkę i dobrze zachowującego się robota. Plik ma charakter doradczy — złośliwe roboty go ignorują — ale legalne roboty (Google, Bing itp.) niezawodnie przestrzegają jego wytycznych.
Typowe zastosowania: blokowanie robotów indeksujących z obszarów administracyjnych (/wp-admin/, /admin/), wykluczanie parametrów adresu URL wyszukiwania fasetowego, które generują zduplikowaną treść, zapobieganie indeksowaniu ścieżek przejściowych lub programistycznych, deklarowanie lokalizacji mapy witryny i zezwalanie określonym agentom użytkownika podczas blokowania innych. Plik jest odczytywany na początku każdej sesji przeszukiwania.
Ten generator tworzy poprawny składniowo plik robots.txt na podstawie danych wejściowych z formularza. Typowe wzorce (zezwól na wszystko, blokuj wszystko, blokuj określone ścieżki) to szablony; niestandardowe reguły można dodać dla każdego agenta użytkownika. Dane wyjściowe trafiają do pliku /robots.txt w katalogu głównym witryny.
Dlaczego warto korzystać z generatora pliku robots.txt
Plik robots.txt pisany odręcznie jest podatny na błędy. Błędy składniowe (uwzględnianie wielkości liter, dokładne dopasowanie ścieżki, kolejność reguł) po cichu powodują niewłaściwe zachowanie — ścieżki, które miałeś zablokować, pozostają przeszukiwane lub ścieżki, które chciałeś zaindeksować, są wykluczane. Generator generujący poprawną składnię pozwala uniknąć tych pułapek.
plik robots.txt ma również subtelne interakcje z innymi narzędziami SEO. Zakazanie ścieżki w pliku robots.txt nie uniemożliwia jej pojawienia się w wynikach wyszukiwania (Google może zaindeksować adres URL bez jego indeksowania); meta noindex wymaga najpierw przeszukania strony. Wiedza o tym, jakiego narzędzia użyć do jakiego celu ma znaczenie; generator może Cię poprowadzić.
Szczegóły techniczne
Format: User-agent: <nazwa>, po której następują dyrektywy Zezwól/Zabroń. * pasuje do wszystkich botów. Konkretne nazwy (Googlebot, Bingbot) są kierowane do określonych robotów. Wiele bloków agenta użytkownika może łączyć reguły.
Disallow: <path> blokuje ścieżki zaczynające się od podanego przedrostka. Disallow: / blokuje całą witrynę. Disallow: /admin/ blokuje wszystko w katalogu /admin/. Ukośnik końcowy ma znaczenie; Nie zezwalaj: /admin (bez ukośnika) pasuje również do /administrator.
Opóźnienie indeksowania (w sekundach) żąda wolniejszego indeksowania. Mapa witryny (bezwzględny adres URL) określa lokalizację mapy witryny. # rozpoczyna linię komentarza.
Często zadawane pytania
- Czy mogę dostosować wygenerowane dane wyjściowe?
- Tak. Narzędzie zapewnia różne opcje dostosowywania, aby dostosować wydruk do konkretnych potrzeb. Dostosuj ustawienia przed wygenerowaniem lub wygeneruj ponownie, korzystając z różnych opcji.
- Czy wygenerowane treści są bezpłatne?
- Tak. Wszystko, co wygenerujesz za pomocą tego narzędzia, jest Twoją własnością i możesz z niego korzystać w celach osobistych, edukacyjnych lub komercyjnych, bez żadnych ograniczeń i wymagań dotyczących autorstwa.
- Czy to wymaga konta?
- Nie. Narzędzie jest gotowe do użycia od razu, bez rejestracji, bez e-maila i bez rejestracji. Wystarczy otworzyć stronę i rozpocząć generowanie.
- Czy moje dane wejściowe są poufne?
- Tak. Całe przetwarzanie odbywa się w Twojej przeglądarce. Twoje dane wejściowe i wygenerowane dane wyjściowe nigdy nie są wysyłane do żadnego serwera zewnętrznego.
- Jak zablokować jednego bota, ale pozwolić innym?
- Oddzielne bloki agenta użytkownika. User-agent: BadBot, po którym następuje Disallow: / blokuje BadBota. User-agent: * z Zezwól: / pozwala innym.
- Czy w pliku robots.txt rozróżniana jest wielkość liter?
- Dopasowywanie ścieżki uwzględnia wielkość liter. Nie zezwalaj: /Admin nie pasuje do /admin. Dopasuj rzeczywistą wielkość liter w adresach URL.
- Czy opóźnienie indeksowania rzeczywiście spowalnia Google?
- Google nie honoruje opóźnienia indeksowania. Uwzględnia ustawienia szybkości indeksowania w Search Console. Inne roboty indeksujące (Bing, Yandex) szanują opóźnienie indeksowania.
- Czy moje dane zostały przesłane?
- Nie. Generowanie odbywa się w Twojej przeglądarce.