Libreng Converter

robots.txt Generator

Bumuo ng robots.txt file para sa iyong website kaagad. Magdagdag ng mga panuntunan ng user-agent, payagan/huwag payagan ang mga path, crawl-delay, at URL ng sitemap. Libre, real-time na robots.txt generator.

Magdagdag ng Panuntunan

Binuo robots.txt

Tungkol sa tool na ito

Ang robots.txt ay isang plain text file sa ugat ng isang website na nagsasabi sa mga crawler kung aling mga landas ang maaari nilang bisitahin at dapat nilang iwasan. Ang format ay itinayo noong 1994 at sinusuportahan ng halos bawat search engine at maayos na crawler. Ang file ay advisory — binabalewala ito ng mga malisyosong crawler — ngunit ang mga lehitimong crawler (Google, Bing, atbp.) ay iginagalang ang mga direktiba nito nang mapagkakatiwalaan.

Mga karaniwang gamit: pagharang sa mga crawler mula sa mga lugar ng admin (/wp-admin/, /admin/), hindi kasama ang mga faceted na parameter ng URL ng paghahanap na gumagawa ng duplicate na content, pinipigilan ang pag-index ng mga staging o development path, pagdedeklara ng lokasyon ng sitemap, at pagpayag sa mga partikular na ahente ng user habang bina-block ang iba. Binabasa ang file sa simula ng bawat sesyon ng pag-crawl.

Ang generator na ito ay bumubuo ng isang syntactically correct robots.txt mula sa mga input ng form. Ang mga karaniwang pattern (payagan ang lahat, i-block lahat, i-block ang mga partikular na landas) ay mga template; maaaring idagdag ang mga custom na panuntunan sa bawat user agent. Napupunta ang output sa /robots.txt ng root ng iyong site.

Bakit Gumamit ng isang robots.txt Generator

Ang pagsusulat ng kamay na robots.txt ay madaling magkamali. Ang mga pagkakamali sa syntax (case sensitivity, eksaktong pagtutugma ng path, pagkakasunud-sunod ng mga panuntunan) ay tahimik na nagbubunga ng maling gawi — ang mga landas na sinadya mong harangan ay mananatiling crawl, o ang mga path na gusto mong ma-index ay hindi isasama. Ang isang generator na gumagawa ng tamang syntax ay umiiwas sa mga pitfalls na ito.

Ang robots.txt ay mayroon ding banayad na pakikipag-ugnayan sa iba pang mga tool sa SEO. Hindi pinipigilan ng hindi pagpayag ang isang path sa robots.txt na lumabas sa mga resulta ng paghahanap (maaaring i-index ng Google ang URL nang hindi ito gina-crawl); Kinakailangan ng meta noindex na i-crawl muna ang page. Pag-alam kung aling tool ang gagamitin para sa kung aling layunin ang mahalaga; magagabayan ka ng generator.

Paano gamitin

Pumili ng template, i-customize, i-deploy.

  1. Pumili ng panimulang template: Payagan ang lahat (default crawl-everything posture), I-block ang lahat (i-block ang lahat sa pag-index), o Custom (magsimula sa mga panuntunang tinukoy mo).
  2. Magdagdag ng mga panuntunan ng user agent: Huwag payagan ang mga partikular na landas para sa lahat ng mga crawler, o para sa mga partikular na pinangalanang bot (Googlebot, Bingbot, GPTBot). Ang bawat bloke ng user agent ay may sariling hanay ng mga direktiba na Pahintulutan at Huwag Payagan.
  3. Magdagdag ng URL ng sitemap: Isama ang ganap na URL ng iyong XML sitemap. Ginagamit ito ng mga crawler upang matuklasan ang mga URL na maaari nilang makaligtaan kung hindi man.
  4. I-save at i-deploy: I-download ang nabuong file. Mag-upload sa ugat ng iyong domain (para lumabas ito sa https://example.com/robots.txt). I-verify sa pamamagitan ng pagbisita sa URL na iyon sa isang browser.

Mga Karaniwang Paggamit

Mga Detalye ng Teknikal

Format: User-agent: <name> na sinusundan ng Allow/Disallow directives. * tumutugma sa lahat ng mga bot. Ang mga partikular na pangalan (Googlebot, Bingbot) ay nagta-target ng mga partikular na crawler. Maaaring mag-stack ng mga panuntunan ang maramihang mga bloke ng User-agent.

Huwag payagan: Hinaharangan ng <path> ang mga landas na nagsisimula sa ibinigay na prefix. Huwag payagan: / hinaharangan ang buong site. Huwag payagan: /admin/ hinaharangan ang anumang bagay sa ilalim ng /admin/. Trailing slash bagay; Disallow: /admin (no slash) ay tumutugma din sa /administrator.

Ang crawl-delay (sa mga segundo) ay humihiling ng mas mabagal na pag-crawl. Idineklara ng Sitemap (ganap na URL) ang lokasyon ng iyong sitemap. # nagsisimula ng linya ng komento.

Pinakamahusay na Kasanayan

Mga madalas itanong

Maaari ko bang i-customize ang nabuong output?
Oo. Nagbibigay ang tool ng iba't ibang mga pagpipilian sa pagpapasadya upang maiangkop ang output sa iyong mga partikular na pangangailangan. Ayusin ang mga setting bago bumuo, o muling buuin gamit ang iba't ibang mga opsyon.
Libre bang gamitin ang nabuong nilalaman?
Oo. Ang lahat ng iyong nabuo gamit ang tool na ito ay sa iyo upang gamitin para sa personal, pang-edukasyon, o komersyal na layunin nang walang anumang mga paghihigpit o kinakailangan sa pagpapatungkol.
Nangangailangan ba ito ng account?
Hindi. Ang tool ay handa nang gamitin kaagad nang walang pag-sign-up, walang email, at walang pagpaparehistro. Buksan lamang ang pahina at simulan ang pagbuo.
Pinapanatili bang pribado ang aking data ng input?
Oo. Ang lahat ng pagproseso ay nangyayari sa iyong browser. Ang iyong input data at nabuong output ay hindi kailanman ipapadala sa anumang panlabas na server.
Paano ko iba-block ang isang bot ngunit papayagan ang iba?
Paghiwalayin ang mga bloke ng User-agent. Ahente ng gumagamit: BadBot na sinusundan ng Disallow: / hinaharangan ang BadBot. User-agent: * na may Allow: / ay nagbibigay-daan sa iba.
Ang robots.txt ba ay case-sensitive?
Case-sensitive ang pagtutugma ng path. Huwag payagan: /Ang admin ay hindi tumutugma sa /admin. Itugma ang aktwal na kaso ng iyong mga URL.
Ang Crawl-delay ba ay talagang nagpapabagal sa Google?
Hindi pinarangalan ng Google ang Crawl-delay. Pinararangalan nito ang mga setting ng crawl rate sa Search Console. Iginagalang ng ibang mga crawler (Bing, Yandex) ang Crawl-delay.
Na-upload ba ang aking data?
Hindi. Nangyayari ang pagbuo sa iyong browser.