robots.txt ਜਨਰੇਟਰ
ਆਪਣੀ ਵੈੱਬਸਾਈਟ ਲਈ ਤੁਰੰਤ ਇੱਕ robots.txt ਫਾਈਲ ਤਿਆਰ ਕਰੋ। ਵਰਤੋਂਕਾਰ-ਏਜੰਟ ਨਿਯਮ ਸ਼ਾਮਲ ਕਰੋ, ਮਾਰਗਾਂ ਨੂੰ ਮਨਜ਼ੂਰੀ ਦਿਓ/ਅਸਵੀਕਾਰ ਕਰੋ, ਕ੍ਰੌਲ-ਦੇਰੀ, ਅਤੇ ਸਾਈਟਮੈਪ URL। ਮੁਫ਼ਤ, ਰੀਅਲ-ਟਾਈਮ robots.txt ਜਨਰੇਟਰ।
ਆਪਣੀ ਵੈੱਬਸਾਈਟ ਲਈ ਤੁਰੰਤ ਇੱਕ robots.txt ਫਾਈਲ ਤਿਆਰ ਕਰੋ। ਵਰਤੋਂਕਾਰ-ਏਜੰਟ ਨਿਯਮ ਸ਼ਾਮਲ ਕਰੋ, ਮਾਰਗਾਂ ਨੂੰ ਮਨਜ਼ੂਰੀ ਦਿਓ/ਅਸਵੀਕਾਰ ਕਰੋ, ਕ੍ਰੌਲ-ਦੇਰੀ, ਅਤੇ ਸਾਈਟਮੈਪ URL। ਮੁਫ਼ਤ, ਰੀਅਲ-ਟਾਈਮ robots.txt ਜਨਰੇਟਰ।
robots.txt ਇੱਕ ਵੈਬਸਾਈਟ ਦੇ ਰੂਟ 'ਤੇ ਇੱਕ ਸਧਾਰਨ ਟੈਕਸਟ ਫਾਈਲ ਹੈ ਜੋ ਕ੍ਰੌਲਰਾਂ ਨੂੰ ਦੱਸਦੀ ਹੈ ਕਿ ਉਹ ਕਿਹੜੇ ਮਾਰਗਾਂ 'ਤੇ ਜਾ ਸਕਦੇ ਹਨ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਕਿਸ ਤੋਂ ਬਚਣਾ ਚਾਹੀਦਾ ਹੈ। ਫਾਰਮੈਟ 1994 ਦਾ ਹੈ ਅਤੇ ਲਗਭਗ ਹਰ ਖੋਜ ਇੰਜਣ ਅਤੇ ਚੰਗੇ ਵਿਵਹਾਰ ਵਾਲੇ ਕ੍ਰਾਲਰ ਦੁਆਰਾ ਸਮਰਥਿਤ ਹੈ। ਫਾਈਲ ਸਲਾਹਕਾਰੀ ਹੈ — ਖਤਰਨਾਕ ਕ੍ਰਾਲਰ ਇਸ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਦੇ ਹਨ — ਪਰ ਜਾਇਜ਼ ਕ੍ਰਾਲਰ (Google, Bing, ਆਦਿ) ਇਸਦੇ ਨਿਰਦੇਸ਼ਾਂ ਦਾ ਭਰੋਸੇਯੋਗਤਾ ਨਾਲ ਸਨਮਾਨ ਕਰਦੇ ਹਨ।
ਆਮ ਵਰਤੋਂ: ਐਡਮਿਨ ਖੇਤਰਾਂ (/wp-admin/, /admin/) ਤੋਂ ਕ੍ਰੌਲਰਾਂ ਨੂੰ ਬਲੌਕ ਕਰਨਾ, ਡੁਪਲੀਕੇਟ ਸਮੱਗਰੀ ਪੈਦਾ ਕਰਨ ਵਾਲੇ ਪਹਿਲੂ ਖੋਜ URL ਪੈਰਾਮੀਟਰਾਂ ਨੂੰ ਛੱਡ ਕੇ, ਸਟੇਜਿੰਗ ਜਾਂ ਵਿਕਾਸ ਮਾਰਗਾਂ ਦੀ ਇੰਡੈਕਸਿੰਗ ਨੂੰ ਰੋਕਣਾ, ਸਾਈਟਮੈਪ ਟਿਕਾਣਾ ਘੋਸ਼ਿਤ ਕਰਨਾ, ਅਤੇ ਦੂਜਿਆਂ ਨੂੰ ਬਲੌਕ ਕਰਦੇ ਸਮੇਂ ਖਾਸ ਉਪਭੋਗਤਾ ਏਜੰਟਾਂ ਨੂੰ ਇਜਾਜ਼ਤ ਦੇਣਾ। ਫਾਈਲ ਨੂੰ ਹਰੇਕ ਕ੍ਰਾਲ ਸੈਸ਼ਨ ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਪੜ੍ਹਿਆ ਜਾਂਦਾ ਹੈ।
ਇਹ ਜਨਰੇਟਰ ਫਾਰਮ ਇਨਪੁੱਟਾਂ ਤੋਂ ਸਿੰਟੈਕਟਿਕ ਤੌਰ 'ਤੇ ਸਹੀ robots.txt ਬਣਾਉਂਦਾ ਹੈ। ਆਮ ਪੈਟਰਨ (ਸਭ ਨੂੰ ਇਜਾਜ਼ਤ ਦਿਓ, ਸਭ ਨੂੰ ਰੋਕੋ, ਖਾਸ ਮਾਰਗਾਂ ਨੂੰ ਰੋਕੋ) ਟੈਂਪਲੇਟ ਹਨ; ਕਸਟਮ ਨਿਯਮ ਪ੍ਰਤੀ ਉਪਭੋਗਤਾ ਏਜੰਟ ਸ਼ਾਮਲ ਕੀਤੇ ਜਾ ਸਕਦੇ ਹਨ। ਆਉਟਪੁੱਟ ਤੁਹਾਡੀ ਸਾਈਟ ਰੂਟ ਦੇ /robots.txt 'ਤੇ ਜਾਂਦੀ ਹੈ।
ਹੱਥ-ਲਿਖਤ robots.txt ਗਲਤੀ ਦਾ ਸ਼ਿਕਾਰ ਹੈ। ਸੰਟੈਕਸ ਦੀਆਂ ਗਲਤੀਆਂ (ਕੇਸ ਸੰਵੇਦਨਸ਼ੀਲਤਾ, ਸਹੀ ਮਾਰਗ ਮੇਲ, ਨਿਯਮਾਂ ਦਾ ਕ੍ਰਮ) ਚੁੱਪਚਾਪ ਗਲਤ ਵਿਵਹਾਰ ਪੈਦਾ ਕਰਦੇ ਹਨ — ਜਿਨ੍ਹਾਂ ਮਾਰਗਾਂ ਨੂੰ ਤੁਸੀਂ ਬਲੌਕ ਕਰਨਾ ਚਾਹੁੰਦੇ ਹੋ, ਉਹ ਕ੍ਰੌਲ ਕੀਤੇ ਰਹਿੰਦੇ ਹਨ, ਜਾਂ ਉਹ ਮਾਰਗ ਜਿਨ੍ਹਾਂ ਨੂੰ ਤੁਸੀਂ ਸੂਚੀਬੱਧ ਕਰਨਾ ਚਾਹੁੰਦੇ ਸੀ ਬਾਹਰ ਕਰ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ। ਇੱਕ ਜਨਰੇਟਰ ਜੋ ਸਹੀ ਸੰਟੈਕਸ ਪੈਦਾ ਕਰਦਾ ਹੈ ਇਹਨਾਂ ਖਰਾਬੀਆਂ ਤੋਂ ਬਚਦਾ ਹੈ।
robots.txt ਦੇ ਦੂਜੇ ਐਸਈਓ ਟੂਲਸ ਨਾਲ ਸੂਖਮ ਪਰਸਪਰ ਪ੍ਰਭਾਵ ਵੀ ਹਨ। robots.txt ਵਿੱਚ ਇੱਕ ਮਾਰਗ ਨੂੰ ਅਸਵੀਕਾਰ ਕਰਨਾ ਇਸਨੂੰ ਖੋਜ ਨਤੀਜਿਆਂ ਵਿੱਚ ਦਿਖਾਈ ਦੇਣ ਤੋਂ ਨਹੀਂ ਰੋਕਦਾ (Google ਇਸ ਨੂੰ ਕ੍ਰੌਲ ਕੀਤੇ ਬਿਨਾਂ URL ਨੂੰ ਸੂਚੀਬੱਧ ਕਰ ਸਕਦਾ ਹੈ); meta noindex ਲਈ ਪੰਨੇ ਨੂੰ ਪਹਿਲਾਂ ਕ੍ਰੌਲ ਕਰਨ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਇਹ ਜਾਣਨਾ ਕਿ ਕਿਸ ਇਰਾਦੇ ਲਈ ਕਿਹੜੇ ਸਾਧਨ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਹੈ; ਜਨਰੇਟਰ ਤੁਹਾਡੀ ਅਗਵਾਈ ਕਰ ਸਕਦਾ ਹੈ।
ਇੱਕ ਟੈਂਪਲੇਟ ਚੁਣੋ, ਅਨੁਕੂਲਿਤ ਕਰੋ, ਤੈਨਾਤ ਕਰੋ।
ਫਾਰਮੈਟ: ਵਰਤੋਂਕਾਰ-ਏਜੰਟ: <name> ਤੋਂ ਬਾਅਦ ਆਗਿਆ ਦਿਓ/ਅਸਵੀਕਾਰ ਕਰੋ ਨਿਰਦੇਸ਼। * ਸਾਰੇ ਬੋਟਾਂ ਨਾਲ ਮੇਲ ਖਾਂਦਾ ਹੈ। ਖਾਸ ਨਾਮ (Googlebot, Bingbot) ਖਾਸ ਕ੍ਰਾਲਰ ਨੂੰ ਨਿਸ਼ਾਨਾ ਬਣਾਉਂਦੇ ਹਨ। ਮਲਟੀਪਲ ਯੂਜ਼ਰ-ਏਜੰਟ ਬਲਾਕ ਨਿਯਮਾਂ ਨੂੰ ਸਟੈਕ ਕਰ ਸਕਦੇ ਹਨ।
ਅਸਵੀਕਾਰ ਕਰੋ: <path> ਦਿੱਤੇ ਅਗੇਤਰ ਨਾਲ ਸ਼ੁਰੂ ਹੋਣ ਵਾਲੇ ਮਾਰਗਾਂ ਨੂੰ ਰੋਕਦਾ ਹੈ। ਅਸਵੀਕਾਰ ਕਰੋ: / ਪੂਰੀ ਸਾਈਟ ਨੂੰ ਬਲੌਕ ਕਰਦਾ ਹੈ। ਅਸਵੀਕਾਰ ਕਰੋ: /admin/ /admin/ ਦੇ ਅਧੀਨ ਕੁਝ ਵੀ ਬਲਾਕ ਕਰਦਾ ਹੈ। ਟ੍ਰੇਲਿੰਗ ਸਲੈਸ਼ ਮਾਮਲੇ; ਅਸਵੀਕਾਰ ਕਰੋ: /admin (ਕੋਈ ਸਲੈਸ਼ ਨਹੀਂ) /administrator ਨਾਲ ਵੀ ਮੇਲ ਖਾਂਦਾ ਹੈ।
ਕ੍ਰੌਲ-ਦੇਰੀ (ਸਕਿੰਟਾਂ ਵਿੱਚ) ਹੌਲੀ ਕ੍ਰੌਲਿੰਗ ਦੀ ਬੇਨਤੀ ਕਰਦਾ ਹੈ। ਸਾਈਟਮੈਪ (ਸੰਪੂਰਨ URL) ਤੁਹਾਡੇ ਸਾਈਟਮੈਪ ਸਥਾਨ ਦੀ ਘੋਸ਼ਣਾ ਕਰਦਾ ਹੈ। # ਇੱਕ ਟਿੱਪਣੀ ਲਾਈਨ ਸ਼ੁਰੂ ਕਰਦਾ ਹੈ।