فایل robots.txt

تمام کار هایی که در سایت انجام می شود در نهایت  توسط  ایندکس  گوگل بررسی می شود و اگر جزئیات مورد قبول ربات گوگل بود وارد جستجوی اینترنت می شود.  بنابراین  تلاش طراحان  وب و صاحبان سایت برای بالابردن بازدید  صفحات  وب  است؛ اما  برای  اینکه  بخواهید  گوگل  را  از تولید  محتوا جدید آگاه کنید لازم است  تا  اقداماتی  را  برای  سرعت  بخشیدن  به  این  امر  انجام  دهید.  فایل robots.txt  یکی از روش های آگاه سازی گوگل است.

فایل  robots.txt در واقع  فایل  نقشه  سایت  است. ربات گوگل به روش خریدن  برای  ایندکس  شدن  محتوا جستجو  می ‌کند و  درصورتی‌ که  متن  ارزش  نشان ‌دادن داشته  باشد  در نتایج جستجو  نشان  داده می ‌شود. این فایل در  واقع یک فایل  متنی است که ربات ‌ها  گوگل را برای بررسی سایت راهنمایی  می‌ کند.

 فایل robots.txt

فایل  robots.txt چیست؟

فایل  robots.txt در واقع یکی از موارد بهینه‌ سازی ایندکس صفحه ‌های وب است؛ در واقع این فایل متنی به ربات ‌هایی که به روش خریدن  به  جستجوی  سایت می ‌پردازند مسیر  لازم  را  نشان می ‌دهد؛ بنابراین  نحوه استفاده از این فایل برای جستجوی ربات ‌های گوگل بسیار مهم است. برای اینکه این فایل به ‌درستی ایجاد  شود نیازمند زمان کافی برای تنظیمات آن  برای  سایت  است.

باید توجه داشت که اولین چیزی که موتور های جستجو آن را مشاهده می ‌کنند همین  فایل یعنی فایل robots.txt است.  قرار گیری این فایل در هاست شما  اجباری است. در صورتی که فایل ربات  دات تی ایکس تی را  اعمال نکنید گوگل به صورت خودکار تمام محتوا شما را بررسی می کند در نتیجه  ایندکس صفحات  زمان بیشتری  می برد و در نهایت ممکن است اصلا مورد تائید گوگل قرار نگیرد.

از ایندکس شدن چه مواردی جلوگیری شود؟

یکی از قابلیت  های مهم  فایل robots.txt  این مورد است که میتوان انتخاب کرد کدام قسمت سایت توسط گوگل بررسی شود و کدام قسمت سایت توسط ربات گوگل بررسی نشود؛ زیرا بررسی  برخی صفحات  ارزشی برای ایندکس  شدن  یا  ایندکس شدن مجدد ندارد؛ مانند،

  • محتواها تکراری در صفحات
  • هر چیزی که باعث ایجاد محتوا  اضافی  و  تکراری  شود؛ مانند تگ ها و برچسب‌ها
  • فیلترها  مختلف، قیمت، سایز، رنگ و…
  • تمامی  صفحات  مرتبط  با  ادمین  و پنل کاربری
  • پروفایل  کاربران  و مخاطبان  سایت
  • صفحات چت و پیام
  • برخی از فایل‌ هایی که نیازی  به دیده  ‌شدن  ندارند  مانند فایل قالب ‌ها

مدیریت لینک ها در فایل robots.txt

یکی از مزایای استفاده از فایل robots.txt  مدیریت لینک هایی است که باعث بهبود  عمکلکرد  سئو  سایت و  در نتیجه قرار گیری سایت در قسمت سرچ می شود، است. URL Cloacing یا در واقع مسئله مخفی سازی لینک های مختلف و مورد نظر در سئو مطرح است. URL در واقع یکی از تکنیک های سئو شدن مطالب و بسایت است که لینک های مورد استفاده را  از دید همگان به خصوص موتور های جستجو  و  کاربران دور نگه میدارد. با کمک فایل robots.txt این موضوع قابل مدیریت است.

توجه داشته باشید که استفاده از این تکنیک توسط افراد مبتدی انجام نشود و حتماً توسط افراد حرفه‌ای و یا باتجربه انجام شود؛ زیرا یکی از تکنیک‌ های سئو کلاه‌ سیاه همین موضوع  مخفی ‌سازی  لینک  است؛ بنابراین اگر به‌ درستی  این موضوع را  اعمال نکنید از نظر گوگل شما قانون را نقض کرده‌ اید و متهم خواهید بود و در نتیجه گوگل برای شما جریمه در نظر می‌گیرد.

ویژگی های ساخت robots.txt

مواردی برای ایجاد یک فایل robots.txt وجود دارد که درصورتی‌که رعایت نشود همان‌ طور که گفته شد دچار نقض قوانین گوگل می‌ شوید، این موارد به این صورت است:

  • قرار گیری فایل txt در قسمت بالا یعنی top-level directory
  • تایپ صحیح robots.txt و عدم ایجاد تغییر؛ یعنی نوشتن حروف بزرگ یا قاطی
  • عدم توجه به فایل txt بدلیل وجود ربات ها مخرب
  • اضافه کردن فایل txt به انتهای دامنه 

دستورات  مهم  فایل  txt  چیست؟

User-agnet: مهم ترین قسمت برای آگاه سازی  ربات های جستجو این قسمت  است؛ اگر نمی خواهید یک قسمتی از سایت به هیچ  عنوان بررسی  نشود می توانید از moindex  و یا قرار دادن رمز عبور استفاده کنید.

Disallow: برعکس قسمت قبل، در این قسمت شما تعیین می ‌کنید که ربات جستجو  ارزیابی  انجام  ندهد. در واقع عملیات  محدود کردن  ربات  گوگل  برای  دسترسی  به مسیر های مهم را  انجام می ‌دهد. 

Allow: این قسمت از فایل txt ربات را قادر می سازد که بررسی را انجام دهد. با انتخاب این مورد شما تنها به یم ربات خاص اجازه می دهید  تا  ایندکس سایت را انجام دهد.

Sitemap: همانطور که از نام این مورد پیداست یعنی نقشه سایت، برای نشان دادن آدرس سایت برای ارزیابی ربات  های جستجو  استفاده  می شود. 

 فایل robots.txt

روش استفاده از سئو در فایل txt

  • هیچ یک از قسمت های سایت را که برای کرال شدن آماده کرده اید مسدود  نکنید.
  • اگر لینکی مسدود شود فایل txt به‌درستی اعمال نمی‌ شود در واقع اصلاً دنبال نمی ‌شود و در نهایت ایندکس انجام نمی‌ شود.
  • برای اینکه قسمتی از فایل توسط ربات جستجو بررسی نشود بهتر است از رمز عبور استفاده شود؛ زیرا استفاده از گزینه Disallow مانع  قوی ‌ای  نیست.
  • موتور های جستجو برای  قسمت ‌های مختلف یعنی، متن، تصویر و… وجود دارند. ربات‌ های جستجو قوانین ثابتی دارند که نیازی  به  دخالت  شما  ندارند؛ اما  اگر بتوانید در آنها تغییر ایجاد کنید به سئو سایت کمک می ‌کنید.

سخن پایانی  

فایل robots.txt در واقع یک فایل مهمی برای کمک به ایندکس شدن مطالب وب‌ سایت است که اگر  به‌ درستی اعمال شود  باعث  جلب ‌توجه  موتور های جستجو برای بررسی صفحه سایت شما می ‌شود و اگر به ‌درستی انجام نشود باعث نقض قوانین ربات جستجوی گوگل می ‌شود. 

در واقع این فایل مسیر راهنمایی برای ربات  ‌های جستجو ترسیم می ‌کند تا بخش خاصی از سایت را مورد بررسی قرار دهند و درصورتی ‌که بخش مشخصی تعیین نشود ربات جستجو تمام محتوا سایت را بررسی می ‌کند و در نهایت این موضوع ممکن است از ایندکس شدن سایت جلوگیری کند.