راهکارهای بهبود Crawl Budget
بودجه خزش چیست؟ 7 راهکار برای بهینهسازی آن
امیدواریم که این مقاله برای شما مفید بوده و به درستی دریافته باشید که منظور از crawl budget چیست و چگونه میتوان آن را بهبود داد. تنها راهی که اطلاعات درستی در این مورد به شما ارائه میدهد، گزارشهای سرور سایت است. برای سایتهای کوچکتر نیز Screaming Frog میتواند گزینه مناسبی باشد. اگر سایت شما دارای کدهای وضعیت HTTP 5xx (خطاهای سرور) یا وقفههای زمانی اتصال است، تاثیر منفی در بودجه خزش شما خواهد گذاشت. هرگز محتوای تکراری در سایت خود نداشته باشید، زیرا گوگل تمایل دارد فقط صفحاتی را که دارای مطالب جدید هستند ایندکس کند. گوگل با توجه به شرایط سایتها، آنها را اولویتبندی و برای هرکدام یک بودجه خزش در نظر میگیرد.
این امر تأثیر مستقیم بر رتبهبندی سایت و جذب ترافیک بیشتر خواهد داشت. بهینهسازی Crawl Budget یکی از مهمترین بخشهای سئو هست که میتونه به بهبود رتبه سایتت تو نتایج جستجو کمک کنه. با رعایت نکاتی که تو این مقاله گفتم، میتونی مطمئن بشی که سایتت به بهترین نحو ممکن توسط گوگل خزش و ایندکس میشه. یکی از عوامل تعیینکننده در موفقیت وبسایتها، نحوه برخورد موتورهای جستجو با محتوای سایت است. یکی از این فاکتورها که کمتر به آن توجه میشود اما تأثیر چشمگیری بر سئو دارد، بودجه خزش (Crawl Budget) است.
انواع وبسایتهای بزرگی که بیشتر در معرض خطر تمام شدن بودجه خزش هستند، معمولاً دههاهزار صفحه فرود دارند؛ بهویژه وبسایتهای بزرگ تجارت الکترونیک و فرشگاههای آنلاین. چند دلیل وجود دارد که چرا باید سایتهای تجارت الکترونیک و آنلاینشاپهای بزرگ توجه بیشتری به محدودیت خزش داشته باشند که در ادامه آنها را بررسی میکنیم. در صورتی که گوگل یک صفحه از سایت شما را ایندکس نکند، آن صفحه در هیچ شرایطی در نتایج جستجو به کاربران نمایش داده نمی شود. زیرا موتورهای جست و جویی همانند گوگل منابع نامحدودی ندارند و باید توجه خود را بین میلیونها وبسایت تقسیم کنند. بنابراین آنها به راهی برای اولویتبندی و تقسیم منابع خود بین صفحات موجود در وب خود نیاز دارند. اختصاص بودجه خزش به هر وب سایت به آنها در انجام این کار کمک میکند.
بودجه خزش (Crawl Budget) به تعداد صفحاتی اشاره دارد که موتورهای جست و جو در یک بازه زمانی مشخص در یک وب سایت میخزند. در واقع بودجه خزش مشخص میکند که چند وقت طول میکشد که کل صفحات سایت شما دوباره توسط روباتهای گوگل بررسی شوند. صفحات با محتوای تکراری، صفحات کمکیفیت یا صفحات با هدف اسپم میتوانند بودجه کراول را هدر دهند. این صفحات ارزش ایندکس شدن ندارند و اختصاص منابع خزیدن به آنها به جای بهبود عملکرد سایت، باعث کاهش سرعت ایندکس و در نتیجه تاثیر منفی بر رتبهبندی سایت میشود. محتوای کمارزش و صفحات بیکیفیت میتوانند تأثیر منفی بر بودجه کراول سایت داشته باشند.
استفاده بهینه از این فایل میتواند به شما کمک کند تا خزندهها را به سمت صفحات مهم هدایت کنید و از خزش صفحات بیاهمیت جلوگیری کنید. سایر ابزارهای تحلیلی مانند Screaming Frog و Ahrefs نیز میتوانند کمک کنند تا ساختار لینکهای داخلی، سرعت صفحات و میزان خزش سایت را بهطور دقیق بررسی کرده و برای بهبود آن برنامهریزی کنید. موتورهای جستجو با بررسی دو متغیر در هر سایت، بودجه خزیدن یا Crawl Budget آن سایت را تعیین می کنند. برای مثال، فروشگاه های آنلاین ممکن است جستجوهایی برای رنگ هایی مانند قرمز یا سبز و محصولاتی مانند تی شرت یا چیپس سیب زمینی داشته باشند که URLهای جدیدی ایجاد می کند. بودجه خزش (Crawl Budget) به تعداد صفحاتی از سایت شما گفته می شود که در هر روز توسط خزنده ها بررسی می شوند.
به همین دلیل گوگل مجبور است که بر اساس معیارهای خودش (نیاز به خزش و محدودیت نرخ خزش)، سایتها را اولویتبندی و بودجه خزش سایتها را تعیین کند. بودجه کراول به میزان منابع و زمان اختصاصیافته توسط موتورهای جستجو برای خزیدن و ایندکسکردن صفحات وبسایت شما گفته میشود. این منابع شامل تعداد دفعاتی است که خزندهها به سایت شما مراجعه میکنند و مدت زمانی که هر صفحه در انتظار ایندکس شدن باقی میماند. هدف از مدیریت بودجه کراول، کاهش هزینهها و بهبود کارایی خزیدن است تا موتورهای جستجو بتوانند به صفحات با بالاترین اولویت و اهمیت بیشتر تمرکز کنند. گوگل بارها تأکید کرده است که تمرکز بر افزایش بودجه خزش همیشه بهترین راهحل نیست.
بودجه خزش (Crawl Budget) یکی از مفاهیم پنهان ولی بسیار تاثیرگذار در سئو است که اگر به درستی مدیریت نشود، میتواند بازدید و رتبه کلمات کلیدی وبسایت شما را تحت تاثیر قرار دهد. در واقع، بودجه خزش تعیین میکند که موتورهای جستجو چقدر از صفحات سایت شما را میتوانند بخزند و ایندکس کنند. یکی دیگر از مواردی که میتواند در افزایش کراول باجت یا بودجه خزش سایت، نقش موثری داشته باشد، ساخت بک لینک قوی است. برای ساخت بک لینک یا همان لینک سازی خارجی، باید طبق یک برنامه مشخص شده عمل کنید تا گوگل بتواند به راحتی لینکها را شناسایی کند و اعتماد بیشتری به آنها برای انجام فعالیتش داشته باشد. سعی کنید حدالامکان از دامنههای قوی، بک لینک را بگیرید تا مشکل خاصی برای شما رخ ندهد.
روند خزش سایت بدین شکل است که خزنده یا گوگل بات لیستی از urlهایی را که باید خزش کند، تحویل میگیرد و با استفاده از الگوریتمهایی که برای آن تعریف شده، شروع به گشتن در لیست موردنظر میکند. خزندهها هر بار که به سایتی میرسند، ابتدا فایل ROBOTS.TXT آن را بررسی میکنند تا مطمئن شوند برای خزش صفحات اجازه دارند یا نه. در صورتیکه هنگام خزش در سایت، یک صفحه جدید پیدا شود، خزنده آدرس URL آن را به لیست خود اضافه میکند تا در دفعات بعدی آن را خزش کند. بودجه خزش تعداد صفحاتی از سایت است که در یک روز توسط گوگل خزش میشوند. ممکن است بودجه خزش هر روز با روز قبل یا بعد آن متفاوت باشد، اما به طور کلی حول مقدار ثابتی نوسان دارد.
تو میخوای صفحاتت خزش و ایندکس بشن، اما گوگل نمیدونه آیا ارزشش رو داره یا نه و شاید نخواد به اندازهای که تو میخوای، صفحاتت رو خزش کنه. بهبود سرعت سایت باعث خزیدن بهتر رباتهای گوگل در URLهای سایت شما میشود. در واقع گوگل اعلام کرده است که سریعتر کردن سایت تجربه کاربران را بهبود میبخشد و در عین حال نرخ خزیدن را نیز افزایش میدهد. چگونگی پیوند صفحات داخل وبسایت شما به یکدیگر نقش مهمی در بهینهسازی کراول باجت دارد. جدا از بکلینکها، کراولرها به سراغ صفحاتی که لینکهای داخلی کمی دارند نمیروند یا کمتر میروند.
این کار علاوه بر دیگر مزیتهایی است که لینکهای خارجی برای سایت فراهم میکنند. ضمن اینکه لینکسازی داخلی قوی هم به خزندههای گوگل کمک میکند صفحات مختلف و جدید سایت شما را راحتتر پیدا کنند. اگر سئوی سایتی را به تازگی شروع کردهاید، احتمالا با این مشکل روبهرو شدهاید که گوگل صفحات سایت را خزش نمیکند و مدت زیادی طول میکشد تا آنها را در ایندکس قرار دهد. البته این مشکل تنها برای سایتهای تازهکار ایجاد نمیشود و هر سایتی مخصوصا سایتهای بزرگ و سایتهای خبری ممکن است با آن دستوپنجه نرم کنند. مشکلی که از پایین بودن بودجه خزش سایت ناشی میشود و میتواند روند فعالیتهای سئو را با کندی روبهرو کند.
گوگل بارها در کنفرانسها، بلاگها و مستندات خود به اهمیت کراول باجت اشاره کرده و راهنماییهایی برای وبمسترها ارائه داده است تا بتوانند از این منابع به بهترین شکل استفاده کنند. در ادامه، دیدگاه گوگل درباره بودجه خزش، اهمیت آن و توصیههایی که برای بهبود آن ارائه شده است، را بررسی خواهیم کرد. موتورهای جستجو به طور مداوم الگوریتمهای خود را بهروزرسانی میکنند، مانند الگوریتم های گوگل ، تا بهترین نتایج را به کاربران ارائه دهند. تعیین نرخ خزش به موتورهای جستجو کمک میکند تا با تغییرات الگوریتمی سازگار باشند و به سرعت محتوای جدید را خزش و ایندکس کنند. بهویژه در شرایطی که بهروزرسانیهای الگوریتمی جدیدی اجرا میشود، موتورهای جستجو نیاز دارند تا به سرعت تغییرات در سایتها را شناسایی کرده و آنها را در نتایج جستجو منعکس کنند. اگر سایت شما بارگذاری کندی داشته باشد یا سرور مرتبا با خطاهای سرور (مثل خطاهای ۵۰۰) مواجه شود، موتورهای جستجو بودجه خزش شما را کاهش میدهند.
تجزیه و تحلیل گزارش خزیدن بهترین روش برای دانستن دقیق تعداد URLهایی است که کراولرهای گوگل آنها خزیده و بررسی کردهاند. بررسی دقیق گزارش سرچ کنسول به شما این امکان را میدهد که اطلاعاتی مانند صفحات، دستهها، بخشهای خزیدهشده، دفعات خزیدن و اطلاعات دریافتی در این صفحات مختلف را جمعآوری کنید. ممکن است سرور شما از خزیدن بیشتر پشتیبانی کند، اما از آنجایی که سایت شما جدید است و احتمالاً هنوز خیلی محبوب نیست، امکان دارد موتورهای جستوجو تمایل چندانی به خزیدن سایتتان نداشته باشند. شما دوست دارید صفحات سایتتان خزیده و ایندکس شوند، اما گوگل نمیداند آیا صفحات شما ارزش ایندکس کردن را دارند یا خیر و ممکن است مایل نباشد همۀ صفحات را بررسی کند. در این مقاله از مجله پیام آوران پارسیان به شما کمک میکنیم تا مفهوم بودجه خزش Crawl Budget برای سئو را درک کنید. همچنین با تعریفی از خزنده یا کراولر به شما میگوییم که نحوۀ عملکرد رباتهای گوگل چگونه است.
در این بخش به شما نشان داده میشود که چه مواردی برای سایت شما خطرناک است و کدام صفحات اصلا خزیده نمیشود. این نقطه خوبی برای شروع اصلاح و بهبود وضعیت سایتتان و بودجه خزش آن است. توجه داشته باشید که بودجه خزش به صورت معمول چیزی نیست که نگران آن شوید. اگر یک وبسایت بزرگ دارید، ۱۰۰۰۰ صفحه و بیشتر عددی غیرمنطقی محسوب نمیشود. بهترین توصیه کارشناسان سئو این است که که روی بهبود کیفیت صفحات خود تمرکز کنید (افزودن اطلاعات مفیدتر، غنیسازی محتوای صفحات و سایر اقدامات مفید). اگر وبسایت شما بر روی یک پلتفرم میزبانی مشترک با صدها وبسایت دیگر اجرا میشود و شما یک وبسایت نسبتاً بزرگ دارید، بودجه خزش وبسایت شما بسیار محدود است.
این صفحات نه تنها هیچ ارزشی برای کاربران ندارند، بلکه باعث میشوند خزندهها زمان و منابع خود را به جای صرف کردن بر روی صفحات مهم و جدید، بر روی صفحات تکراری و کپی شده مصرف کنند. تعیین بودجه خزش مناسب برای هر سایت یکی از مهمترین گامها در سئو مخصوصا برای وبسایتهای بزرگ و پیچیده است. اما سوال اصلی این است که چطور میتوان بودجه خزش مورد نیاز یک سایت را بهدرستی تعیین کرد. عوامل مختلفی در این تعیین نقش دارند که هر کدام میتوانند تاثیر مستقیم و مهمی بر روی عملکرد سایت در نتایج جستجو داشته باشند. در ادامه به بررسی این عوامل و روشهای تعیین بودجه خزش برای هر وبسایت میپردازیم. هنگامی که ربات های خزنده موتورهای جستجوگر، بخواهند سایت شما را Crawl کنند، ابتدا به دنبال فایل robots.txt که در سایت شما وجود دارد، می گردند.
یادت باشه که گوگل باید به نوعی صفحات سایتت رو برای خزش اولویتبندی کنه و لینکها راه سادهای هستن که بفهمه کدوم صفحات محبوبترن. این مسئله فقط برای سایت تو نیست، بلکه برای همه صفحات همه سایتهای اینترنت هست که گوگل باید براشون اولویت تعیین کنه. برای اینکه صفحاتت توی نتایج جستجوی گوگل دیده بشن، اول باید گوگل اونا رو خزش و بعد ایندکس کنه. این دو مرحله باید بدون مشکل انجام بشن تا محتوای سایتت توی نتایج جستجو نمایش داده بشه. صفحات یتیم یعنی صفحاتی که هیچ لینک داخلی یا خارجی به آنها اشاره نمیکند. بنابراین اگر می خواهید از کراول باجت خودتان بیشترین بهره را ببرید مطمئن شوید که حداقل یک لینک داخلی یا خارجی به هر صفحه از سایت شما اشاره دارد.
موتور جستجوگر گوگل در خزیدن تعداد زیادی از سایت ها در یک بازه زمانی معین پیشرفت کرده است. همانطور که گفته شد، اندازه وب سایت یکی از اصلی ترین عوامل تعیین بودجه خزیدن است. بنابراین اگر یک وب سایت کوچک دارید، نیازی نیست نگران بودجه خزش باشید. صفحاتی که زمان زیادی طول میکشد تا بارگیری شوند یا اصلا بارگیری نمیشوند، تاثیری منفی بر بودجه خزش سایت شما میگذارند. زیرا این نشانهای برای موتورهای جست و جو است که وب سایت شما نمیتواند از پس صفحات خود بر بیاید. در این حالت، ممکن است که آنها یک محدودیت خزش برای وبسایت شما تنظیم کنند.
هدف نهایی، بهبود تجربه کاربری و افزایش رتبهبندی صفحات در موتورهای جستجو است. ترافیک ارگانیک، یکی از اصلیترین اهداف هر استراتژی سئو است و بهبود بودجه خزش میتواند به شکل چشمگیری در دستیابی به این هدف موثر باشد. وقتی موتورهای جستجو به صورت مداوم و کامل صفحات سایت شما را ایندکس کنند، احتمال دیده شدن محتوا و رتبهبندی در صفحه نتایج جستجو (SERP) بیشتر میشود. این موضوع برای کسبوکارهایی که به جذب مشتری از طریق جستجوی ارگانیک وابستهاند، اهمیت دارد. یکی از فعالیتهای رایجی که امروزه توسط بسیاری از سئوکاران انجام میشود، استفاده از زنجیره ریدایرکت است. هنگامی که شما بخواهید مخاطبین خود را به صفحه مشخصی از سایتتان منتقل کنید، از این زنجیره استفاده میکنید.
تمرکز بر این اصول نه تنها به بهبود بودجه خزش کمک میکند، بلکه تجربه کاربری بهتری را نیز برای بازدیدکنندگان سایت فراهم میسازد. ایندکس نشدن به موقع صفحات سایت به ویژه صفحات مهم میتواند باعث بینتیجه ماندن تلاشهای سئو شما شود. در این مرحله است که بودجه خزش یا crawl budget اهمیت بالایی پیدا میکند. شما باید در اولین فرصت، به بهینه سازی کراول باجت سایت خود اقدام کرده و به بهبود فرآیند سئو کمک کنید. بهبود و افزایش بودجه خزش یکی از اصلیترین کارهایی است که میتوانید برای بهینهسازی عملکرد وبسایت خود در نتایج جستجو انجام دهید. وقتی بودجه خزش بهینه باشد، موتورهای جستجو به طور مؤثرتری صفحات سایت شما را خزش و ایندکس میکنند، که به معنای بهبود رتبهبندی و افزایش ترافیک ارگانیک خواهد بود.
اگر صفحاتی از سایت شما ایندکس نمیشوند، ممکن است به دلیل مصرف بیش از حد بودجه خزش برای صفحات تکراری، بیارزش یا دارای خطاهای تکنیکال باشد. مدیریت صحیح این صفحات با استفاده از تگهای noindex، بهروزرسانی نقشه سایت و رفع مشکلات فنی میتواند کمککننده باشد. محتوای تولید شده توسط کاربر مانند نظرات، پستهای انجمنها و پروفایلهای کاربران، اگر بهدرستی مدیریت نشود، میتواند باعث ایجاد صفحات تکراری و کمارزش شود. این صفحات به دلیل تکرار محتوا یا کیفیت پایین، بودجه خزش را هدر میدهند. لینکهای شکسته، لینکهایی هستند که به صفحات موجود در سایت شما اشاره میکنند اما هنگام کلیک کردن، کاربر با خطای ۴۰۴ یا صفحات غیرقابل دسترس روبرو میشود. این لینکها نه تنها تجربه کاربری ضعیفی ایجاد میکنند، بلکه بودجه خزش را هدر میدهند.
سایتهایی با هزاران صفحه، دستهبندیهای پیچیده و محتوای تکراری، به بودجه خزش بیشتری نیاز دارند تا بتوانند صفحات مهم خود را بهدرستی به موتورهای جستجو معرفی کنند. به عنوان مثال، یک سایت خبری که بهطور روزانه دهها مقاله جدید منتشر میکند، نیازمند بودجه خزش بالاتری نسبت به یک سایت شرکتی کوچک با چند صفحه ثابت است. در چنین سایتهایی، داشتن نقشه سایت (XML Sitemap) بهروز و مرتب، میتواند به موتورهای جستجو کمک کند تا صفحات جدید و بهروزرسانیها را سریعتر پیدا کنند. همانطور که گفتیم هر چه صفحات بیشتری به وسیله ربات های خزنده موتورهای جستجو گر Crawl شوند، ترافیک و بازدید سایت شما بیشتر و رتبه سایت شما در صفحه نتایج جستجو گوگل بالاتر می رود. اگر وب سایت شما در این زمینه دچار ضعف و مشکل شود، وب سایت شما در صفحه نتایج جستجو گوگل دیده نخواهد شد و لطمه سنگینی به سئو سایت شما وارد خواهد شد.
پس در گام اول برای افزایش بودجه خزش باید خطاهای سایت را شناسایی و برطرف کنید. یک راه ساده برای کشف ایرادات ساختاری و سئو فنی این است که گزارش های سرور خود را دریافت کنید. در این مرحله لازم است ریدایرکت ۳۰۱ و ۲۰۰ را پیدا کنید و بقیه URLها را تعمیر کنید. شاید لازم باشد کدها را اصلاح نموده یا URL را به جای دیگری هدایت کنید. قطعا صرف اینکه بدانیم بودجه خزش چیست کمکی به بهبود سئو سایت ما نخواهد کرد. بنابراین باید راهکارهای عملی را برای بهینه کردن بودجه کراول یا خزش سایت به کار ببریم تا به هدف افزایش رتبه سایت دست پیدا کنیم.
برای مشاهده آمار و ارقام مربوط به بودجه خزش سایت، وارد گوگل سرچ کنسول شده و سپس به قسمت Settings بروید و بر روی گزینه گزارش بخش Crawl Stats کلیک کنید تا ۳ نمودار به شما نشان دهد. مدیریت فایل robots.txt می تواند به صورت دستی یا توسط یک ابزار بررسی سئو سایت انجام شود. محتوای تکراری زمانی اتفاق میافته که صفحات بسیار مشابهی توی سایتت داشته باشی. این مسئله میتونه بودجه خزش رو هدر بده چون رباتها عملاً چند نسخه از یک صفحه رو خزش میکنن. این ساختار واضح و منطقی برای سایتت ایجاد میکنه که هم برای کاربران و هم برای موتورهای جستجو راحتتر قابل پیمایشه.
در چنین شرایطی گروهی از افراد از زنجیره ریدایرکت change استفاده میکنند که در این حالت موجب معطلی کراولها شده و باعث میشود حجم زیادی از کراول باجت یا بودجه خزش سایت هدر شود. به همین جهت پیشنهاد میکنیم به روش مستقیم از کراول کمک بخواهید تا تعداد لینکهای واسطه شما کمتر شود و خزندهها صفحه اصلی سایت شما را سریعتر پیدا کنند. کراول باجت یا بودجه خزش سایت، یکی از عناصر اصلی در دیده شدن محتوای شما در گوگل است که بسیاری از متخصصین سئو به آن توجه نمیکنند. افزایش این بودجه میتواند اثرات بسیار خوبی را روی سایت شما داشته باشد. در حقیقت این بودجه به یک بازه زمانی مشخص اشاره دارد که در آن خزندههای گوگل در سایت شما حضور دارند. اساس فعالیتهای سئوی سایت بر یک چیز استوار است و آن هم ایندکس شدن صفحات در گوگل است.
حالت ایدهآل لینکسازی این است که همه صفحات سایت شما، لینکهای خارجی ارزشمندی داشته باشند و رباتهای گوگل را به سمت سایت شما هدایت کنند اما در واقعیت این اتفاق نمیافتد. اینجاست که لینکسازی داخلی بهکار میآید و میتواند رباتهای گوگل را به سمت چنین صفحاتی هدایت کند. بودجه خزش یا کراول لاجت زمانی است که یک موتور جستجوگر برای خزیدن یک وب سایت امکان پذیر می باشد. درواقع بودجه خزیدن تعداد صفحات گوگل در هر روز معین در سایت شما خزنده خواهد شد. برای اینکه بتوانید رتبه بندی صفحات خود را در گوگل ارتقاء دهید، در ابتدا باید آن را فهرست بندی نمائید. در صورتی که تعداد صفحات موجود در سایت شما از بودجه خزیدن فراتر رود، گوگل در آنها نمیخزد.
با اعمال بهترین شیوهها و ابزارهای مناسب، میتوان این مشکلات را رفع و بهبود عملکرد سایت را تضمین کرد. بهینهسازی فنی سایت شامل بهبود سرعت بارگذاری صفحات، رفع خطاهای سرور و مدیریت صحیح لینکهای داخلی است. استفاده از نقشه سایت XML بهروز و فایل robots.txt بهینه نیز میتواند به هدایت خزندهها به صفحات مهم کمک کند. یکی از دلایل اصلی تعیین نرخ خزش، مدیریت منابع خزندههای موتور جستجو است. موتورهای جستجو میلیاردها صفحه را در سراسر وب میخزند و ایندکس میکنند، اما این فرایند نیازمند مصرف منابع فراوانی است.
محدودیت خزیدن یا بار هاست، بخش مهمی از بودجه خزیدن را تشکیل میدهد. خزندههای موتورهای جست و جو برای جلوگیری از بارگذاری بیش از حد یک سرور وب با درخواستهای متعدد طراحی شدهاند، بنابراین آنها مراقب این موضوع هستند. با این کار، سایت شما به عنوان منبعی معتبر برای مخاطبان هدف شناخته میشود و رباتهای گوگل هم به ارزشمند بودن محتوای سایتتان پی میبرند و مجاب میشود که بودجه کراول سایتتان را افزایش دهند. گوگل به صراحت اعلام کرده است که بودجه خزش بهویژه برای سایتهای کوچک تا متوسط یک مشکل جدی محسوب نمیشود، چرا که Googlebot معمولاً قادر است تمام صفحات این وبسایتها را بهطور کامل بخزد. اما برای سایتهای بزرگ، مانند فروشگاههای آنلاین با هزاران محصول یا سایتهای خبری با محتوای تولیدی روزانه، بودجه خزش میتواند تعیینکننده باشد. فایل robots.txt یک فایل متنی ساده است که به خزندهها میگوید کدام صفحات را بخزند و کدامها را نادیده بگیرند.
در این راستا چالش های معمولی وجود دارند که بر روی بسیاری از وب سایت ها تاثیر منفی گذاشته اند. این صفحات رو بررسی و لینکهای شکسته رو اصلاح کن تا قابلیت خزش سایتت بهتر بشه. ریدایرکتها کاربران (و رباتها) رو از یک URL به URL دیگه میبرن و میتونن زمان بارگذاری صفحه رو کاهش بدن و بودجه خزش رو هدر بدن. این کار همچنین بهت کمک میکنه از صفحات بدون لینک داخلی جلوگیری کنی. گوگل میتونه این صفحات رو پیدا کنه، ولی خیلی راحتتره اگه لینکهای داخلی مرتبط داشته باشن. گاهی تغییرات بزرگ روی سایت هم میتونه باعث بشه گوگل سریعتر خزش کنه.
در واقع بودجه خزش به میزان اهمیتی بستگی دارد که رباتهای گوگل یا کراولرها به سایت شما میدهند. هر چه رباتها به سایت شما اهمیت بیشتر بدهند، قاعدتاً در یک بازه زمانی مشخص، تعداد صفحات بیشتری از سایت شما را کراول و ایندکس میکنند. موتورهای جستجو به دنبال محتوای باکیفیت و ارزشمند برای کاربران هستند. صفحاتی که محتوای کمارزش، کوتاه یا غیرمفید دارند، نه تنها برای کاربران جذاب نیستند، بلکه بودجه خزش را نیز هدر میدهند. این نوع محتوا میتواند شامل صفحات با محتوای تکراری، صفحات با توضیحات کوتاه محصول یا صفحات پر از تبلیغات باشد. یکی از بزرگترین عوامل هدر رفت بودجه خزش، صفحات بیارزش و محتوای تکراری است.
اگر صفحات سایت شما به هر دلیلی توسط گوگل ایندکس نشوند، فعالیتهای سئوی شما بیفایده بوده و اصلا امکان حضور در نتایج جستجوی گوگل را نخواهید داشت. ازاینرو بودجه خزش سایت اهمیت پیدا میکند، زیرا تعداد صفحاتی را که قرار است در یک مدت مشخص خزش شوند، مشخص میکند. اگر سایت شما بسته به مقیاسی که دارد، نتواند بودجه خزش موردنیاز خود را بدست آورد، ممکن است بسیاری از صفحات آن در مدت زمان موردنظر شما ایندکس نشوند. برای جلوگیری از اتلاف غیرضروری بودجه خزیدن، در فایل robots.txt صفحاتی را مشخص کنید که نباید خزیده شوند. مسدود کردن URLهای خاص به شما این امکان را میدهد تا به طور خودکار خزیدن را به صفحات مفیدتر هدایت کنید.
شما می توانید با استفاده از این ابزارها فایل robots.txt را تست و در عرض چند ثانیه گزارشی از امکان دسترسی یا عدم دسترسی بخش های مختلف سایت دست پیدا کنید. سپس فایل تصحیح شده robots.txt را دریافت و به جای فایل اولیه در وب سایت آپلود نمایید. در این قسمت برای آنهایی که احیانا مفهوم Crawl Budget را از یاد برده اند، کمی آن را برایشان روشن تر می کنیم. منظور از Crawl Budget میزان دفعات یا زمانیست که پایشگرها و ربات های گوگل در وب سایت شما سپری می کنند. مثل صفحات کاملاً مشابه یا تقریباً مشابه (که معمولاً باید ازشون اجتناب کنی).
بهینهسازی بودجه خزش برای سایتهای بزرگ به دلیل تعداد صفحات زیاد آنها بسیار مهم است. با استفاده از این روش مطمئن میشوید که صفحات مهم سایت شما که محتوای مهمی دارند، توسط ربات گوگل و سایر موتورهای جستجو قابل خزش هستند. صفحات غیرقابل فهرستبندی و صفحات نادرست مانند نشانیهای اینترنتی xx۳،xx۴ وxx۵ نباید در نقشه سایت XML شما گنجانده شوند. یکی از بهترین روشها برای بهینهسازی بودجه خزیدن این است که نقشههای سایت XML خود را به نقشههای سایت کوچکتر تقسیم کنید. به عنوان مثال میتوانید نقشه سایت XML را برای هر یک از بخشهای وب سایت خود جدا کنید، مثلا سایتمپ وبلاگ از محصولات جدا باشد. یکی از مواردی که با وجود اهمیت بالای آن، افراد کمتری با آن آشنا هستند، بحث بودجه خزش است.
https://seohacker.academy/product/seo-course-gray-hat-mastering/