معرفی و رفع خطای Crawled ‐ currently not indexed
همانطور که میدانید؛ خطای Crawled ‐ currently not indexed، یکی از خطاهایی است که ممکن است بعد از اتمام طراحی سایت در هنگام سئو ممکن است در سرچ کنسول مشاهده کنید. در واقع این خطا بدان معناست که Googlebot از یک صفحه مشخص بازدید کرده اما آن را ایندکس نکرده است. در نتیجه، صفحه در جستجوی گوگل ظاهر نمیشود. ما تصمیم گرفتیم در ادامه این مقاله به معرفی و رفع خطای Crawled ‐ currently not indexed بپردازیم. پس تا پایان این مقاله همراه ما باشید.
Crawled ‐ currently not indexed چیست؟
طبق اسناد رسمی گوگل، این وضعیت به این معنی است: «صفحه توسط گوگل خزیده شده، اما ایندکس نشده است. ممکن است در آینده ایندکس شود یا نشود. نیازی به ارسال مجدد این URL برای خزیدن نیست. بنابراین، اساساً آنچه ما میدانیم این است که:
- گوگل قادر به دسترسی به صفحه است.
- گوگل برای خزیدن در صفحه زمان گذاشت.
- پس از خزیدن، گوگل تصمیم گرفت آن را ایندکس نکند.
کلید درک این وضعیت این است که فکر کنید چرا گوگل آگاهانه با ایندکس کردن صفحات مقابله میکند. میدانیم که گوگل در پیدا کردن صفحه مشکلی ندارد؛ اما بنا به دلایلی احساس میکند کاربران از پیدا کردن آن سودی نخواهند برد. این میتواند بسیار خسته کننده باشد، زیرا ممکن است ندانید که چرا محتوای شما ایندکس نمیشود.
رفع خطای Crawled ‐ currently not indexed
همانطور که گفتیم؛ گوگل پاسخ روشنی نمیدهد که چرا یک صفحه داده شده خزیده شده است اما ایندکس نشده است، اما چند دلیل احتمالی وجود دارد که نشان میدهد وضعیت ممکن است نشان داده شود. نحوه رفع این مشکل را با مراحل زیر بیاموزید.
ارائه محتوای با کیفیت بالا
به عنوان صاحب وب سایت، باید مطمئن شوید که صفحه شما محتوای با کیفیت بالا ارائه میدهد. بررسی کنید که آیا احتمالاً هدف کاربران شما را برآورده میکند و در صورت نیاز محتوای با کیفیت خوب اضافه کنید. گوگل لیستی از سوالات را برای کمک به شما در تعیین ارزش محتوای خود ارائه میدهد. جنبه دیگری که باید روی آن تمرکز کنید بهینهسازی محتوای تولید شده توسط کاربر در وب سایت شما است.
گوگل ممکن است صفحه را به عنوان محتوای با کیفیت پایین طبقهبندی کند. به یاد داشته باشید که گوگل نمیتواند تمام صفحات اینترنت را ایندکس کند. فضای ذخیره سازی آن محدود است، بنابراین باید محتوای با کیفیت پایین را فیلتر کند. هدف گوگل ارائه صفحاتی با بالاترین کیفیت است که به بهترین نحو به خواسته کاربران پاسخ دهد. اگر صفحهای از کیفیت پایینتری برخوردار باشد، گوگل به احتمال زیاد آن را نادیده میگیرد تا فضای ذخیرهسازی را برای محتوای با کیفیت بالاتر در دسترس بگذارد. ما میتوانیم انتظار داشته باشیم که استانداردهای کیفیت در آینده سختتر شوند.
index coverage خود را نظارت کنید.
URL ممکن است از وضعیت Crawled ‐ currently not indexed رنج ببرد. زیرا در گذشته ایندکس شده بود، اما گوگل تصمیم گرفت به مرور زمان آن را از ایندکس خارج کند. اگر تعجب میکنید که چرا، دلایل آن احتمالاً این است:
- با محتوای با کیفیت بالاتر جایگزین شد.
- تحت تاثیر الگوریتم جدیدی که عرضه شد.
- ناشی از یک باگ در سمت گوگل است. به عنوان مثال، Search Engine Land از ایندکس خارج شد. زیرا گوگل به اشتباه فرض کرد سایت هک شده است.
راه حل صفحات غیر ایندکس شده ارتباط نزدیکی با کیفیت آنها دارد. همیشه باید اطمینان حاصل کنید که صفحه شما محتوای با بهترین کیفیت را ارائه میدهد و بهروز است. تصور نکنید که وقتی یک صفحه ایندکس شد، دیگر نیازی به انجام کاری با آن ندارید؛ زیرا گوگل میتواند روش ارزیابی محتوای شما را در طول زمان تغییر دهد.
به عنوان مثال، ممکن است یک صفحه بدون محتوا ایندکس شود. با این حال، از آنجایی که رباتها صفحه را دوباره میخزند، گوگل ممکن است آن را Crawled, currently not indexed در نظر بگیرد، علیرغم سیگنالهایی که قبلاً بسیار مهم دیده میشد.
برای نظارت آسان بر index coverage خود، از ZipTie (پلتفرم هوشمند SEO و ایندکس کردن فنی) استفاده کنید. ZipTie به شما امکان میدهد تا تاخیرهای ایندکس کردن را نظارت کنید و هر هفته میزان محتوایی را که ایندکس میشود بهروزرسانی کنید. به نظارت بر صفحات خود ادامه دهید و در صورت لزوم تغییرات و بهبودها را اعمال کنید. پس از رفع مشکلات، میتوانید URLهای تجزیه و تحلیل شده را به گوگل سرچ کنسول ارسال کنید تا به گوگل کمک کنید تا تغییرات را سریعتر متوجه شود.
طراحی ساختار (structure) یک وب سایت سالم
طراحی یک وب سایت خوب برای به حداکثر رساندن شانس ایندکس شدن برای شما، کلیدی است. این به رباتهای موتور جستجو اجازه میدهد تا محتوای شما را کشف کنند و ارتباط بین صفحات را بهتر درک کنند. به همین دلیل است که ارائه یک طراحی وب سایت خوب و اطمینان از وجود لینکهای داخلی به صفحهای که میخواهید ایندکس شود بسیار مهم است. بیایید شرایطی را تصور کنیم که در آن صفحهای با کیفیت خوب دارید، اما تنها راهی که گوگل آن را پیدا کرد این است که آن را در نقشه سایت (sitemap) خود قرار دادهاید.
گوگل ممکن است به صفحه نگاه کند و آن را بخزد، اما از آنجایی که هیچ لینک داخلی وجود ندارد، فرض میکند که صفحه ارزش کمتری نسبت به سایر صفحات دارد. هیچ اطلاعات معنایی یا ساختاری برای کمک به ارزیابی صفحه وجود ندارد. این ممکن است یکی از دلایلی باشد که گوگل تصمیم گرفته است روی صفحات دیگر تمرکز کند و بعد از خزیدن آن را از ایندکس خارج کند.
محتوای تکراری خود را محدود کنید.
اول از همه، باید مطمئن شوید که صفحات اصلی ایجاد میکنید. گوگل میخواهد محتوای منحصر به فرد و ارزشمندی را به کاربران ارائه دهد. به همین دلیل است که وقتی در حین خزیدن متوجه میشود که برخی از صفحات یکسان یا تقریباً یکسان هستند، ممکن است تنها یکی از آنها را ایندکس کند. متأسفانه، محتوای تکراری ممکن است اجتناب ناپذیر باشد (به عنوان مثال، شما یک نسخه موبایل و دسکتاپ دارید). شما کنترل زیادی روی آنچه در نتایج جستجو ظاهر میشود ندارید، اما میتوانید نکاتی را در مورد نسخه اصلی به گوگل ارائه دهید. اگر متوجه شدید محتوای تکراری زیادی ایندکس میشود، عناصر زیر را ارزیابی کنید:
- تگهای Canonical: این تگهای HTML به موتورهای جستجو میگویند که کدام نسخههای اصلی هستند.
- لینکهای داخلی: اطمینان حاصل کنید که لینکهای داخلی به محتوای اصلی شما اشاره میکنند. گوگل ممکن است از آن به عنوان شاخصی برای اینکه کدام صفحه مهمتر است استفاده کند.
- sitemap (نقشه سایت) XML: مطمئن شوید که فقط نسخه Canonical در نقشه سایت (sitemap ) شما وجود دارد.
اما به یاد داشته باشید که اینها فقط نکاتی هستند و گوگل موظف به دنبال کردن آنها نیست. اگر گوگل تگ Canonical شما را نادیده بگیرد، میتوانید به لطف وضعیت Duplicate, Google chose different canonical than user آن را در GSC تشخیص دهید. شما میتوانید برای کسب اطلاعات بیشتر در مورد این خطا، مقالهی معرفی و رفع خطای Duplicate, Google chose different canonical than user را مطالعه نمایید.
تفاوت Crawled ‐ currently not indexed و Discovered ‐ currently not indexed
وضعیت Crawled ‐ currently not indexed معمولاً با یکی دیگر از مشکلات ایندکس شدن در گزارش Index Coverage با Discovered — currently not indexed اشتباه گرفته میشود. در واقع هر دو وضعیت نشان میدهد که صفحه ایندکس نشده است. با این حال، در مورد Crawled ‐ currently not indexed، گوگل قبلاً از صفحه بازدید کرده است. در همین حال، URL برای گوگل شناخته شده است در Discovered — currently not indexed، اما به دلایلی هنوز خزیده نشده است.
برخی از دلایل این وضعیتها ممکن است مشابه باشند، از جمله صفحات بیکیفیت و مشکلات لینک داخلی. با این حال، هنگامی که وضعیت Discovered ‐ currently not indexed را میبینید، باید بیشتر بررسی کنید که چرا گوگل نمیتواند یا نمیخواهد به صفحه دسترسی پیدا کند. به عنوان مثال، ممکن است مشکلاتی در کیفیت کلی کل وب سایت، مشکلات مربوط به Crawl budget یا اضافه بار سرور را نشان دهد. شما میتوانید برای کسب اطلاعات بیشتر در مورد این خطا، مقالهی معرفی و رفع خطای Discovered ‐ Currently Not Indexed را مطالعه نمایید.
شما میتوانید با مراجعه کردن به صفحه مقالات آموزشی ماکان، سایر مقالات ما را مطالعه کنید.
صفحه ما را در اینستاگرام دنبال کنید تا با مطالب روز در حوزه دیجیتال آشنا شوید.