خبير Semalt: دليل لمنع Google من الزحف إلى ملفات Sitemap القديمة

مع نمو موقعك على الويب ، ستبذل قصارى جهدك للعثور على طرق لتحسين ظهوره ومصداقيته على الإنترنت. في بعض الأحيان ، تظل آثار كيفية عمل مواقعنا في الخلف ، وهذا هو المكان الذي يجب الانتباه إليه.

اطلع على النصائح التالية من Max Bell ، مدير نجاح العملاء في Semalt ، لمنع Google من الزحف إلى المواقع القديمة.

قبل بضعة أسابيع ، أخبرني أحد عملائي أنه يمتلك موقعًا للتجارة الإلكترونية. لقد مر بالعديد من التغييرات: من بنية عنوان URL إلى خريطة الموقع ، تم تعديل كل شيء لجعل الموقع أكثر وضوحًا.

لاحظ العميل بعض التغييرات في Google Search Console ووجد أخطاء الزحف هناك. ما لاحظه أن هناك عددًا كبيرًا من عناوين URL القديمة والجديدة التي كانت تولد زيارات مزيفة. ومع ذلك ، كان بعضها يعرض أخطاء رفض الوصول 403 ولم يتم العثور على أخطاء 404.

أخبرني عمي أن أكبر مشكلة واجهها كانت خريطة موقع قديمة موجودة في المجلد الجذر. استخدم موقعه على الويب مجموعة متنوعة من مكونات Google XML Sitemaps سابقًا ، ولكنه الآن يعتمد على WordPress SEO by Yoast لملف Sitemap. ومع ذلك ، فقد خلقت المكونات الإضافية القديمة لملف Sitemap فوضى له. كانت موجودة في المجلد الجذر المسمى sitemap.xml.gz. نظرًا لأنه بدأ في استخدام مكونات Yoast الإضافية لإنشاء خرائط مواقع لجميع المنشورات وفئات الصفحات والعلامات ، فإنه لم يعد بحاجة إلى هذه المكونات الإضافية بعد الآن. للأسف ، لم يرسل الشخص ملف sitemap.xml.gz إلى Google Search Console. لقد قدم فقط خريطة موقع Yoast ، وكان Google يزحف إلى خرائط موقعه القديمة أيضًا.

ما الزحف؟

لم يحذف الشخص ملف sitemap القديم من المجلد الجذر ، لذلك يتم أيضًا فهرسته. عدت إليه وشرحت أن خريطة الموقع ليست سوى اقتراح لما يجب الزحف إليه في نتائج محرك البحث . ربما تعتقد أن حذف ملفات sitemap القديمة سيوقف Google من الزحف إلى عنوان URL الذي لم يعد موجودًا ، ولكن هذا ليس صحيحًا. تقول تجربتي أن Google تحاول فهرسة كل عنوان URL قديم عدة مرات في اليوم ، مع التأكد من أن أخطاء 404 حقيقية وليست حادثًا.

يمكن لـ Googlebot تخزين ذاكرة الروابط القديمة والجديدة التي سيجدها في خريطة الموقع الخاصة بموقعك. يزور موقعك على الويب على فترات منتظمة ، مع التأكد من فهرسة كل صفحة بشكل صحيح. يحاول Googlebot تقييم ما إذا كانت الروابط صالحة أو غير صالحة بحيث لا يواجه الزوار أي مشكلة.

من الواضح أنه سيتم الخلط بين مشرفي المواقع عندما يزداد عدد أخطاء الزحف لديهم. كلهم يريدون تقليله إلى حد كبير. كيفية إبلاغ Google بتجاهل جميع خرائط المواقع القديمة؟ يمكنك القيام بذلك عن طريق قتل جميع عمليات الزحف غير المرغوب فيها وملفات خرائط الموقع الغريبة. في السابق ، كانت الطريقة الوحيدة لجعلها ممكنة هي ملفات .htaccess. بفضل WordPress لتزويدنا ببعض المكونات الإضافية.

تحتوي مواقع WordPress على هذا الملف في مجلدات الجذر الخاصة بها. لذلك ، تحتاج فقط إلى الوصول إلى FTP وتمكين الملفات المخفية في cPanel. انتقل إلى خيار File Manager لتحرير هذا الملف وفقًا لمتطلباتك. يجب ألا تنسى أن تعديله بشكل خاطئ يمكن أن يضر بموقعك ، لذلك يجب عليك دائمًا نسخ جميع البيانات احتياطيًا.

بمجرد إضافة المقتطف إلى الملف ، ستختفي جميع عناوين URL منتهية الصلاحية من أخطاء الزحف في لمح البصر. يجب ألا تنسى أن Google يريدك أن تبقي موقعك على الويب مباشرًا ، مما يقلل من فرص حدوث أخطاء 404.

mass gmail