چگونه صفحات یتیم (Orphan Page) را پیدا و اصلاح کنیم؟
آیا صفحاتی با محتوای عالی و پتانسیل بالا برای جذب ترافیک ارگانیک دارید اما در ساختار سایت خود آنها را مشاهده نمی کنید؟ یا صفحاتی دارید اما گوگل آنها را پیدا نمی کند؟ پاسخ شما احتمالاً مثبت است. این صفحات که در اکثر وب سایت ها صفحات وجود دارد، صفحات یتیم یا Orphan Page نامیده می شود صفحات یتیم صفحاتی هستند که به آن ها لینک داده نشده و خودشان هم لینک داخلی ندارند بنابراین کراولرهای گوگل نمی توانند آن ها را پیدا کنند و در نتایج گوگل ظاهر نمی شوند. در ادامه در مورد اینکه صفحات یتیم یا Orphan Page چیست؟ چگونه آن ها را پیدا و رفع کنیم؟ صحبت می کنیم.
صفحات یتیم دقیقاً چه هستند؟
صفحات یتیم صفحاتی هستند که هیچ لینکی به آن وجود ندارند. از آنجا که هیچ پیوندی به آنها وجود ندارد، بازدیدکنندگان وب سایت و خزنده های گوگل نیز نمی توانند آنها را پیدا کنند. با این تفاسیر می توان گفت که Orphan Page صفحات عادی وب سایت هستند که به نوعی غیر قابل دسترسی تلقی می شوند. این صفحات ایندکس نشده و توسط خزنده های موتور جستجو نیز یافت نمی شوند. صفحات یتیم سایت باعث از دست دادن فرصت جذب مشتری می شود و می توانند باعث افزایش نرخ پرش کاربران شوند.
از دست دادن ترافیک صفحه، کاهش زمان ماندن کاربران در سایت و عدم نمایش در نتایج موتورهای جستجو از جمله اثرات منفی وجود صفحات یتیم در سایت شماست. برای اینکه خزنده ها صفحات شما را پیدا کنند، باید به صفحات دیگر پیوند داده شوند. به سایت خود مانند یک دنیای کامل وب نگاه کنید که عنکبوت روی آن می خزد. اگر قسمت هایی از آن شکسته یا قطع شود عنکبوت برای رسیدن از یک مکان به مکان دیگر مشکل دارد! وقتی این اتفاق برای مشتری ها بیفتد، آنها در صفحه یتیم شما باقی نمی مانند، فقط آن را ترک می کنند. در حالی که اگر لینک دهی داخلی مناسبی داشته باشید کاربران زمان بیشتری در سایت شما باقی بمانند و ممکن است از سایر صفحات سایت شما هم بازدید کنند.
چگونه صفحات یتیم Orphan Page را پیدا کنیم؟
با توجه به موارد گفته شده ممکن است این سوال برای شما پیش بیاید که چگونه می توان اینگونه صفحات را در سایت پیدا کرد؟ می توانید یک فرایند 5 مرحله ای برای شناسایی صفحات یتیم موجود در سایتتان انجام دهید. این مراحل به شرح زیر است:
گام اول: صفحات قابل جستجوی سایتتان را پیدا کنید.
شما باید لیست کامل URL های سایت که توسط خزنده ها بررسی می شوند را پیدا کنید. برای این کار به یک خزنده ی مخصوص (یک عنکبوت سئو) نیاز دارید. ScreamingFrog گزینه ی خوبی برای این کار است. تصویر زیر نمونه ای از فعالیت این خزنده می باشد.
خزنده ای که استفاده می کنید مهم نیست تنها مطمئن شوید که این خزنده صفحاتی را جستجو می کند که توسط موتورهای جستجو قابل پیدا کردن باشند. یعنی نباید صفحاتی را کرول کند که ویژگی های زیر را داشته باشند:
- شاخص دهی نشده باشند.
- توسط txt از موتورهای جستجو مخفی باشند.
کرول کردن را باید از صفحه ی خانه وب سایت خود شروع کنید. مطمئن شوید که از URL متعارف شامل https یا http مناسب و www یا غیر www استفاده می کنید. وقتی که در سایت خود کرول کردید، URL ها را به صفحه ای مانند صفحه ی اکسل زیر منتقل کنید:
گام دوم: دو علت شایع صفحات یتیم را حل کنید!
دو دلیل عمده برای وجود صفحات یتیم وجود دارد که باید بلافاصله آنها را برطرف نمایید. هر دوی این دلایل اساساً نسخه های تکراری صفحات هستند که باید بطور خودکار به طور مداوم به یک URL هدایت شوند. اگر این اتفاق نیفتد، احتمالاً به برخی از نسخه های صفحه لینک داده نشده و در نتیجه یتیم هستند.
مشکل اصلی در این مورد یتیم بودن صفحات نیست بلکه مشکل کپی بودن آنها است. ممکن است وقتی به دنبال صفحات یتیم هستید، این موارد ظاهر شوند و باید با آنها برخورد شود، بنابراین بهتر است از قبل آنها را از سر راه بردارید.
1: https / http یا www / non-www غیر متعارف
هر صفحه ی عمومی در سایت شما باید بصورت ایده آل از http یا https (ترجیحاً https) و از www یا غیر www استفاده کند. برای اطمینان از این موضوع، همه حالت های مختلف اسم سایتتان را در مرورگر تایپ کنید مثل زیر:
https://www.example.com
http://www.example.com
https://example.com
http://example.com
هر کدام از این شیوهها باید به طور خودکار به همان URL مستقیم هدایت شوند. اگر به درستی هدایت نشود، می تواند نشانه ی مشکل در سایت باشد. URL های دیگر را بررسی کنید تا ببینید مشکل چقدر گسترده است. باید چند صفحه ی دیگر از سایت خود را آزمایش کنید و فایل htaccess. سایت خود را بررسی کنید تا مطمئن شوید که تنظیمات هدایت برای این موارد به درستی انجام شده باشد.
2: اسلش های دنباله
نکته ی دیگری که باید مراقب آن باشید، استفاده ی مداوم از اسلش های دنباله است. به عنوان مثال این دو URL ممکن است محتوای یکسانی تولید کنند اما URL آنها یکسان نیست:
https://example.com/page1/
https://example.com/page1
چند صفحه در سایت را با استفاده از اسلش و بدون آن بررسی کنید و مطمئن شوید که هر دو به طور خودکار به همان URL هدایت می شوند.
گام سوم: لیستی از URL ها را از Google Analytics دریافت کنید
یکی از بهترین بخش ها برای پیدا کردن صفحات یتیم، داده های Google Analytics است. تا زمانی که در صفحاتی که می خواهید بررسی کنید، Google Analytics نصب شده باشد، اگر صفحه تا به حال یک بار هم بازدید شده باشد، سابقه ی آن در جایی از گوگل آنالیتیکس وجود دارد. برای دریافت لیست جامعی از URL ها، از نوار کناری سمت چپ به این آدرس بروید:
Behavior > Site Content > All Pages.
چگونه می توان صفحات یتیم در وب سایت را پیدا کرد؟ از آنجا که یافتن صفحات یتیم دشوار است، تعداد دفعات بازدید از آنها بسیار کم است. بر روی views Page کلیک کنید تا پیکان به سمت بالا اشاره کند، این حرکت نشان می دهد که لیست URL ها به ترتیب صعودی از کمترین به بیشترین بازدید مرتب شده اند.
با این کار صفحات یتیم به بالا منتقل می شوند. برای اطمینان از جامع بودن فهرست، به محدوده ی تاریخ در بالا سمت راست بروید. تاریخ شروع را به زمانی تنظیم کنید که Google Analytics هنوز در محل نبود و روی دکمه ی اعمال کلیک کنید.
حالا باید تا جایی که می توانیم لیست URL ها را گسترش دهیم. در پایین سمت راست روی منوی کشویی show row کلیلک کرده و بالاترین عدد ردیف ها را انتخاب کنید. بزرگترین مانع ما این است که Analytics می تواند تنها تا 5 هزار URL را به طور همزمان جمع کند. باید امیدوار باشید که این لیست شامل همه ی URL ها است، و شامل اکثر URL های یتیمی که بازدید کننده داشته اند باشد.
برای بررسی همه ی داده ها توسط Analytics احتمالاً کمی زمان لازم است. صبور باشید و سعی نکنید عجله کنید. پس از بارگیری URL ها، به سمت راست بالا بروید، Export را انتخاب کرده و یک صفحه ی اکسل باز کنید تا URL های خود را دریافت کنید. اگر کمی حرفه ای تر هستید، می توانید از Google Analytics API برای سرعت بخشیدن به این روند استفاده کنید. حالا URL ها را از فایل استخراج شده ی آنالیتیک را به اکسل صفحات یتیم خود که در بالا گفتیم کپی کنید.
باید آنها را به فرمت URL بنویسید تا به کارتان بیایند. برای این کار یک ستون جدید گذاشته و URL های صفحه ی خانه را به صورت زیر کپی کنید:
از فرمول concat () برای ترکیب اینها با هم در یک URL در ستون بعدی استفاده کنید:
سپس تنها یک فرمول را بکشید تا لیست کل URL ها بدست آید:
آدرس صفحات یتیم (orphan page) خود را شناسایی کنید
برای شناسایی URL های یتیم ، باید لیستی از URL های خزنده و لیستی از URL های Analytics پیدا شده را در اکسل مقایسه کنیم. در مثال فرضی ما، واضح است که https://example.com/11 یک صفحه ی یتیم است، اما URL های بسیار بیشتری برای غربالگری وجود خواهد داشت و ما باید مراحل شناسایی URL های یتیم خود را به صورت خودکار انجام دهیم. برای این کار، به فرمولی نیاز داریم که بررسی کند هر URL در لیست Analytics در لیست URL های Crawlable هم وجود دارد یا خیر.
بعد از این که صفحات یتیمتان مشخص شده است وقت آن است که این سوالات را از خود بپرسید:
آیا این صفحه مهم است؟ اگر چنین است، تصمیم بگیرید کجا می توانید آن را ادغام کنید. و اگر نه آن را حذف کنید.
آیا این صفحه با وجود یتیم بودن، برای کلمات کلیدی رتبه بندی شده است؟ اگر چنین است، تصمیم بگیرید کجا می توانید آن را ادغام کنید و یا آن را حذف کنید.
- آیا صفحه در طبقه بندی وب سایت شما وجود دارد؟
- آیا این صفحه کپی است یا نزدیک به کپی است؟ تصمیم بگیرید که آن محتوا را در صفحه ی مشابهی که یتیم نیست جمع کنید.
- آیا این صفحه بهینه شده است؟ آیا می توان از آن بهینه سازی و پیوند بهتری داشت؟
- آیا از منابع خارجی به این صفحه پیوند داده شده است؟
گام چهارم: حل مشکل
وقتی فهمیدید صفحه ی یتیم چه هدفی را دنبال می کند و چگونه به شما در هدایت وب سایت و اهداف بازاریابی کمک می کند، می توانید تعیین کنید که با این صفحات یتیم باید چه رفتاری داشت. اگر ضروری است بازدیدکنندگان سایت آن را از طریق مرور پیدا کنند، از سایر صفحات داخلی به آن پیوند دهید اگر دیگر نیازی به آن ها نیست آن ها را بایگانی کنید. اگر صرف بودن آن مهم است و نیازی به پیوند داخلی با صفحه ندارد، آن را به حال خود رها کنید.
گام پنجم: جلوگیری از شکل گیری مجدد صفحات یتیم
برای جلوگیری از شکل گیری صفحات جدید یتیم، ممیزی یا همان فیلتر گفته شده را به طور دوره ای تکرار کنید. همانطور که قبلاً اشاره شد، می توانید برخی از این خزنده ها را با برنامه ریزی، به طور دوره ای برای اینکار فعال کنید.
صفحات یتیم را درست کنم یا نه؟
دو نوع صفحه یتیم وجود دارد: صفحات یتیم مورد انتظار و صفحات یتیم غیر منتظره که احتمالاً باید نگران آنها باشید. مسیری که برای تعمیر صفحات یتیم خود طی می کنید به نوع آنها بستگی دارد؛ بنابراین، اولین کاری که باید هنگام مشاهده حجم بالایی از صفحات یتیم انجام دهید، بررسی شکل ظاهری آنها است.
صفحات یتیم مورد انتظار
- صفحه هایی که در حال حاضر در سایت شما وجود ندارند، اما سایت دیگری به آنها لینک می دهد. معمولاً دریافت پیوند خارجی به صفحه ای که سپس آن را حذف یا هدایت می کنید. از آنجا که پیوند قدیمی هنوز در آن وب سایت دیگر وجود دارد، Google همچنان آن را پیدا خواهد کرد.
روش رفع: از آنجا که پیوندهای وب سایت های دیگر را کنترل نمی کنید تنها راه اصلاح این نوع صفحه یتیم این است که با صاحب سایت تماس بگیرید و از آنها بخواهید تا مکان جدید صحیح صفحه را به روز کنند.
- صفحاتی که کد وضعیت 200 دارند. Google ممکن است حتی پس از حذف صفحات یتیم در سایت شما، صفحاتی را بازگرداند.
روش رفع: Google سرانجام از خزیدن این موارد دست می کشد. جای نگرانی نیست.
صفحات یتیم غیر منتظره
اینگونه صفحات به چند دسته تقسیم می شوند که عبارتند از:
1. صفحات منقضی شده که همچنان مطالب را برمی گردانند
برخی از وب سایت ها به سادگی پیوند دادن به محتوای منقضی شده (مانند محصولات حذف شده از فهرست) را متوقف می کنند و کد وضعیت (مانند HTTP 404 یا 410) را باز نمی گردانند تا نشان دهند دیگر محتوا وجود ندارد. در نتیجه صفحه قدیمی هنوز در دسترس است.
روش رفع: علاوه بر حذف پیوندها به محتوای منقضی شده، باید مطمئن شوید که صفحه منقضی شده را با کد وضعیت مناسب به روز کنید. اگر محتوا دیگر در دسترس نیست، حتماً کد آن را 404 یا 410 قرار دهید.
2. صفحات خارج شده از انتقال قبلی سایت
اینها صفحاتی هستند که هنگام انتقال سایت هدایت نمی شوند و بنابراین ممکن است محتوای قدیمی همچنان در دسترس باشد.
روش حل: اگر محتوای مشابهی در وب سایت جدید شما وجود دارد، باید این URL های قدیمی را به آنها هدایت کنید. در صورت عدم وجود، این صفحات قدیمی باید کد 404 یا کد وضعیت دریافت کند.
3. صفحات مهم و با کیفیت بالا که در ساختار وب سایت شما پیوند داده نشده اند
برخی از وب سایت ها از صفحات پیمایش (لیست های محتوا، مانند صفحات دسته یا صفحات نتایج جستجوی داخلی) استفاده می کنند که فقط در صورت برآورده شدن یک یا چند هدف پیوند داده می شوند. به عنوان مثال، زیرمجموعه ها فقط در منویی ظاهر می شوند که لیست خالی نباشد یا به حداقل موارد برسد. خواه خطای اتوماسیون باشد یا نه موارد زیادی وجود دارد مواردی که ممکن است از پیوند به صفحات با ارزش بالا غافل شویم.
نحوه رفع: روش صحیح این است که مشخص کنید چه زمانی صفحه ای مطابق با معیارهای تجاری به عنوان هدف برای ترافیک ارگانیک متوقف می شود و هنگامی که چنین شد، آن را یک بار برای همیشه حذف کنید: پیوندها را بردارید و HTTP 404 یا 410 را بازگردانید.
با توجه به نکات گفته شده امید است به اهمیت صفحات یتیم در سئو سایت پی برده باشید و بدانید که یک وب سایت مانند یک هرم یا تار عنکبوت به هم پیوسته است. باید ارتباطات بین این ساختار با لینک های داخلی حفظ شود. به همین خاطر هر مشکلی که این پیوند را تحت شعاع قرار دهد مستقیماً بازدید سایت را هدف قرار داده و در نهایت به مشکلات بزرگتری چون کاهش مشتری و کاهش سودآوری برای سایت های ارائه دهنده خدمات و کالا ختم خواهد شد. بنابراین اهمیت این صفحات را نادیده نگیرید.