- محمد امین خرمی
- 1391-01-05 06:42:00
- کد مطلب : 3504
عملکرد الگوریتم گوگل پاندا، فاکتورهای مدنظر آن در رتبه بندی وبسایتها و بهینه سازی وبسایت برای موتورهای جستجو است و «گوگل پاندا» (Google Panda) سلسله تغییراتی است که از اواخر فوریه 2011 (اسفند 1389) در الگوریتم نمایش نتایج جستجو در گوگل اعمال شد و همچنان ادامه دارد. این تغییرات با هدف کاهش رتبه سایت های «کیفیت پایین» دنبال می شود و سایت های باکیفیت را در بالای صفحه نمایش نتایج جستجو نشان میدهد.
گوگل هر ساله الگوریتم جستجوی خود را بارها تغییر میدهد اما بسیاری از این تغییرات جزئی هستند و اهمیت زیادی ندارد. در این الگوریتم طی بازههای چندماهه، البته تغییرات جامعی صورت میگیرد که بسیاری از نتایج جستجو را تحت تاثیر قرار میدهد.
«گوگل پاندا» (Google Panda) سلسله تغییراتی است که از اواخر فوریه 2011 (اسفند 1389) در الگوریتم نمایش نتایج جستجو در گوگل اعمال شد و همچنان ادامه دارد. این تغییرات با هدف کاهش رتبه سایت های «کیفیت پایین» دنبال می شود و سایت های باکیفیت را در بالای صفحه نمایش نتایج جستجو نشان میدهد.
در اثر این تغییرات، بسیاری از وب سایت های خبری و شبکه های اجتماعی در جستجوی گوگل در جایگاه بالاتری قرار گرفتند و در مقابل سایت هایی که حجم بسیار زیادی آگهی تبلیغاتی در خود جای داده بودند به رده های پایین سقوط کردند. بر این اساس طبق اعلام گوگل، در اولین نسخه گوگل پاندا چیزی در حدود 12 درصد از تمام نتایج جستجوی این موتور جستجو تحت تاثیر این تغییرات قرار گرفت.
روبات های crawler گوگل، زمانی که در فضای وب می چرخند تمامی وب سایت ها و لینک هایی که به این محیط اضافه می شوند را شناسایی کرده و همه آن ها را به یک ایندکس غول پیکر اضافه می کنند. هر صفحه ای که ایندکس می شود از الگوریتمی عبور داده می شود که شاخصه های متعدد رتبه بندی گوگل را در بر دارد. این شاخصه ها تعیین می کنند که این صفحه در کجای رتبه بندی گوگل و در کدام صفحه نمایش نتایج جستجو باید قرار گیرد. اما جای پاندا در الگوریتم جستجوی گوگل کجاست؟ پاندا در بالای این الگوریتم می نشیند تا ناخالصی ها را جدا کند.
پیش از این، سایت های کیفیت پایین زیادی با کپی برداری از مطالب دست اول سایت های دیگر، رتبه خود را در صفحه نمایش نتایج جستجو در گوگل به خوبی ارتقاء داده بودند. اما پاندا به دنبال مطالب دست اول و تولیدی وب سایت هاست و رتبه وب سایت هایی که دارای اینگونه مطالب باشند را ارتقاء می دهد و در برابر، رتبه سایت هایی که از سایت های دیگر کپی برداری می کنند و مطالب کیفیت پایین منتشر می کنند را کاهش می دهد.
با این دید، آیا به راستی گوگل پاندا در راستای منافع کاربران اینترنت موفق عمل کرده است؟ نتایج حاصل از برخی تحقیقات انجام شده مؤید این مسئله است. مجله نیوساینتیست در شماره 15 دسامبر 2011 خود به بررسی این موضوع پرداخت. در بررسی انجام شده از تعدادی کاربران اینترنت خواسته شد در دو مرحله در ماه های مارس و آگوست 2011، در موتورهای جستجوی گوگل و بینگ 50 جستجوی از پیش تعیین شده را انجام دهند تا مشخص شود آیا این دو موتور جستجو واقعا طبق اعلام خود موفق شده اند کاربران را از شر «علفزارهای محتوا» (content farm) نجات دهند یا خیر. علفزار محتوا اصطلاحی است که برای وب سایت هایی به کار برده می شود که نویسنده های زیادی دارند که بی محابا مطلب منتشر می کنند اما بیشتر مطالب آن ها کپی برداری از مطالب تولیدی وب سایت های دیگر است. اغلب، مطالب منتشر شده در این گونه وب سایت ها بدون ذکر منبع آورده می شوند و از اعتبار لازم نیز برخوردار نیستند و به نحوی انتخاب می شوند که با جستجوی های انجام شده در موتورهای جستجو به خوبی همخوانی داشته باشند. این وب سایت ها تنها به دنبال کشاندن کاربران به سوی خود، بالا بردن بازدید روزانه و بالا بردن رتبه خود در میان نتایج جستجو هستند. هدف اصلی در پس این سایت ها، سودجویی از طریق جذب کلیک و در نتیجه آگهی بیشتر است.
در چارچوب بررسی انجام شده توسط کارشناسان نیوساینتیست، جستجوهایی از این دست انجام شد: «چطور برای ماراتون تمرین کنیم؟» پیش از این، نتایج جستجو برای این گونه عبارت ها اغلب کاربران را به سایت هایی هدایت می کرد که هدف اصلی آن ها نمایش آگهی های تبلیغاتی بود و بس. این گونه سایت ها، در بررسی نیوساینتیست سایت های «کیفیت پایین» در نظر گرفته شدند. نتیجه جالب اینکه مثلا در مورد جستجوی «تمرین برای ماراتون» در ماه مارس 2011 (چند روز بعد از اعمال اولین نسخه از گوگل پاندا) سایت هایی در 10 رتبه بالای جستجوی گوگل نمایش داده می شدند که محل تبلیغ کفش های دو ماراتون، لوازم ورزشی و اجناسی از این دست بودند. جستجوهای انجام شده در ماه آگوست (مرحله دوم، یعنی شش ماه پس از معرفی گوگل پاندا) به وضوح نتایج دیگری در بر داشت؛ رتبه های بالای صفحه نتایج جستجو این بار در اختیار وب سایت های با کیفیت و معتبر بود؛ مثلا در مورد همین عبارت مورد جستجو، وب سایت مجله دنیای دونده اکنون به صفحه اول آمده و بالاتر از دیگر نتایج قرار گرفته بود. با بررسی 50 جستجوی انجام شده توسط کاربران متعدد، مشخص شد گوگل و بینگ در غربالگری وب سایت ها موفق عمل کرده بودند.
اکنون با گذشت حدود هفت ماه از بررسی نیوساینتیست، در صورتی که همان عبارت مربوط به ماراتون را در گوگل جستجو کنیم، خواهیم دید که نتایج جستجو باز هم دقیق تر شده است [این جا را ببینید]. این بار وب سایتی که مختص تمرین در دوی ماراتون است (www.marathonrookie.com) از مجله دنیای دونده نیز بالاتر آمده و در رتبه اول نتایج جستجو، نمایش داده شده است. دیگر وب سایت های لیست شده در صفحه اول نتایج جستجو نیز وب سایت های معتبر و با کیفیت هستند و دیگر خبری از وب سایت های تبلیغاتی نیست.
مشکل علفزارهای محتوا، در میان وب سایت های فارسی زبان نیز به وفور وجود دارد. البته شواهد نشان می دهد طی ماه های اخیر پاندای گوگل به خوبی در میان وب سایت های فارسی زبان نیز دست به کار شده و کاربران را از دست وب سایت هایی که پر از محتوای نامربوط وآگهی های تبلیغاتی بودند نجات داده است. پیش از این، در جستجوی عبارت های «عمومی» در گوگل، معمولا به راحتی می توانستید از خیر چند نتیجه اول صفحه نمایش نتایج جستجو بگذرید، چرا که رتبه های بالای نتایج جستجو اغلب در اختیار وب سایت های کیفیت پایین و تبلیغاتی بود.
الگوریتم گوگل پاندا عنوان خود را از نام خانوادگی یکی از مهندسان اصلی این پروژه در شرکت گوگل گرفته است؛ ناونیت پاندا. گوگل جزئیات زیادی در مورد نحوه عملکرد الگوریتم جستجوی خود منتشر نمی کند، و شاید یکی از رموز موفقیت آن در برابر رقبا را باید در همین نکته دید. با این وجود، وبلاگ رسمی وب مستر گوگل بر روی Blogspot تاکنون با وب مسترها مهربان بوده و گاه به گاه نکاتی را در مورد شاخصه های مورد نظر پاندا در دست چین کردن و رتبه بندی وب سایت ها منتشر می کند. به طور مثال در بخشی از یکی از پست های این وبلاگ آمده است:
«محتوای کیفیت پایین در بخش هایی از سایت می تواند روی رتبه کل سایت تاثیر بگذارد.»
بر اساس این شاخصه، بدون شک باید فکری به حال محتوای کیفیت پایین که ممکن است مدت ها قبل بر روی وب سایت خود منتشر کرده اید نیز باشید؛ یا آن ها را اصلاح کنید یا آن ها را برای همیشه از روی وب سایت خود حذف کنید.
گوگل اغلب بدون اطلاع قبلی الگوریتم پاندا را به روز می کند و سپس معمولا از طریق گفته های غیررسمی می توان از این مسئله باخبر شد و نهایتا با تاخیر می توان تایید مسئولان گوگل در مورد آپدیت جدید این الگوریتم را گرفت. وب مسترها همیشه تغییرات و آپدیت های پاندای گوگل را رصد می کنند. اما چرا اطلاع از زمان آپدیت های گوگل پاندا برای وب مسترها از اهمیت بالایی برخوردار است؟ در این میان نکته مهمی وجود دارد و آن تفاوت در عملکرد الگوریتم پاندا نسبت به الگوریتم کلی جستجو در گوگل است. در حالت عادی با اضافه شدن یک لینک به یک وب سایت، روبات های crawler گوگل به آن سر می زنند و آن را ایندکس می کنند. این موضوع در مورد سایت هایی که رتبه بالایی دارند بلافاصله انجام می شود و سایت هایی که رتبه پایین تری دارند، معمولا از یک تا چند روز باید صبر کنند تا لینک آن ها نیز ایندکس شود و در نتایج جستجو نمایش داده شود.
باز گردیم به سوال؛ چرا اطلاع از زمان آپدیت های گوگل پاندا برای وب مسترها اهمیت دارد؟ همانطور که اشاره شد پاندا عملکردی متفاوت دارد؛ پاندا با هر بار آپدیت سری به وب سایت ها می زند و بر اساس شاخصه های خود (که ممکن است به روز شده باشند یا خیر) وب آن ها را رتبه بندی می کند. در این زمان، وب سایت های زیادی ارتقاء پیدا می کنند و بسیاری نیز مورد غضب پاندا قرار می گیرند و سقوط می کنند. تا آپدیت بعدی پاندا - که طبق سابقه گاهی ممکن است از چند روز تا دو ماه متغیر باشد - وب سایت هایی که دچار کاهش بازدید شده اند باید خود را با شاخصه های پاندا به روز کنند تا بار دیگر رتبه خود را به دست آورند. برای دیدن لیست کامل آپدیت های گوگل پاندا می توانید به این جا مراجعه کنید.
اگر بخواهیم ارتقاء و سقوط وب سایت ها را در اثر آپدیت های گوگل پاندا ببینیم، بد نیست به بررسی انجام شده توسط وب سایت searchmetrics.com در مورد تاثیر آپدیت 2.5 پاندا که در اواخر سپتامبر 2011 از سوی گوگل اعمال شد نگاهی داشته باشیم. در این آپدیت هم مثل آپدیت های قبلی، برخی وب سایت های امریکایی جزء بازنده ها بودند و برخی دیگر جزء برنده های میدان جستجو. در تصویر زیر آدرس دومین برخی از این وب سایت ها آمده است. همچنین درصد رشد و یا سقوط آن ها نیز مشخص شده است.
در مورد شاخصه های مدنظر پاندا باید به تفصیل سخن گفت. اما در عین حال شاید بتوان نکات کلی و اصلی در این زمینه که باید به نوعی در اداره یک وب سایت از آن ها فاصله گرفت را به طور خلاصه اینگونه بر شمرد؛ هر چند این لیست را به هیچ وجه نمی توان لیستی کامل دانست:
- استفاده بیش از حد از تبلیغات
- متاتگ ها و تگ های نامناسب در وب سایت
- استفاده بیش از حد از یک تگ یا تگ های نامربوط در یک صفحه
- لینک های منقطع (به طور مثال لینک هایی که به خطای 404 منتهی می شوند)
- محتوای کیفیت پایین در کل وب سایت
- محتوای کیفیت پایین در بخشی از وب سایت
- زمان کوتاه حضور هر کاربر بر روی وب سایت
- مشکلات فنی وب سایت
- استفاده از قالب های آماده
نکاتی که باید در مورد شاخصه های مدنظر گوگل پاندا رعایت کرد، در حوزه SEO یا «بهینه سازی وب سایت برای موتورهای جستجو» قرار می گیرد. نکته مهم آن که اکنون دیگر زمان فریب گوگول با استفاده از ترفندهای خاص بهینه سازی به پایان رسیده است. بدون شک پاندای گوگل باهوش تر از همیشه در بالاترین نقطه الگوریتم جستجوی گوگل نشسته و کار جداسازی لینک ها را انجام می دهد و همواره مخاطب و خوراکی که به او ارائه می دهد را بیش از هر چیز دیگر مد نظر قرار می دهد.
در تصویر اینفوگرافیک این صفحه، نکاتی تکمیلی در مورد گوگل پاندا ارائه شده است:
لطفا برای دیدن فایل اینفوگرافیک به صورت کامل و در اندازه اصلی،
روی عکس کلیک کنید.
[حجم:784KB]