آشنایی با گوگل پاندا(Google Panda)

 گوگل پاندا» (Google Panda) سلسله تغييراتي است که از اواخر فوريه 2011 (اسفند 1389) در الگوريتم نمايش نتايج جستجو در گوگل اعمال شد و همچنان ادامه دارد. اين تغييرات با هدف کاهش رتبه سايت هاي «کيفيت پايين» دنبال مي شود و سايت هاي باکيفيت را در بالاي صفحه نمايش نتايج جستجو نشان مي دهد.
در اثر اين تغييرات، بسياري از وب سايت هاي خبري و شبکه هاي اجتماعي در جستجوي گوگل در جايگاه بالاتري قرار گرفتند و در مقابل سايت هايي که حجم بسيار زيادي آگهي تبليغاتي در خود جاي داده بودند به رده هاي پايين سقوط کردند. بر اين اساس طبق اعلام گوگل، در اولين نسخه گوگل پاندا چيزي در حدود 12 درصد از تمام نتايج جستجوي اين موتور جستجو تحت تاثير اين تغييرات قرار گرفت.
روبات هاي crawler گوگل، زماني که در فضاي وب مي چرخند تمامي وب سايت ها و لينک هايي که به اين محيط اضافه مي شوند را شناسايي کرده و همه آن ها را به يک ايندکس غول پيکر اضافه مي کنند. هر صفحه اي که ايندکس مي شود از الگوريتمي عبور داده مي شود که شاخصه هاي متعدد رتبه بندي گوگل را در بر دارد. اين شاخصه ها تعيين مي کنند که اين صفحه در کجاي رتبه بندي گوگل و در کدام صفحه نمايش نتايج جستجو بايد قرار گيرد. اما جاي پاندا در الگوريتم جستجوي گوگل کجاست؟ پاندا در بالاي اين الگوريتم مي نشيند تا ناخالصي ها را جدا کند.

پيش از اين، سايت هاي کيفيت پايين زيادي با کپي برداري از مطالب دست اول سايت هاي ديگر، رتبه خود را در صفحه نمايش نتايج جستجو در گوگل به خوبي ارتقاء داده بودند. اما پاندا به دنبال مطالب دست اول و توليدي وب سايت هاست و رتبه وب سايت هايي که داراي اينگونه مطالب باشند را ارتقاء مي دهد و در برابر، رتبه سايت هايي که از سايت هاي ديگر کپي برداري مي کنند و مطالب کيفيت پايين منتشر مي کنند را کاهش مي دهد.

با اين ديد، آيا به راستي گوگل پاندا در راستاي منافع کاربران اينترنت موفق عمل کرده است؟ نتايج حاصل از برخي تحقيقات انجام شده مؤيد اين مسئله است. مجله New Scientist در شماره 15 دسامبر 2011 خود به بررسي اين موضوع پرداخت. در بررسي انجام شده از تعدادي کاربران اينترنت خواسته شد در دو مرحله در ماه هاي مارس و آگوست 2011، در موتورهاي جستجوي گوگل و بينگ 50 جستجوي از پيش تعيين شده را انجام دهند تا مشخص شود آيا اين دو موتور جستجو واقعا طبق اعلام خود موفق شده اند کاربران را از شر «علفزارهاي محتوا» (content farm) نجات دهند يا خير. علفزار محتوا اصطلاحي است که براي وب سايت هايي به کار برده مي شود که نويسنده هاي زيادي دارند که بي محابا مطلب منتشر مي کنند اما بيشتر مطالب آن ها کپي برداري از مطالب توليدي وب سايت هاي ديگر است. اغلب، مطالب منتشر شده در اين گونه وب سايت ها بدون ذکر منبع آورده مي شوند و از اعتبار لازم نيز برخوردار نيستند و به نحوي انتخاب مي شوند که با جستجوي هاي انجام شده در موتورهاي جستجو به خوبي همخواني داشته باشند. اين وب سايت ها تنها به دنبال کشاندن کاربران به سوي خود، بالا بردن بازديد روزانه و بالا بردن رتبه خود در ميان نتايج جستجو هستند. هدف اصلي در پس اين سايت ها، سودجويي از طريق جذب کليک و در نتيجه آگهي بيشتر است.

در چارچوب بررسي انجام شده توسط کارشناسان New Scientist، جستجوهايي از اين دست انجام شد: «چطور براي ماراتون تمرين کنيم؟» پيش از اين، نتايج جستجو براي اين گونه عبارت ها اغلب کاربران را به سايت هايي هدايت مي کرد که هدف اصلي آن ها نمايش آگهي هاي تبليغاتي بود و بس. اين گونه سايت ها، در بررسي New Scientist سايت هاي «کيفيت پايين» در نظر گرفته شدند. نتيجه جالب اين‌که مثلا در مورد جستجوي «تمرين براي ماراتون» در ماه مارس 2011 (چند روز بعد از اعمال اولين نسخه از گوگل پاندا) سايت هايي در 10 رتبه بالاي جستجوي گوگل نمايش داده مي شدند که محل تبليغ کفش هاي دو ماراتون، لوازم ورزشي و اجناسي از اين دست بودند. جستجوهاي انجام شده در ماه آگوست (مرحله دوم، يعني شش ماه پس از معرفي گوگل پاندا) به وضوح نتايج ديگري در بر داشت؛ رتبه هاي بالاي صفحه نتايج جستجو اين بار در اختيار وب سايت هاي با کيفيت و معتبر بود؛ مثلا در مورد همين عبارت مورد جستجو، وب سايت مجله دنياي دونده اکنون به صفحه اول آمده و بالاتر از ديگر نتايج قرار گرفته بود. با بررسي 50 جستجوي انجام شده توسط کاربران متعدد، مشخص شد گوگل و بينگ در غربالگري وب سايت ها موفق عمل کرده بودند.

اکنون با گذشت حدود يک سال از بررسي نيوساينتيست، در صورتي که همان عبارت مربوط به ماراتون را در گوگل جستجو کنيم، خواهيم ديد که نتايج جستجو باز هم دقيق تر شده است [اين جا را ببينيد]. اين بار وب سايتي که مختص تمرين در دوي ماراتون است (www.marathonrookie.com) از مجله دنياي دونده نيز بالاتر آمده و در رتبه اول نتايج جستجو، نمايش داده شده است. ديگر وب سايت هاي ليست شده در صفحه اول نتايج جستجو نيز وب سايت هاي معتبر و با کيفيت هستند و ديگر خبري از وب سايت هاي تبليغاتي نيست.

مشکل علفزارهاي محتوا، در ميان وب سايت هاي فارسي زبان نيز به وفور وجود دارد. البته شواهد نشان مي دهد طي ماه هاي اخير پانداي گوگل به خوبي در ميان وب سايت هاي فارسي زبان نيز دست به کار شده و کاربران را از دست وب سايت هايي که پر از محتواي نامربوط وآگهي هاي تبليغاتي بودند نجات داده است. پيش از اين، در جستجوي عبارت هاي «عمومي» در گوگل، معمولا به راحتي مي توانستيد از خير چند نتيجه اول صفحه نمايش نتايج جستجو بگذريد، چرا که رتبه هاي بالاي نتايج جستجو اغلب در اختيار وب سايت هاي کيفيت پايين و تبليغاتي بود.

الگوريتم گوگل پاندا عنوان خود را از نام خانوادگي يکي از مهندسان اصلي اين پروژه در شرکت گوگل گرفته است؛ ناونيت پاندا (Navneet Panda). گوگل جزئيات زيادي در مورد نحوه عملکرد الگوريتم جستجوي خود منتشر نمي کند، و شايد يکي از دلايل موفقيت آن در برابر رقبا را بايد در همين نکته ديد. با اين وجود، وبلاگ رسمي وب مستر گوگل بر روي Blogspot تاکنون با وب مسترها مهربان بوده و گاه به گاه نکاتي را در مورد شاخصه هاي مورد نظر پاندا در دست چين کردن و رتبه بندي وب سايت ها منتشر مي کند. به طور مثال در بخشي از يکي از پست هاي اين وبلاگ آمده است:

«محتواي کيفيت پايين در بخش هايي از سايت مي تواند روي رتبه کل سايت تاثير بگذارد.»

بر اساس اين شاخصه، بدون شک بايد فکري به حال محتواي کيفيت پايين که ممکن است مدت ها قبل بر روي وب سايت خود منتشر کرده ايد نيز باشيد؛ يا آنها را اصلاح کنيد يا براي هميشه از روي وب سايت خود حذف کنيد.

گوگل اغلب بدون اطلاع قبلي الگوريتم پاندا را به روز مي کند و سپس معمولا از طريق گفته هاي غيررسمي مي توان از اين مسئله باخبر شد و نهايتا با تاخير مي توان تاييد مسئولان گوگل در مورد آپديت جديد اين الگوريتم را گرفت. وب مسترها هميشه تغييرات و آپديت هاي پانداي گوگل را رصد مي کنند. اما چرا اطلاع از زمان آپديت هاي گوگل پاندا براي وب مسترها از اهميت بالايي برخوردار است؟ در اين ميان نکته مهمي وجود دارد و آن تفاوت در عملکرد الگوريتم پاندا نسبت به الگوريتم کلي جستجو در گوگل است. در حالت عادي با اضافه شدن يک لينک به يک وب سايت، روبات هاي crawler گوگل به آن سر مي زنند و آن را ايندکس مي کنند. اين موضوع در مورد سايت هايي که رتبه بالايي دارند بلافاصله انجام مي شود و سايت هايي که رتبه پايين تري دارند، معمولا از يک تا چند روز بايد صبر کنند تا لينک آن ها نيز ايندکس شود و در نتايج جستجو نمايش داده شود.

باز گرديم به سوال؛ چرا اطلاع از زمان آپديت هاي گوگل پاندا براي وب مسترها اهميت دارد؟ همانطور که اشاره شد پاندا عملکردي متفاوت دارد؛ پاندا با هر بار آپديت سري به وب سايت ها مي زند و بر اساس شاخصه هاي خود (که ممکن است به روز شده باشند يا خير) وب آن ها را رتبه بندي مي کند. در اين زمان، وب سايت هاي زيادي ارتقاء پيدا مي کنند و بسياري نيز مورد غضب پاندا قرار مي گيرند و سقوط مي کنند. تا آپديت بعدي پاندا - که طبق سابقه گاهي ممکن است از چند روز تا دو ماه متغير باشد - وب سايت هايي که دچار کاهش بازديد شده اند بايد خود را با شاخصه هاي پاندا به روز کنند تا بار ديگر رتبه خود را به دست آورند. براي ديدن ليست کامل آپديت هاي گوگل پاندا مي توانيد به اين جا مراجعه نماييد.

اگر بخواهيم ارتقاء و سقوط وب سايت ها را در اثر آپديت هاي گوگل پاندا ببينيم، بد نيست به بررسي انجام شده توسط وب سايت searchmetrics.com در مورد تاثير آپديت 2.5 پاندا که در اواخر سپتامبر 2011 از سوي گوگل اعمال شد نگاهي داشته باشيم. در اين آپديت هم مثل آپديت هاي قبلي، برخي وب سايت هاي امريکايي جزء بازنده ها بودند و برخي ديگر جزء برنده هاي ميدان جستجو. در تصوير زير آدرس دومين برخي از اين وب سايت ها آمده است. همچنين درصد رشد و يا سقوط آن ها نيز مشخص شده است.

http://www.webkaran.com/images/essay_pics/Panda_info.jpg


در مورد شاخصه هاي مدنظر پاندا بايد به تفصيل سخن گفت. اما در عين حال شايد بتوان نکات کلي و اصلي در اين زمينه که بايد به نوعي در اداره يک وب سايت از آن ها فاصله گرفت را به طور خلاصه اين‌گونه بر شمرد؛ هر چند اين ليست را به هيچ وجه نمي توان ليستي کامل دانست:

  • استفاده بيش از حد از تبليغات
  • متاتگ ها و تگ هاي نامناسب در وب سايت
  • استفاده بيش از حد از يک تگ يا تگ هاي نامربوط در يک صفحه
  • لينک هاي منقطع (به طور مثال لينک هايي که به خطاي 404 منتهي مي شوند)
  • محتواي کيفيت پايين در کل وب سايت
  • محتواي کيفيت پايين در بخشي از وب سايت
  • زمان کوتاه حضور هر کاربر بر روي وب سايت
  • مشکلات فني وب سايت
  • استفاده از قالب هاي آماده

نکاتي که بايد در مورد شاخصه هاي مدنظر گوگل پاندا رعايت کرد، در حوزه SEO يا «بهينه سازي وب سايت براي موتورهاي جستجو» قرار مي گيرد. نکته مهم آن که اکنون ديگر زمان فريب گوگول با استفاده از ترفندهاي خاص بهينه سازي به پايان رسيده است. بدون شک پانداي گوگل باهوش تر از هميشه در بالاترين نقطه الگوريتم جستجوي گوگل نشسته و کار جداسازي لينک ها را انجام مي دهد و همواره مخاطب و خوراکي که به او ارائه مي دهد را بيش از هر چيز ديگر مد نظر قرار مي دهد.

در تکميل اين مقاله نکات و مطالب مهم به صورت اينفوگرافيک ارائه شده است.

http://www.webkaran.com/images/essay_pics/GooglePanda-infographic.jpg

ارسال شده در : 1391/7/14 - 20:27:27

این صفحه را برای یک دوست بفرستید.

با تشکر ! پيام شما ارسال شد