گوگل اخیرا اعلام کرد که برای درک بهتر مفاهیم از یک الگوریتم تطبیق عصبی استفاده می کند. آقای دنی سالیوان از گوگل بیان کرد که این موتور جستجو در 30% جستجوها از این الگوریتم بهره می برد.
گوگل اخیرا مقاله تحقیقاتی را منتشر کرده که در آن نتایج جستجو تنها بر اساس تطبیق عبارت مورد جستجو و محتوای صفحه انتخاب شده اند و عامل دیگری در میان نبوده است. با این که سیستم مورد استفاده در این تحقیق شاید هنوز به صورت عملی مورد استفاده قرار نگرفته یا اینکه جزیی از چند الگوریتم دیگر باشد، با این وجود می تواند مثالی برای نحوه کار الگوریتم تطبیق عصبی گوگل محسوب گردد.
آیا گوگل از الگوریتم های منتشر شده استفاده می کند؟
گوگل همیشه از الگوریتم های منتشر شده در پتنت ها و مقالات رسمی استفاده نمی کند. اما با این وجود مطمئنا تعداد نامشخصی از الگوریتم های منتشر شده، در الگوریتم جستجوی گوگل مورد استفاده قرار می گیرند.
همچنین گوگل در حالت کلی نیز به تایید یا تکذیب وجود یک الگوریتم در سیستم رتبه بندی خود نمی پردازد.
گوگل در مورد الگوریتم هوش مصنوعی جدید خود توضیحاتی داده است
گوگل در گذشته به بحث های کلی درباره الگوریتم های خود مانند پاندا و پنگوئن پرداخته است. دنی سالیوان نیز در روزهای گذشته نشانه هایی از وجود الگوریتم تطبیق عصبی مطرح کرده است. این الگوریتم توسط او در حساب توییتریش بدین شکل توصیف شد:
“تطبیق عصبی، روش برگرفته از هوش مصنوعی برای ارتباط بهتر کلمات با مفاهیم است.”
او همچنین در توییتر خود نوشت:
“روشی که کاربران به جستجوی اطلاعات مورد نظر خود می پردازند با نحوه نوشتن راه حل متناسب با مشکلات کاربران توسط صاحبین وب سایت ها، اغلب متفاوت است.”
به عنوان مثال او با توییت کردن تصویر زیر نشان داد که عبارت Change می تواند توسط کاربران معنی های متفاوتی داشته باشد:
هوش مصنوعی، یادگیری ماشینی و صفحات رتبه بندی
گوگل اخیرا در وبلاگ تخصصی هوش مصنوعی خود لینک به مقاله ای داده که در آن، صفحات رتبه بندی بر اساس میزان ارتباط کلمه مورد جستجو و محتوای صفحات، ایجاد شده بودند. اگرچه این الگوریتم رتبه بندی کاملا جدید است، اما نشان از بهبود زیادی در تشخیص میزان ارتباط محتوا با کلمات مورد جستجو توسط روش های شبکه عصبی دارد.
با این که به صورت قطعی نمی توان گفت که موضوع مورد بحث در این مقاله همان الگوریتم تطبیق عصبی گوگل است، اما به نظر می سد که شباهت های زیادی بین آنها وجود دارد.
الگوریتم مورد بحث در مقاله مورد نظر بدین شکل توصیف شده است:
“رتبه بندی بر اساس محتوای صفحات که با عنوان ad-hoc retrieval نیز شناخته می شود، به سیستمی گفته می شود که صفحات تنها بر اساس متن های به کار رفته در آنها، رتبه بندی می گردند.”
تحقیقات منتشر شده در این مقاله صراحتا اعلام می کند که این نوع سیستم رتبه بندی تنها متکی بر عبارت مورد جستجو و محتوای صفحت است.
در بیانیه مطرح شده در این مقاله اعلام شده که این سیستم کاملا متفاوت از سیستم های سنتیست که در آنها، رتبه بندی وب سایت ها علاوه بر اطلاعات ارائه شده در صفحه، به پیج رنک و لینک های آن نیز وابسته است.
آنچه که به وضوح دیده می شود اینست که سیستم رتبه بندی بر اساس محتوا، تقریبا یک سیستم جدید می باشد که وابسته به لینک ها نیست.
آیا سیستم جدید رتبه بندی گوگل از لینک ها استفاده نمی کند؟
الگوریتم جدید منتشر شده در وبلاگ هوش مصنوعی گوگل به صورت مستقیم از فاکتورهای سنتی رتبه بندی استفاده نمی کند. با این حال ابتدا از فاکتورهای سنتی رتبه بندی استفاده شده و سپس بعد از آن بخش Ad-hoc retrieval گوگل به کار گرفته می شود.
مقاله مورد بحث اعلام می کند که این سیستم به رتبه بندی مجدد صفحات رتبه بندی شده می پردازد و فاکتورهای رتبه بندی سنتی به هیچ وجه ده آیتم اول نتایج جستجو را تعیین نمی کنند.
بنابراین می توان گفت که فاکتورهای رتبه بندی سنتی عملکرد ارزیابی اولیه را انجام می دهند، سپس سیستم رتبه بندی جدید به حذف اسپم ها پرداخته و مرتبط ترین صفحات را جمع آوری می کند.
کاری که الگوریتم جدید انجام می دهد در واقع رتبه بندی مجدد صفحاتیست که بر اساس مجموعه متفاوتی از معیارها جمع آوری شده اند.
الگوریتم جدید چه کاری انجام می دهد؟
هدف الگوریتم جدید مرتبط کردن عبارت مورد جستجو با صفحاتیست که تنها به واسطه ارتباط بین عبارت مورد نظر و محتوای صفحات جمع آوری شده اند. وب سایت هایی که بر این اساس به موقعیت های بالای نتایج جستجو می رسند، دیگر به واسطه لینک ها یا کلمات کلیدی در این جایگاه ها قرار ندارند.
اهمیت محتوا بیش از پیش می گردد
آیا این مسئله بدین معنیست که تولید کنندگان محتوا بایست از عبارات مترادف بیشتری در محتوا استفاده کنند؟ استفاده از این تکنیک تنها در حالت استفاده خیلی کم، کارامد است و در صورت استفاده زیاد نشان از اسپم می باشد. خیلی ساده لوحانه است که بپذیریم گوگل تنها به واسطه وجود مترادف های بیشتر در محتوا، رتبه بهتری به آن بدهد.
هدف از به کار بردن عبارت مترادف، درک بهتر محتوا توسط گوگل است. به نظر ما بیان واضح مفاهیم بسیار مهم تر از استفاده بی رویه از این گونه عبارت مشابه در دل محتواست.
چیزی که گوگل در بیانیه خود اعلام کرده توانایی درک مفاهیم است. این مسئله چیزی فراتر از کلمات کلیدی و عبارت مشابه می باشد. در واقع این سیستم به درک طبیعی تر محتوای یک صفحه در رابطه با حل مشکلات کاربران به واسطه عبارت مورد جستجوی آنها می پردازد.