کاهش ترافیک ویکیپدیا با اوجگیری پاسخهای هوش مصنوعی
بنیاد ویکیمدیا اعلام کرده که بعد از بازنگری در سیستم تشخیص رباتها، بازدید صفحات توسط کاربران انسانی کاهش پیدا کرده. به نظرشون، دلیل اصلی این اتفاق، جستجوی هوش مصنوعی و شبکههای اجتماعیه.
بنیاد ویکیمدیا (WMF) گزارش داده که آمار بازدید صفحات ویکیپدیا توسط کاربران انسانی، در مقایسه با ماههای مشابه سال گذشته، کاهش داشته.
مارشال میلر، مدیر ارشد محصول در بخش تجربیات اصلی بنیاد ویکیمدیا، نوشته که به عقیدهی این سازمان، این کاهش بازدید نشوندهندهی تغییر در روشهای دسترسی مردم به اطلاعاته؛ بهخصوص از طریق جستجوی هوش مصنوعی و پلتفرمهای اجتماعی.
چه تغییری در دادهها به وجود اومده؟
ویکیمدیا حوالی ماه مِی (اردیبهشت-خرداد) متوجه یک ترافیک غیرعادی بالا شد. در نگاه اول، این ترافیک شبیه به بازدید کاربرای واقعی بود، اما بعد از بررسی مشخص شد که این بازدیدها کار رباتهایی بوده که برای دور زدن سیستمهای تشخیص طراحی شده بودن.
برای همین، WMF سیستمهای تشخیص ربات خودش رو آپدیت کرد و با منطق جدید، ترافیک ماههای مارس تا آگوست (اسفند تا مرداد) رو دوباره دستهبندی کرد.
میلر اشاره کرده که دادههای بازنگری شده «کاهشی حدوداً ۸ درصدی رو در مقایسه با ماههای مشابه سال ۲۰۲۴» نشون میدن.
WMF هشدار داده که موقع مقایسهی این دادهها باید خیلی مراقب بود، چون قوانین تشخیص ربات در طول زمان تغییر کرده.
نقش جستجوی هوش مصنوعی
میلر این کاهش بازدید رو به هوش مصنوعی مولد (generative AI) و پلتفرمهای اجتماعی نسبت داده که دارن شیوهی کشف اطلاعات رو حسابی تغییر میدن.
اون نوشته که موتورهای جستجو «جوابها رو مستقیماً به کاربر نشون میدن، در حالی که این جوابها اغلب بر اساس محتوای ویکیپدیا هستن.»
این اتفاق سناریویی رو ایجاد میکنه که در اون ویکیپدیا به عنوان منبع اصلی برای قابلیتهای جستجوی مبتنی بر هوش مصنوعی استفاده میشه، بدون اینکه هیچ ترافیکی به خود سایت ویکیپدیا هدایت بشه.
نقش ویکیپدیا در سیستمهای هوش مصنوعی
این کاهش ترافیک در حالی اتفاق میفته که سیستمهای هوش مصنوعی روز به روز بیشتر به ویکیپدیا به عنوان منبع اصلیشون وابسته میشن.
تحقیقاتی که توسط Profound روی ۶۸۰ میلیون استناد (citation) هوش مصنوعی انجام شده، نشون میده که در بین ۱۰ منبع برتری که ChatGPT بهشون استناد میکنه، ویکیپدیا به تنهایی ۴۷.۹٪ از این سهم رو به خودش اختصاص داده. برای AI Overviews گوگل، سهم ویکیپدیا در بین ۱۰ منبع برتر فقط ۵.۷٪ هست، در حالی که ردیت (Reddit) با ۲۱.۰٪ و یوتیوب با ۱۸.۸٪ سهم بیشتری دارن.
WMF همچنین گزارش داده که از ژانویه ۲۰۲۴، پهنای باندی که توسط رباتهای هوش مصنوعی مصرف میشه، ۵۰٪ جهش داشته. این رباتها محتوا رو عمدتاً برای آموزش مدلهای بینایی ماشین (computer vision) استخراج (scrape) میکنن.
ویکیپدیا در سال ۲۰۲۱ سرویس Wikimedia Enterprise رو راهاندازی کرد. این سرویس یک دسترسی تجاری به دادهها با پشتیبانی SLA (توافقنامه سطح خدمات) رو برای استفادهکنندههای بزرگ، از جمله شرکتهای جستجو و هوش مصنوعی، فراهم میکنه.
چرا این موضوع مهمه؟
وقتی ویکیپدیا با وجود اینکه پراستنادترین منبع ChatGPT هست، ترافیکش رو از دست میده، یعنی مدلی که باعث پایداری تولید محتوا میشه، داره از هم میپاشه. شما میتونید محتوای معتبری تولید کنید که سیستمهای هوش مصنوعی بهش وابسته باشن، اما باز هم شاهد کاهش ترافیک ارجاعی (referral traffic) خودتون باشید.
ساختار انگیزشی فعلی بر این اساسه که تولیدکنندههای محتوا از اینکه منبع جوابهای هوش مصنوعی باشن، سود میبرن. اما دادههای ویکیپدیا نشون میده که این فرضیه دیگه درست نیست.
باید حسابی حواستون باشه که قابلیتهای هوش مصنوعی چطور روی ترافیک سایت شما تأثیر میذارن و آیا استناد شدن توسط اونها، به تعامل معنادار (engagement) کاربر منجر میشه یا نه.
نگاهی به آینده
بنیاد ویکیمدیا میگه که به آپدیت کردن سیستمهای تشخیص ربات و رصد کردن اینکه هوش مصنوعی مولد و شبکههای اجتماعی چطور دسترسی به اطلاعات رو شکل میدن، ادامه خواهد داد.
ویکیپدیا همچنان یکی از مجموعه دادههای اصلی برای سیستمهای جستجوی مدرن و هوش مصنوعیه، حتی اگه کاربرا مستقیماً از خود سایت بازدید نکنن. کسبوکارها و ناشران محتوا هم باید منتظر دینامیک مشابهی باشن، چون قابلیتهای جستجوی هوش مصنوعی روز به روز در پلتفرمهای بیشتری گسترش پیدا میکنن.
پاسخی بگذارید