سوگیری در جستجو: دیده‌شدن، درک و کنترل

نمیشه سوگیری (Bias) رو توی جستجو از بین برد، اما میشه تاثیرش روی برند و اعتبارتون رو مدیریت کرد.

سوگیری توی نتایج جستجو همیشه هم چیز بدی نیست. خیلی راحت میشه اون رو یه پدیده شوم و منفی جلوه داد، اما سوگیری به دلایل ساختاری، رفتاری و گاهی حتی به عنوان یک انتخاب کاملاً آگاهانه اتفاق میفته. وظیفه اصلی بازاریاب‌ها و متخصصان ارتباطات اینه که تشخیص بدن چه زمانی این اتفاق میفته و این موضوع چه تاثیری روی دیده شدن، درک مخاطب و کنترل اوضاع داره.

اخیراً دو تا مطلب باعث شد عمیق‌تر به این موضوع فکر کنم. اولی مقاله دژان (Dejan) در مورد بررسی نرخ انتخاب (Selection Rate یا SR) بود که نشون میده سیستم‌های هوش مصنوعی چطور بعضی از منابع رو به بقیه ترجیح میدن. دومی هم کتاب جدید بیل هارتزر (Bill Hartzer) به اسم «برندها پای صندوق رأی» (Brands on the Ballot) هست که مفهوم برندسازی غیرخنثی رو توی بازار دوقطبی امروز معرفی می‌کنه. وقتی این دو تا رو کنار هم میذاریم، می‌بینیم که سوگیری فقط توی الگوریتم‌ها نهادینه نشده، بلکه توی نحوه برداشت مخاطب از برندها هم یه چیز اجتناب‌ناپذیره.

نرخ انتخاب و سوگیری اولیه

نرخ انتخاب رو میشه به عنوان درصدی در نظر گرفت که یک منبع از بین گزینه‌های موجود انتخاب میشه (تعداد انتخاب‌ها ÷ گزینه‌های موجود × ۱۰۰). این یک استاندارد رسمی نیست، اما روش مفیدی برای نشون دادن سوگیری اولیه در بازیابی اطلاعات توسط هوش مصنوعیه. دژان اشاره می‌کنه که وقتی از یک سیستم هوش مصنوعی سوالی پرسیده میشه، اون سیستم اغلب از چندین منبع مبنا استفاده می‌کنه. اما همه منابع به یک اندازه انتخاب نمیشن. به مرور زمان، بعضی‌ها بارها و بارها انتخاب میشن، در حالی که بقیه به ندرت ظاهر میشن.

اینجا دقیقاً همون جاییه که سوگیری اولیه وارد عمل میشه.

برای بازاریاب‌ها، نتیجه‌گیری کاملاً واضحه: اگه محتوای شما به ندرت به عنوان منبع مبنا انتخاب بشه، عملاً در اکوسیستم خروجی اون هوش مصنوعی نامرئی هستید. اگه به طور مکرر انتخاب بشه، اعتبار و دیده‌شدن بیشتری به دست میارید. نرخ انتخاب بالا به یک سیگنال خودتقویت‌کننده تبدیل میشه.

این موضوع فقط یک تئوری نیست. ابزارهایی مثل Perplexity، بینگ کوپایلت (Bing Copilot) و جمینای (Gemini) هم پاسخ‌ها و هم منابع اون‌ها رو نشون میدن. استناد مکرر به شما، دیده‌شدن برند و اعتبار درک شده شما رو افزایش میده. محققان حتی برای این چرخه بازخورد که می‌تونه به سلطه یک منبع منجر بشه، یک اصطلاح ابداع کردن: زوزه عصبی (neural howlround). در یک مدل زبانی بزرگ (LLM)، برخی ورودی‌های با وزن بالا می‌تونن چنان تثبیت بشن که الگوهای پاسخی رو ایجاد کنن که در برابر اصلاح مقاوم هستن، حتی زمانی که داده‌های آموزشی جدید یا پرامپت‌های زنده معرفی میشن.

این مفهوم جدیدی نیست. در جستجوی سنتی، صفحاتی که رتبه بالاتری دارن، کلیک‌های بیشتری دریافت می‌کنن. این کلیک‌ها سیگنال‌های تعامل رو به سیستم برمی‌گردونن که می‌تونه به حفظ جایگاه رتبه‌بندی کمک کنه. این همون چرخه بازخورده، فقط از یک زاویه دیگه. نرخ انتخاب (SR) سوگیری رو ایجاد نمی‌کنه؛ بلکه اون رو آشکار می‌کنه و اینکه شما ازش سود می‌برید یا نه، بستگی به این داره که از اول چقدر حضور آنلاینتون رو برای بازیابی شدن، خوب ساختاردهی کرده باشید.

برندسازی و واقعیتِ برداشت مخاطب

کتاب «برندها پای صندوق رأی» این موضوع رو به عنوان برندسازی غیرخنثی مطرح می‌کنه: شرکت‌ها نمی‌تونن از اینکه مخاطب ازشون برداشت خاصی داشته باشه، فرار کنن. هر تصمیمی، چه بزرگ و چه کوچیک، به عنوان یک سیگنال خونده میشه. این یعنی سوگیری در سطح درک و برداشت مخاطب.

ما این پدیده رو دائماً می‌بینیم. وقتی نایکی از کالین کپرنیک (ورزشکار معترض) حمایت کرد، بعضی‌ها وفاداریشون به این برند دوچندان شد و بعضی دیگه علناً باهاش قطع رابطه کردن. وقتی باد لایت (Bud Light) با یک اینفلوئنسر ترنس همکاری کرد، واکنش‌های منفی شدیدی در اخبار ملی به راه افتاد. اختلافات دیزنی با سیاستمداران فلوریدا بر سر سیاست‌های فرهنگی، یک شبه به داستانی درباره هویت شرکتی تبدیل شد.

هیچ‌کدوم از این‌ها فقط یک «کمپین بازاریابی» نبودن. هر کدوم به عنوان یک موضع‌گیری فرهنگی برداشت شد. حتی تصمیم‌هایی که به نظر عملیاتی میان (اینکه در کدوم پلتفرم‌ها تبلیغ می‌کنید، چه اسپانسرشیپ‌هایی رو قبول می‌کنید، یا چه تأمین‌کنندگانی رو انتخاب می‌کنید) به عنوان سیگنال‌هایی از همسویی شما تفسیر میشن.

بی‌طرفی دیگه بی‌طرفی به حساب نمیاد، و این یعنی تیم‌های روابط عمومی و بازاریابی باید برداشت مخاطب رو به عنوان بخشی از واقعیت روزمره‌شون در نظر بگیرن و براش برنامه‌ریزی کنن.

سوگیری جهت‌دار: یک نگاه کاربردی

بازاریاب‌ها همین الان هم با هدف‌گذاری بر اساس پروفایل مشتری ایده‌آل (ICP) و جایگاه‌سازی (Positioning)، حذف آگاهانه رو تمرین می‌کنن. شما تصمیم می‌گیرید که می‌خواید به چه کسی دسترسی پیدا کنید و در نتیجه، به چه کسی نمی‌خواید برسید. این چیز جدیدی نیست.

اما وقتی به این انتخاب‌ها از دریچه سوگیری نگاه می‌کنید، موضوع واضح‌تر میشه: جایگاه‌سازی در واقع همون سوگیری هدفمنده. پنهان نیست. تصادفی نیست. بلکه یک محدود کردن آگاهانه تمرکزه.

اینجاست که ایده سوگیری جهت‌دار مطرح میشه. می‌تونید اون رو به عنوان روشی دیگه برای توصیف هدف‌گذاری ICP یا جایگاه‌یابی در بازار در نظر بگیرید. این یک دکترین نیست، فقط یک دیدگاهه. ارزش نام‌گذاری این پدیده در اینه که کاری که بازاریاب‌ها همین الان هم انجام میدن رو به بحث گسترده‌تر درباره نحوه کدگذاری سوگیری در سیستم‌های جستجو و هوش مصنوعی مرتبط می‌کنه.

سوگیری فقط به برندسازی یا هوش مصنوعی محدود نمیشه. ما سال‌هاست که می‌دونیم رتبه‌بندی نتایج جستجو می‌تونه رفتار کاربر رو شکل بده.

یک مطالعه در سال ۲۰۲۴ در PLOS نشون داد که صرفاً تغییر ترتیب نتایج می‌تونه نظرات رو تا ۳۰ درصد تغییر بده. مردم به نتایجی که رتبه بالاتری دارن بیشتر اعتماد می‌کنن، حتی اگه اطلاعات اصلی یکسان باشه.

حباب‌های فیلتر این اثر رو تشدید می‌کنن. موتورهای جستجو با شخصی‌سازی نتایج بر اساس سابقه کاربر، دیدگاه‌های موجود رو تقویت کرده و مواجهه با گزینه‌های جایگزین رو محدود می‌کنن.

فراتر از این سوگیری‌های رفتاری، سوگیری‌های ساختاری هم وجود دارن. موتورهای جستجو به تازگی محتوا پاداش میدن، به این معنی که سایت‌هایی که بیشتر خزش میشن و به‌روزرسانی میشن، اغلب در دیده‌شدن برتری دارن، به خصوص برای کوئری‌های حساس به زمان. دامنه‌های سطح بالای کد کشوری (ccTLD) مثل .fr یا .jp می‌تونن سیگنال ارتباط منطقه‌ای باشن و در جستجوهای محلی اولویت پیدا کنن. و البته سوگیری محبوبیت و برند هم هست: برندهای معتبر یا شناخته‌شده اغلب در رتبه‌بندی‌ها مورد لطف قرار می‌گیرن، حتی اگه محتواشون لزوماً قوی‌تر نباشه، که این موضوع کار رو برای رقبای کوچیک‌تر یا جدیدتر برای ورود به رقابت سخت‌تر می‌کنه.

برای متخصصان بازاریابی و روابط عمومی، درس یکسانه: سوگیری ورودی (اینکه چه داده‌هایی درباره شما موجوده) و سوگیری پردازش (اینکه سیستم‌ها چطور اون‌ها رو رتبه‌بندی و ارائه می‌کنن) مستقیماً چیزی رو شکل میده که مخاطبان به عنوان حقیقت باور می‌کنن.

سوگیری در خروجی‌های LLM

مدل‌های زبانی بزرگ (LLM) لایه‌های جدیدی از سوگیری رو معرفی می‌کنن.

داده‌های آموزشی به ندرت متوازن هستن. بعضی گروه‌ها، صداها یا دیدگاه‌ها ممکنه بیش از حد نماینده داشته باشن، در حالی که بقیه غایب باشن. این موضوع پاسخ‌هایی رو که این سیستم‌ها میدن، شکل میده. طراحی پرامپت هم یک لایه دیگه اضافه می‌کنه: بسته به نحوه پرسیدن سوال، سوگیری تأیید و سوگیری در دسترس بودن می‌تونن خودشون رو نشون بدن.

تحقیقات اخیر نشون میده که این موضوع چقدر می‌تونه پیچیده باشه.

  • محققان MIT دریافتند که حتی ترتیب اسنادی که به یک LLM داده میشه، می‌تونه نتیجه رو تغییر بده.
  • مقاله‌ای در مجله Nature در سال ۲۰۲۴ انواع مختلف سوگیری‌هایی رو که در LLMها ظاهر میشن، از شکاف‌های بازنمایی گرفته تا چارچوب‌بندی فرهنگی، فهرست کرد.
  • یک مطالعه در PNAS تأیید کرد که حتی پس از تنظیمات مربوط به انصاف (fairness tuning)، سوگیری‌های ضمنی همچنان باقی می‌مونن.
  • وب‌سایت LiveScience گزارش داد که چت‌بات‌های جدیدتر تمایل دارن مطالعات علمی رو بیش از حد ساده‌سازی کنن و از جزئیات حیاتی چشم‌پوشی کنن.

این‌ها یافته‌های حاشیه‌ای نیستن. این موارد نشون میدن که سوگیری در هوش مصنوعی یک مورد خاص نیست؛ بلکه حالت پیش‌فرضه. برای بازاریاب‌ها و متخصصان ارتباطات، نکته این نیست که در علم این موضوع استاد بشن؛ بلکه باید بفهمن که اگه از اول برای چیزی که به سیستم‌ها وارد میشه فکری نکنن، خروجی‌ها می‌تونن شما رو به اشتباه نشون بدن.

جمع‌بندی و نتیجه‌گیری

نرخ انتخاب به ما نشون میده که سوگیری در سیستم‌های بازیابی هوش مصنوعی چطور کار می‌کنه. برندسازی نشون میده که سوگیری در بازارِ برداشت‌ها چطور عمل می‌کنه. و سوگیری جهت‌دار راهی برای اتصال این واقعیت‌هاست و به ما یادآوری می‌کنه که همه سوگیری‌ها تصادفی نیستن. گاهی اوقات انتخاب میشن.

نکته کلیدی این نیست که وانمود کنیم سوگیری وجود نداره؛ البته که وجود داره. نکته اینه که تشخیص بدیم آیا این اتفاق به صورت منفعلانه برای شما میفته، یا شما دارید اون رو به طور فعال و استراتژیک به کار می‌گیرید. هم بازاریاب‌ها و هم متخصصان روابط عمومی در این زمینه نقش دارن: یکی در ساخت دارایی‌های قابل بازیابی، و دیگری در ایجاد یک روایت مقاوم برای برند. (پ.ن: هوش مصنوعی واقعاً نمی‌تونه جای یک انسان رو برای این کار بگیره.)

خب، با این اطلاعات باید چیکار کرد؟

بفهمید سوگیری کجا خودش را نشان می‌دهد

در جستجو، سوگیری از طریق مطالعات، ممیزی‌ها و تست‌های سئو آشکار میشه. در هوش مصنوعی، محققان با پرامپت‌های ساختاریافته، خروجی‌ها رو بررسی و اون رو کشف می‌کنن. در برندسازی، سوگیری در واکنش مشتریان مشخص میشه. نکته کلیدی اینه که بدونید سوگیری همیشه یک جایی خودش رو نشون میده، و اگه دنبالش نباشید، سیگنال‌های حیاتی درباره نحوه درک یا بازیابی شدن برندتون رو از دست میدید.

تشخیص دهید چه کسانی سوگیری را پنهان می‌کنند

موتورهای جستجو و ارائه‌دهندگان LLM همیشه نحوه وزن‌دهی به انتخاب‌هاشون رو فاش نمی‌کنن. شرکت‌ها اغلب ادعای بی‌طرفی می‌کنن، حتی وقتی انتخاب‌هاشون چیز دیگه‌ای میگه. پنهان کردن سوگیری باعث از بین رفتنش نمیشه؛ بلکه مقابله با اون رو سخت‌تر می‌کنه و وقتی بالاخره سطح بیاد، ریسک بیشتری ایجاد می‌کنه. اگه در مورد موضع خودتون شفاف نباشید، ممکنه کس دیگه‌ای اون رو برای شما تعریف کنه.

با سوگیری مثل یک شفافیت برخورد کنید

لازم نیست جایگاه‌یابی برندتون رو با عنوان «سوگیری جهت‌دار ما» معرفی کنید. اما باید بپذیرید که وقتی یک پروفایل مشتری ایده‌آل (ICP) انتخاب می‌کنید، پیام‌هاتون رو می‌نویسید، یا محتوا رو برای بازیابی توسط هوش مصنوعی بهینه می‌کنید، در حال انتخاب‌های آگاهانه درباره شامل کردن و حذف کردن هستید. شفافیت یعنی پذیرش این انتخاب‌ها، اندازه‌گیری تأثیرشون، و مسئولیت‌پذیری در قبال مسیری که تعیین کرده‌اید. این تفاوت بین اینه که سوگیری شما رو شکل بده یا شما سوگیری رو شکل بدید.

ردپای خود در دنیای هوش مصنوعی را با برنامه مدیریت کنید

همونطور که جایگاه برند رو با هدف شکل میدید، باید تصمیم بگیرید که می‌خواید در سیستم‌های هوش مصنوعی چطور به نظر برسید. این یعنی انتشار محتوا به روش‌هایی که قابل بازیابی، ساختاریافته با نشانه‌های اعتماد و همسو با موضع دلخواه شما باشن. اگه این موضوع رو به طور فعال مدیریت نکنید، هوش مصنوعی باز هم درباره شما تصمیم می‌گیره؛ فقط این تصمیم‌ها، انتخاب‌هایی نیستن که شما کنترلشون کرده باشید.

یک خطر نهایی که باید در نظر گرفت

سوگیری ذاتاً چیز بدی نیست؛ این سوگیری پنهان است که خطرناکه.

در موتورهای جستجو، در سیستم‌های هوش مصنوعی و در بازار، سوگیری حالت پیش‌فرضه. اشتباه، داشتنِ اون نیست. اشتباه اینه که اجازه بدید بدون اینکه متوجه حضورش باشید، نتایج رو شکل بده. شما می‌تونید سوگیری خودتون رو با قصد و نیت تعریف کنید یا اون رو به شانس بسپارید. یک مسیر به شما کنترل میده. مسیر دیگه، برند و کسب‌وکارتون رو به رحم و مروت نحوه تفسیر دیگران از شما واگذار می‌کنه.

و این هم فکری که حین کار روی این مطلب به ذهنم رسید: چی میشه اگه خودِ سوگیری بتونه به یک روش برای حمله تبدیل بشه؟ مطمئنم این ایده جدیدی نیست، اما بیاید به هر حال بررسیش کنیم. تصور کنید یک رقیب اونقدر محتوا تولید کنه که شرکت شما رو در یک قالب خاص نشون بده، طوری که وقتی یک LLM اون ورودی‌ها رو در یک پاسخ فشرده می‌کنه، نسخه‌ای که اون‌ها از شما ساختن، به نمایش دربیاد. حتی لازم نیست مستقیماً از شما اسم ببرن. فقط کافیه شما رو اونقدر خوب توصیف کنن که سیستم ارتباط رو برقرار کنه. نیازی به رد کردن هیچ خط قرمز قانونی هم نیست، چون LLMهای امروزی در حدس زدن یک برند، وقتی فقط لوگو یا یک ویژگی معروفش رو به زبان عامیانه توصیف می‌کنید، خیلی خوب عمل می‌کنن.

بخش نگران‌کننده اینه که این سناریو چقدر محتمل به نظر میرسه. LLMها به روش سنتی واقعیت‌سنجی نمی‌کنن؛ اونا فقط الگوهای موجود در داده‌های در دسترسشون رو فشرده و بازسازی می‌کنن. اگه الگوها منحرف باشن چون کسی عمداً در حال شکل دادن به روایت بوده، خروجی‌ها هم می‌تونن اون انحراف رو منعکس کنن. در واقع، «نسخه» رقیب شما از برندتون می‌تونه به توصیف «پیش‌فرض» تبدیل بشه که کاربران وقتی از سیستم درباره شما سوال می‌کنن، می‌بینن.

حالا تصور کنید این اتفاق در مقیاس بزرگ بیفته. یک کمپین شایعه‌پراکنی آنلاین برای تأثیرگذاری نیازی به ترند شدن نداره. فقط کافیه در جاهای کافی، در تنوع‌های کافی وجود داشته باشه تا یک مدل هوش مصنوعی اون رو به عنوان اجماع در نظر بگیره. وقتی این روایت در پاسخ‌ها جا بیفته، ممکنه کاربران به سختی بتونن روایت شما از داستان رو پیدا کنن.

نمی‌دونم این یک ریسک واقعی در کوتاه‌مدته یا فقط یک آزمایش فکری حاشیه‌ای، اما ارزش پرسیدن رو داره: آیا شما آماده‌اید اگه کسی بخواد کسب‌وکار شما رو اینطوری بازتعریف کنه؟

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *