سوگیری در جستجو: دیدهشدن، درک و کنترل
نمیشه سوگیری (Bias) رو توی جستجو از بین برد، اما میشه تاثیرش روی برند و اعتبارتون رو مدیریت کرد.
سوگیری توی نتایج جستجو همیشه هم چیز بدی نیست. خیلی راحت میشه اون رو یه پدیده شوم و منفی جلوه داد، اما سوگیری به دلایل ساختاری، رفتاری و گاهی حتی به عنوان یک انتخاب کاملاً آگاهانه اتفاق میفته. وظیفه اصلی بازاریابها و متخصصان ارتباطات اینه که تشخیص بدن چه زمانی این اتفاق میفته و این موضوع چه تاثیری روی دیده شدن، درک مخاطب و کنترل اوضاع داره.
اخیراً دو تا مطلب باعث شد عمیقتر به این موضوع فکر کنم. اولی مقاله دژان (Dejan) در مورد بررسی نرخ انتخاب (Selection Rate یا SR) بود که نشون میده سیستمهای هوش مصنوعی چطور بعضی از منابع رو به بقیه ترجیح میدن. دومی هم کتاب جدید بیل هارتزر (Bill Hartzer) به اسم «برندها پای صندوق رأی» (Brands on the Ballot) هست که مفهوم برندسازی غیرخنثی رو توی بازار دوقطبی امروز معرفی میکنه. وقتی این دو تا رو کنار هم میذاریم، میبینیم که سوگیری فقط توی الگوریتمها نهادینه نشده، بلکه توی نحوه برداشت مخاطب از برندها هم یه چیز اجتنابناپذیره.
نرخ انتخاب و سوگیری اولیه
نرخ انتخاب رو میشه به عنوان درصدی در نظر گرفت که یک منبع از بین گزینههای موجود انتخاب میشه (تعداد انتخابها ÷ گزینههای موجود × ۱۰۰). این یک استاندارد رسمی نیست، اما روش مفیدی برای نشون دادن سوگیری اولیه در بازیابی اطلاعات توسط هوش مصنوعیه. دژان اشاره میکنه که وقتی از یک سیستم هوش مصنوعی سوالی پرسیده میشه، اون سیستم اغلب از چندین منبع مبنا استفاده میکنه. اما همه منابع به یک اندازه انتخاب نمیشن. به مرور زمان، بعضیها بارها و بارها انتخاب میشن، در حالی که بقیه به ندرت ظاهر میشن.
اینجا دقیقاً همون جاییه که سوگیری اولیه وارد عمل میشه.
برای بازاریابها، نتیجهگیری کاملاً واضحه: اگه محتوای شما به ندرت به عنوان منبع مبنا انتخاب بشه، عملاً در اکوسیستم خروجی اون هوش مصنوعی نامرئی هستید. اگه به طور مکرر انتخاب بشه، اعتبار و دیدهشدن بیشتری به دست میارید. نرخ انتخاب بالا به یک سیگنال خودتقویتکننده تبدیل میشه.
این موضوع فقط یک تئوری نیست. ابزارهایی مثل Perplexity، بینگ کوپایلت (Bing Copilot) و جمینای (Gemini) هم پاسخها و هم منابع اونها رو نشون میدن. استناد مکرر به شما، دیدهشدن برند و اعتبار درک شده شما رو افزایش میده. محققان حتی برای این چرخه بازخورد که میتونه به سلطه یک منبع منجر بشه، یک اصطلاح ابداع کردن: زوزه عصبی (neural howlround). در یک مدل زبانی بزرگ (LLM)، برخی ورودیهای با وزن بالا میتونن چنان تثبیت بشن که الگوهای پاسخی رو ایجاد کنن که در برابر اصلاح مقاوم هستن، حتی زمانی که دادههای آموزشی جدید یا پرامپتهای زنده معرفی میشن.
این مفهوم جدیدی نیست. در جستجوی سنتی، صفحاتی که رتبه بالاتری دارن، کلیکهای بیشتری دریافت میکنن. این کلیکها سیگنالهای تعامل رو به سیستم برمیگردونن که میتونه به حفظ جایگاه رتبهبندی کمک کنه. این همون چرخه بازخورده، فقط از یک زاویه دیگه. نرخ انتخاب (SR) سوگیری رو ایجاد نمیکنه؛ بلکه اون رو آشکار میکنه و اینکه شما ازش سود میبرید یا نه، بستگی به این داره که از اول چقدر حضور آنلاینتون رو برای بازیابی شدن، خوب ساختاردهی کرده باشید.
برندسازی و واقعیتِ برداشت مخاطب
کتاب «برندها پای صندوق رأی» این موضوع رو به عنوان برندسازی غیرخنثی مطرح میکنه: شرکتها نمیتونن از اینکه مخاطب ازشون برداشت خاصی داشته باشه، فرار کنن. هر تصمیمی، چه بزرگ و چه کوچیک، به عنوان یک سیگنال خونده میشه. این یعنی سوگیری در سطح درک و برداشت مخاطب.
ما این پدیده رو دائماً میبینیم. وقتی نایکی از کالین کپرنیک (ورزشکار معترض) حمایت کرد، بعضیها وفاداریشون به این برند دوچندان شد و بعضی دیگه علناً باهاش قطع رابطه کردن. وقتی باد لایت (Bud Light) با یک اینفلوئنسر ترنس همکاری کرد، واکنشهای منفی شدیدی در اخبار ملی به راه افتاد. اختلافات دیزنی با سیاستمداران فلوریدا بر سر سیاستهای فرهنگی، یک شبه به داستانی درباره هویت شرکتی تبدیل شد.
هیچکدوم از اینها فقط یک «کمپین بازاریابی» نبودن. هر کدوم به عنوان یک موضعگیری فرهنگی برداشت شد. حتی تصمیمهایی که به نظر عملیاتی میان (اینکه در کدوم پلتفرمها تبلیغ میکنید، چه اسپانسرشیپهایی رو قبول میکنید، یا چه تأمینکنندگانی رو انتخاب میکنید) به عنوان سیگنالهایی از همسویی شما تفسیر میشن.
بیطرفی دیگه بیطرفی به حساب نمیاد، و این یعنی تیمهای روابط عمومی و بازاریابی باید برداشت مخاطب رو به عنوان بخشی از واقعیت روزمرهشون در نظر بگیرن و براش برنامهریزی کنن.
سوگیری جهتدار: یک نگاه کاربردی
بازاریابها همین الان هم با هدفگذاری بر اساس پروفایل مشتری ایدهآل (ICP) و جایگاهسازی (Positioning)، حذف آگاهانه رو تمرین میکنن. شما تصمیم میگیرید که میخواید به چه کسی دسترسی پیدا کنید و در نتیجه، به چه کسی نمیخواید برسید. این چیز جدیدی نیست.
اما وقتی به این انتخابها از دریچه سوگیری نگاه میکنید، موضوع واضحتر میشه: جایگاهسازی در واقع همون سوگیری هدفمنده. پنهان نیست. تصادفی نیست. بلکه یک محدود کردن آگاهانه تمرکزه.
اینجاست که ایده سوگیری جهتدار مطرح میشه. میتونید اون رو به عنوان روشی دیگه برای توصیف هدفگذاری ICP یا جایگاهیابی در بازار در نظر بگیرید. این یک دکترین نیست، فقط یک دیدگاهه. ارزش نامگذاری این پدیده در اینه که کاری که بازاریابها همین الان هم انجام میدن رو به بحث گستردهتر درباره نحوه کدگذاری سوگیری در سیستمهای جستجو و هوش مصنوعی مرتبط میکنه.
سوگیری فقط به برندسازی یا هوش مصنوعی محدود نمیشه. ما سالهاست که میدونیم رتبهبندی نتایج جستجو میتونه رفتار کاربر رو شکل بده.
یک مطالعه در سال ۲۰۲۴ در PLOS نشون داد که صرفاً تغییر ترتیب نتایج میتونه نظرات رو تا ۳۰ درصد تغییر بده. مردم به نتایجی که رتبه بالاتری دارن بیشتر اعتماد میکنن، حتی اگه اطلاعات اصلی یکسان باشه.
حبابهای فیلتر این اثر رو تشدید میکنن. موتورهای جستجو با شخصیسازی نتایج بر اساس سابقه کاربر، دیدگاههای موجود رو تقویت کرده و مواجهه با گزینههای جایگزین رو محدود میکنن.
فراتر از این سوگیریهای رفتاری، سوگیریهای ساختاری هم وجود دارن. موتورهای جستجو به تازگی محتوا پاداش میدن، به این معنی که سایتهایی که بیشتر خزش میشن و بهروزرسانی میشن، اغلب در دیدهشدن برتری دارن، به خصوص برای کوئریهای حساس به زمان. دامنههای سطح بالای کد کشوری (ccTLD) مثل .fr یا .jp میتونن سیگنال ارتباط منطقهای باشن و در جستجوهای محلی اولویت پیدا کنن. و البته سوگیری محبوبیت و برند هم هست: برندهای معتبر یا شناختهشده اغلب در رتبهبندیها مورد لطف قرار میگیرن، حتی اگه محتواشون لزوماً قویتر نباشه، که این موضوع کار رو برای رقبای کوچیکتر یا جدیدتر برای ورود به رقابت سختتر میکنه.
برای متخصصان بازاریابی و روابط عمومی، درس یکسانه: سوگیری ورودی (اینکه چه دادههایی درباره شما موجوده) و سوگیری پردازش (اینکه سیستمها چطور اونها رو رتبهبندی و ارائه میکنن) مستقیماً چیزی رو شکل میده که مخاطبان به عنوان حقیقت باور میکنن.
سوگیری در خروجیهای LLM
مدلهای زبانی بزرگ (LLM) لایههای جدیدی از سوگیری رو معرفی میکنن.
دادههای آموزشی به ندرت متوازن هستن. بعضی گروهها، صداها یا دیدگاهها ممکنه بیش از حد نماینده داشته باشن، در حالی که بقیه غایب باشن. این موضوع پاسخهایی رو که این سیستمها میدن، شکل میده. طراحی پرامپت هم یک لایه دیگه اضافه میکنه: بسته به نحوه پرسیدن سوال، سوگیری تأیید و سوگیری در دسترس بودن میتونن خودشون رو نشون بدن.
تحقیقات اخیر نشون میده که این موضوع چقدر میتونه پیچیده باشه.
- محققان MIT دریافتند که حتی ترتیب اسنادی که به یک LLM داده میشه، میتونه نتیجه رو تغییر بده.
- مقالهای در مجله Nature در سال ۲۰۲۴ انواع مختلف سوگیریهایی رو که در LLMها ظاهر میشن، از شکافهای بازنمایی گرفته تا چارچوببندی فرهنگی، فهرست کرد.
- یک مطالعه در PNAS تأیید کرد که حتی پس از تنظیمات مربوط به انصاف (fairness tuning)، سوگیریهای ضمنی همچنان باقی میمونن.
- وبسایت LiveScience گزارش داد که چتباتهای جدیدتر تمایل دارن مطالعات علمی رو بیش از حد سادهسازی کنن و از جزئیات حیاتی چشمپوشی کنن.
اینها یافتههای حاشیهای نیستن. این موارد نشون میدن که سوگیری در هوش مصنوعی یک مورد خاص نیست؛ بلکه حالت پیشفرضه. برای بازاریابها و متخصصان ارتباطات، نکته این نیست که در علم این موضوع استاد بشن؛ بلکه باید بفهمن که اگه از اول برای چیزی که به سیستمها وارد میشه فکری نکنن، خروجیها میتونن شما رو به اشتباه نشون بدن.
جمعبندی و نتیجهگیری
نرخ انتخاب به ما نشون میده که سوگیری در سیستمهای بازیابی هوش مصنوعی چطور کار میکنه. برندسازی نشون میده که سوگیری در بازارِ برداشتها چطور عمل میکنه. و سوگیری جهتدار راهی برای اتصال این واقعیتهاست و به ما یادآوری میکنه که همه سوگیریها تصادفی نیستن. گاهی اوقات انتخاب میشن.
نکته کلیدی این نیست که وانمود کنیم سوگیری وجود نداره؛ البته که وجود داره. نکته اینه که تشخیص بدیم آیا این اتفاق به صورت منفعلانه برای شما میفته، یا شما دارید اون رو به طور فعال و استراتژیک به کار میگیرید. هم بازاریابها و هم متخصصان روابط عمومی در این زمینه نقش دارن: یکی در ساخت داراییهای قابل بازیابی، و دیگری در ایجاد یک روایت مقاوم برای برند. (پ.ن: هوش مصنوعی واقعاً نمیتونه جای یک انسان رو برای این کار بگیره.)
خب، با این اطلاعات باید چیکار کرد؟
بفهمید سوگیری کجا خودش را نشان میدهد
در جستجو، سوگیری از طریق مطالعات، ممیزیها و تستهای سئو آشکار میشه. در هوش مصنوعی، محققان با پرامپتهای ساختاریافته، خروجیها رو بررسی و اون رو کشف میکنن. در برندسازی، سوگیری در واکنش مشتریان مشخص میشه. نکته کلیدی اینه که بدونید سوگیری همیشه یک جایی خودش رو نشون میده، و اگه دنبالش نباشید، سیگنالهای حیاتی درباره نحوه درک یا بازیابی شدن برندتون رو از دست میدید.
تشخیص دهید چه کسانی سوگیری را پنهان میکنند
موتورهای جستجو و ارائهدهندگان LLM همیشه نحوه وزندهی به انتخابهاشون رو فاش نمیکنن. شرکتها اغلب ادعای بیطرفی میکنن، حتی وقتی انتخابهاشون چیز دیگهای میگه. پنهان کردن سوگیری باعث از بین رفتنش نمیشه؛ بلکه مقابله با اون رو سختتر میکنه و وقتی بالاخره سطح بیاد، ریسک بیشتری ایجاد میکنه. اگه در مورد موضع خودتون شفاف نباشید، ممکنه کس دیگهای اون رو برای شما تعریف کنه.
با سوگیری مثل یک شفافیت برخورد کنید
لازم نیست جایگاهیابی برندتون رو با عنوان «سوگیری جهتدار ما» معرفی کنید. اما باید بپذیرید که وقتی یک پروفایل مشتری ایدهآل (ICP) انتخاب میکنید، پیامهاتون رو مینویسید، یا محتوا رو برای بازیابی توسط هوش مصنوعی بهینه میکنید، در حال انتخابهای آگاهانه درباره شامل کردن و حذف کردن هستید. شفافیت یعنی پذیرش این انتخابها، اندازهگیری تأثیرشون، و مسئولیتپذیری در قبال مسیری که تعیین کردهاید. این تفاوت بین اینه که سوگیری شما رو شکل بده یا شما سوگیری رو شکل بدید.
ردپای خود در دنیای هوش مصنوعی را با برنامه مدیریت کنید
همونطور که جایگاه برند رو با هدف شکل میدید، باید تصمیم بگیرید که میخواید در سیستمهای هوش مصنوعی چطور به نظر برسید. این یعنی انتشار محتوا به روشهایی که قابل بازیابی، ساختاریافته با نشانههای اعتماد و همسو با موضع دلخواه شما باشن. اگه این موضوع رو به طور فعال مدیریت نکنید، هوش مصنوعی باز هم درباره شما تصمیم میگیره؛ فقط این تصمیمها، انتخابهایی نیستن که شما کنترلشون کرده باشید.
یک خطر نهایی که باید در نظر گرفت
سوگیری ذاتاً چیز بدی نیست؛ این سوگیری پنهان است که خطرناکه.
در موتورهای جستجو، در سیستمهای هوش مصنوعی و در بازار، سوگیری حالت پیشفرضه. اشتباه، داشتنِ اون نیست. اشتباه اینه که اجازه بدید بدون اینکه متوجه حضورش باشید، نتایج رو شکل بده. شما میتونید سوگیری خودتون رو با قصد و نیت تعریف کنید یا اون رو به شانس بسپارید. یک مسیر به شما کنترل میده. مسیر دیگه، برند و کسبوکارتون رو به رحم و مروت نحوه تفسیر دیگران از شما واگذار میکنه.
و این هم فکری که حین کار روی این مطلب به ذهنم رسید: چی میشه اگه خودِ سوگیری بتونه به یک روش برای حمله تبدیل بشه؟ مطمئنم این ایده جدیدی نیست، اما بیاید به هر حال بررسیش کنیم. تصور کنید یک رقیب اونقدر محتوا تولید کنه که شرکت شما رو در یک قالب خاص نشون بده، طوری که وقتی یک LLM اون ورودیها رو در یک پاسخ فشرده میکنه، نسخهای که اونها از شما ساختن، به نمایش دربیاد. حتی لازم نیست مستقیماً از شما اسم ببرن. فقط کافیه شما رو اونقدر خوب توصیف کنن که سیستم ارتباط رو برقرار کنه. نیازی به رد کردن هیچ خط قرمز قانونی هم نیست، چون LLMهای امروزی در حدس زدن یک برند، وقتی فقط لوگو یا یک ویژگی معروفش رو به زبان عامیانه توصیف میکنید، خیلی خوب عمل میکنن.
بخش نگرانکننده اینه که این سناریو چقدر محتمل به نظر میرسه. LLMها به روش سنتی واقعیتسنجی نمیکنن؛ اونا فقط الگوهای موجود در دادههای در دسترسشون رو فشرده و بازسازی میکنن. اگه الگوها منحرف باشن چون کسی عمداً در حال شکل دادن به روایت بوده، خروجیها هم میتونن اون انحراف رو منعکس کنن. در واقع، «نسخه» رقیب شما از برندتون میتونه به توصیف «پیشفرض» تبدیل بشه که کاربران وقتی از سیستم درباره شما سوال میکنن، میبینن.
حالا تصور کنید این اتفاق در مقیاس بزرگ بیفته. یک کمپین شایعهپراکنی آنلاین برای تأثیرگذاری نیازی به ترند شدن نداره. فقط کافیه در جاهای کافی، در تنوعهای کافی وجود داشته باشه تا یک مدل هوش مصنوعی اون رو به عنوان اجماع در نظر بگیره. وقتی این روایت در پاسخها جا بیفته، ممکنه کاربران به سختی بتونن روایت شما از داستان رو پیدا کنن.
نمیدونم این یک ریسک واقعی در کوتاهمدته یا فقط یک آزمایش فکری حاشیهای، اما ارزش پرسیدن رو داره: آیا شما آمادهاید اگه کسی بخواد کسبوکار شما رو اینطوری بازتعریف کنه؟
پاسخی بگذارید