کاربران واقعی مدل‌های زبانی بزرگ چطور ازشون استفاده می‌کنن و این چه معنایی برای ناشران داره؟

روند استفاده از مدل‌های زبانی بزرگ (LLM) در طول زمان، نکات مهمی رو برای تولیدکنندگان محتوا و مدیران وب‌سایت‌ها روشن می‌کنه. بازار داره بزرگ‌تر می‌شه، اما ما هم باید بهتر بشیم.

شرکت OpenAI به تازگی بزرگ‌ترین تحقیقی که تا امروز انجام شده رو درباره نحوه استفاده واقعی کاربرا از ChatGPT منتشر کرده. منم با کلی وسواس، نکات مهمی که به درد من و شما می‌خوره رو از دل این تحقیق بیرون کشیدم تا شما مجبور نباشید بین یه عالمه اطلاعات ریز و درشت، مفید و بی‌فایده سردرگم بشید.

خلاصه کلام (TL;DR)

  1. مدل‌های زبانی بزرگ (LLM) قرار نیست جایگزین جستجو بشن. اما دارن نحوه دسترسی و مصرف اطلاعات توسط مردم رو تغییر می‌دن.
  2. کوئری‌های «پرسشی» (Asking) با ۴۹٪ و کوئری‌های «اجرایی» (Doing) با ۴۰٪، بازار رو در دست گرفتن و کیفیتشون هم روز به روز بهتر می‌شه.
  3. سه کاربرد اصلی یعنی «راهنمایی عملی»، «جستجوی اطلاعات» و «نوشتن»، ۸۰ درصد کل مکالمات رو تشکیل می‌دن.
  4. تولیدکننده‌های محتوا باید دارایی‌های قابل لینک (Linkable Assets) بسازن که ارزش افزوده ایجاد کنه. دیگه دوره اینکه فقط دنبال ترافیک گرفتن از مقاله‌ها باشیم تموم شده.

چت‌بات ۱۰۱: اصول اولیه

چت‌بات یه مدل آماریه که آموزش دیده تا در جواب یه متن ورودی، یه متن خروجی تولید کنه. یه چیزی تو مایه‌های «میمون هرچی ببینه، یاد می‌گیره.»

چت‌بات‌های پیشرفته‌تر، یه فرآیند آموزشی دو یا چند مرحله‌ای دارن. تو مرحله اول (که بهش «پیش‌آموزش» یا pre-training هم می‌گن)، مدل‌های زبانی بزرگ یاد می‌گیرن کلمه بعدی تو یه جمله رو پیش‌بینی کنن.

این مدل‌ها مثل بهترین حسابدار دنیا، هم قابل پیش‌بینی‌ان و هم حوصله‌سربر. البته این لزوماً چیز بدی نیست. من دوست دارم آشپزم چاق باشه، خلبانم هوشیار باشه و مشاور مالیم اونقدر آدم خشکی باشه که نفر بعدی برای رهبری یه حزب محیط زیستی باشه!

تو مرحله دوم اوضاع یکم جذاب‌تر می‌شه. تو فاز «پس‌آموزش» (post-training)، مدل‌ها آموزش می‌بینن تا جواب‌های «باکیفیت» برای پرامپت‌ها تولید کنن. اون‌ها با استراتژی‌های مختلفی مثل «یادگیری تقویتی» (reinforcement learning) بهینه‌سازی می‌شن تا به پاسخ‌ها نمره بدن.

به مرور زمان، این مدل‌های زبانی، درست مثل سگ پاولف، بر اساس کیفیت جواب‌هاشون یا تشویق می‌شن یا تنبیه.

تو فاز اول، مدل یه درک پنهان (البته «درک» داخل گیومه) از دنیا پیدا می‌کنه. تو فاز دوم، دانشش صیقل داده می‌شه تا بهترین و باکیفیت‌ترین جواب رو تولید کنه.

بدون تنظیمات «دما» (temperature)، مدل‌های زبانی بزرگ تا زمانی که فرآیند آموزششون یکسان باشه، بارها و بارها دقیقاً همون جواب رو تولید می‌کنن.

دماهای بالاتر (نزدیک به ۱.۰) باعث افزایش تصادفی بودن و خلاقیت می‌شن. دماهای پایین‌تر (نزدیک به ۰) مدل‌ها رو خیلی قابل پیش‌بینی‌تر و دقیق‌تر می‌کنن.

پس، کاربرد شماست که تنظیمات دمای مناسب رو مشخص می‌کنه. برای کدنویسی بهتره دما نزدیک به صفر باشه. برای کارهای خلاقانه‌تر و محتوامحور، بهتره دما به یک نزدیک‌تر باشه.

داده‌ها به ما چه می‌گویند؟

اینکه مدل‌های زبانی بزرگ جایگزین مستقیم جستجو نیستن. به نظر من حتی نزدیک به اون هم نیستن. این تحقیق سمراش نشون داد که کاربران حرفه‌ای LLM، میزان جستجوهای سنتی خودشون رو افزایش دادن. به نظر می‌رسه نظریه «گسترش» (expansion theory) درسته.

اما این مدل‌ها یه تغییر اساسی تو نحوه دسترسی و تعامل مردم با اطلاعات ایجاد کردن. رابط‌های کاربری محاوره‌ای ارزش فوق‌العاده‌ای دارن؛ مخصوصاً تو محیط‌های کاری.

کی فکرشو می‌کرد ما اینقدر تنبل باشیم؟

۱. راهنمایی، جستجوی اطلاعات و نوشتن، سه کاربرد اصلی

این سه کاربرد اصلی، ۸۰ درصد کل مکالمات بین انسان و ربات رو تشکیل می‌دن: راهنمایی عملی، جستجوی اطلاعات، و «ربات شگفت‌انگیز، لطفاً کمکم کن یه متن بی‌روح و بدون هیچ شور و بینشی بنویسم.»

البته قبول دارم که اکثر کوئری‌های مربوط به «نوشتن» برای ویرایش متن‌های موجوده. با این حال، اگه من متنی رو بخونم که توسط هوش مصنوعی نوشته شده، حس می‌کنم سرم کلاه رفته. و فریبکاری اصلاً ویژگی جذابی نیست.

۲. استفاده غیرکاری رو به افزایش است

  • پیام‌های غیرکاری از ۵۳٪ کل استفاده، تا جولای ۲۰۲۵ به بیش از ۷۰٪ رسیده.
  • استفاده از مدل‌های زبانی بزرگ به یه عادت تبدیل شده؛ مخصوصاً وقتی پای تصمیم‌گیری‌های درست، چه تو محیط کار و چه بیرون از اون، وسط باشه.

۳. نوشتن، رایج‌ترین کاربرد در محیط کار

  • «نوشتن» رایج‌ترین کاربرد کاریه و به طور متوسط در ژوئن ۲۰۲۵، ۴۰٪ از پیام‌های مربوط به کار رو تشکیل داده.
  • حدود دو سوم از کل پیام‌های مربوط به «نوشتن»، درخواست برای ویرایش متن‌های موجود کاربره، نه تولید متن جدید از صفر.

من کلی آدم می‌شناسم که فقط از مدل‌های زبانی بزرگ برای نوشتن ایمیل‌های بهتر استفاده می‌کنن. تقریباً دلم برای اون خوره‌های تکنولوژی می‌سوزه که می‌بینن کاربردهای اصلی این ابزارها اینقدر خالی از خلاقیته.

۴. کدنویسی، کمتر از انتظار

  • کوئری‌های مربوط به کدنویسی کامپیوتر سهم نسبتاً کمی دارن و فقط ۴.۲٪ از کل پیام‌ها رو تشکیل می‌دن.*
  • شاید این آمار عجیب به نظر برسه، اما ربات‌های تخصصی مثل Claude یا ابزارهایی مثل Lovable جایگزین‌های بهتری هستن.
  • این یه نکته قابل توجهه. استفاده از مدل‌های زبانی تخصصی رشد می‌کنه و به احتمال زیاد صنایع خاصی رو تحت سلطه خودش درمیاره، چون می‌تونن خروجی‌های باکیفیت‌تری تولید کنن. آموزش تخصصی به سبک مرحله دوم، محصول خیلی بهتری رو به وجود میاره.

*در مقایسه با ۳۳٪ از مکالمات کاری در Claude.

البته مهمه که بدونید مطالعات دیگه‌ای هم وجود دارن که نظرات متفاوتی درباره کاربردهای مدل‌های زبانی بزرگ دارن. پس اوضاع اونقدرها هم که فکر می‌کنیم قطعی و مشخص نیست. مطمئنم که شرایط در آینده هم تغییر می‌کنه.

۵. دیگه خبری از سلطه مردها نیست

  • کاربران اولیه به طور نامتناسبی مرد بودن (حدود ۸۰٪ با اسم‌هایی که معمولاً مردانه هستن).
  • این عدد تا ژوئن ۲۰۲۵ به ۴۸٪ کاهش پیدا کرده و حالا احتمال اینکه کاربران فعال اسم‌های زنانه داشته باشن، کمی بیشتره.

قبول، ما مردها هم عیب و ایرادای خودمون رو داریم. شاید در طول تاریخ یکم تو جنگ و دعوا عجول بودیم و یه کم هم سلطه‌گر. اما دیدن این برابری حس خوبیه.

۶. کوئری‌های پرسشی سریع‌تر رشد می‌کنند و باکیفیت‌ترند

  • ۸۹٪ از کل کوئری‌ها مربوط به «پرسش» (Asking) و «اجرا» (Doing) هستن.
  • ۴۹٪ پرسشی، ۴۰٪ اجرایی و فقط ۱۱٪ برای «بیان احساسات» (Expressing).
  • پیام‌های پرسشی در طول سال گذشته سریع‌تر از پیام‌های اجرایی رشد کردن و کیفیت بالاتری هم دارن.

۷. روابط و تأملات شخصی در اولویت نیستند

  • مطالعات زیادی بودن که می‌گفتن مدل‌های زبانی بزرگ برای مردم نقش روان‌درمانگر شخصی رو پیدا کردن (همونطور که بالاتر اشاره شد).
  • اما طبق گفته OpenAI، روابط و تأملات شخصی فقط ۱.۹٪ از کل پیام‌ها رو تشکیل می‌دن.

۸. این جوون‌های لعنتی (*با مشت گره‌کرده*)

نتیجه‌گیری نهایی

من فکر نمی‌کنم مدل‌های زبانی بزرگ یه فاجعه برای تولیدکننده‌های محتوا باشن. درسته، هیچ ترافیک ارجاعی (referral) برامون نمی‌فرستن و شروع کردن به حذف کردن منابع و استنادها برای کاربرای غیرپولی (یه حرکت کلاسیک!). اما خب، هیچ‌کدوم از این غول‌های تکنولوژی قرار نیست چیزی رو دو دستی تقدیم ما کنن.

این یه مسابقه برای رسیدن به ماهه، و ما اون سگی هستیم که برای پرواز آزمایشی فرستادنش فضا.

اما اگه شما یه تولیدکننده محتوا هستید که صاحب‌نظره، مخاطب داره و خوشبختانه عمق برند و دارایی‌های خوبی هم در اختیار داره، جاتون امنه. هرچند که رفتار خزنده‌هاشون (crawlers) دیگه داره از کنترل خارج می‌شه.

یکی از کاربردی‌ترین نتایجی که ما به عنوان تولیدکننده محتوا می‌تونیم از این داده‌ها بگیریم، تغییر واضح در اینتنت‌ها (قصد کاربر) است. برای سال‌ها، ما با اینتنت‌های ناوبری (navigational)، اطلاعاتی (informational)، تجاری (commercial) و تراکنشی (transactional) سروکار داشتیم.

حالا ما با اینتنت «انجام دادن» (Doing) یا «تولید کردن» (Generating) طرفیم. و این خیلی مهمه.

سئو برای تولیدکنندگان محتوا نمرده. اما ما باید کاری بیشتر از صرفاً انتشار محتوا انجام بدیم. باید از مزایای هوش مصنوعی دفاع کنیم، اما همزمان فاصله‌مون رو هم باهاش حفظ کنیم.

به سرویس BBC Verify فکر کنید. محتوایی که ماشین‌ها نمی‌تونن خلاصه‌ش کنن، چون ارزش افزوده خیلی بالایی داره. ابزارها و دارایی‌های قابل لینک. نظرات واقعی از متخصصانی که در مرکز توجه قرار گرفتن.

اما رسوندن این کیفیت به مقیاس بالا کار سختیه. سئوی برنامه‌ریزی‌شده (Programmatic SEO) می‌تونه ارزش فوق‌العاده‌ای ایجاد کنه. ابزارها هم همینطور. ابزارهایی که بارها و بارها به کوئری‌های «اجرایی» کاربرا جواب می‌دن. ما باید چیزهایی بسازیم که خارج از مجموعه داده‌های موجود، ارزش افزوده ایجاد کنن.

و اگه مخاطب شما عموماً جوون‌تر و خوش‌بین‌تره، باید بیشتر به این سمت حرکت کنید.

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *