طلوع دستیاران هوشمند در دنیای روزنامه‌نگاری

دستیاران هوش مصنوعی در عصر انقلاب دیجیتال به روزنامه‌نگاران کمک می‌کند تا کارهای وقت‌گیر روزمره را انجام دهند.

طلوع دستیاران هوشمند در دنیای روزنامه‌نگاری

از مدل‌های زبانی بزرگ تا دستیار هوشمند
اما پیش از هر چیز بیایید ببینیم دستیار هوشمند چیست که قرار است اقتصاد 2025 را متحول کند؟
اگر همین حالا از جمله کسانی هستید که روزانه از ابزارهای هوش مصنوعی استفاده می‌کنید، می‌دانید که می‌توانید پرامپت‌هایی به ماشین بدهیم و بر مبنای آن دستورها ماشین برای ما متن، عکس و تصویر متحرک می‌سازد.
نقش مدل‌های بزرگ زبانی[3] در اینجا بسیار اهمیت دارد. این مدل‌های بزرگ زبانی، سیستم‌های پیشرفته‌ی هوش مصنوعی‌اند که با استفاده از شبکه‌های عصبی عمیق، می‌توانند زبان طبیعی انسان را درک و تولید کنند. این مدل‌ها با پردازش حجم عظیمی از داده‌های متنی، الگوها و ساختارهای زبانی را یاد می‌گیرند و می‌توانند در کار ترجمه و خلاصه‌سازی مطالب و تبدیل صوت به متن و... به کار روزنامه‌نگاران بیایند. به عنوان مثال، مدل GPT-3 که توسط OpenAI توسعه یافته است، با داشتن ۱۷۵ میلیارد پارامتر، می‌تواند متونی تولید کند که از نظر سبک و محتوا شباهت زیادی به نوشته‌های انسانی دارند.
اگر شما یک روزنامه‌نگار باشید برای هریک از مراحل «جست‌وجو»، «تولید» و «توزیع» محتواهای خبربنیان خود از ابزارهایی ویژه‌ی هریک از این مراحل استفاده می‌کنید.
در جدول زیر برخی از این ابزارها را مشخص کرده‌ام:

دسته بندی ابزار هوش مصنوعی لینک
جست‌وجو خبر Perplexity AI https://www.perplexity.ai/
Grok (xAI) https://x.ai/
Google Gemini https://gemini.google.com/
Microsoft Copilot https://copilot.microsoft.com/
تولید خبر ChatGPT (OpenAI) https://openai.com/chatgpt
Jasper https://www.jasper.ai/
Grammarly https://www.grammarly.com/
StoryChief https://www.storychief.io/
توزیع خبر SEMrush https://www.semrush.com/
Buffer https://buffer.com/
Hootsuite https://www.hootsuite.com/
OpenAI’s Agents SDK https://platform.openai.com/docs/assistants
Adobe Experience Cloud https://www.adobe.com/uk/experience-cloud.html


















یعنی به عنوانی یک روزنامه‌نگار می‌توانیم از این ابزارها برای تسریع کار خود استفاده کنیم. اما امروز کل این فرایند را می‌توان بر دوش یک کارگزار هوشمند و آموزش‌دیده گذاشت. این اتفاق تازه‌ای نیست؛ جذابیت قصه برای ما روزنامه‌نگارها آنجاست که حالا می‌توان خیلی ساده‌تر از ماه‌های پیش کارها را به یک دستیار هوشمند بسپریم.

به زبان ساده، یک عامل یا Agent چیزی است که عمل می‌کند، قدرت دارد، یا وسیله‌ای برای رسیدن به یک هدف است. (این توضیح ضروری است که در این یادداشت‌ها به تبعیت از منبع اصلی، منظور از «عامل» همان «دستیار» یا کارگزار است.) (Lanham,2025:27) ابزارهایی مثل دستیارهای GPT شرکت OpenAI هم نوعی عامل هوش مصنوعی محسوب می‌شوند. شرکت OpenAI بیشتر از کلمه دستیار یا Assistant استفاده می‌کند، چون در گذشته یادگیری ماشین، عامل به چیزی گفته می‌شد که خودش تصمیم می‌گیرد و مستقل عمل می‌کند.


روش‌های مختلف تعامل یک کاربر با مدل زبانی بزرگ (LLM)
امروزه ما از راه‌های مختلفی با مدل‌های زبانی بزرگ ارتباط بر قرار می‌کنیم:
 
  • ارتباط مستقیم کاربر: مثل وقتی که از نسخه‌های قدیمی‌تر ChatGPT استفاده می‌کردیم. یعنی با خود مدل زبانی بزرگ مستقیم حرف می‌زدیم و هیچ دستیار یا عاملی بین ما نبود. یک روزنامه‌نگار از موتور جست‌وجو مثل گوگل برای پیدا کردن اطلاعات در مورد یک موضوع خبری استفاده می‌کند. او مستقیم با موتور جست‌وجو (که یک مدل زبانی بزرگ نیست، اما یک ابزار اطلاعاتی است) تعامل دارد. یا اینکه یک روزنامه‌نگار از یک نرم‌افزار ساده ویرایش متن برای نوشتن یک مقاله استفاده می‌کند.
     در واقع، در این حالت، خود مدل زبانی بزرگ (مانند
    ChatGPT) یا ابزاری مانند موتور جست‌وجو، نقش دستیار را به صورت ضمنی ایفا می‌کند، اما این دستیار موجودیتی جداگانه نیست که درخواست ما را بگیرد، پردازش کند و سپس به ابزار اصلی بفرستد.
 
  • واسطه‌ی عامل/دستیار[4]: مثل وقتی که از طریق ChatGPT با ابزار تصویرساز Dall-E 3 کار می‌کنیم. در این حالت، یک مدل زبانی بزرگ درخواست ما را می‌گیرد و آن را به شکلی تغییر می‌دهد که برای انجام آن کار بهتر باشد. مثلاً برای ساختن عکس، ChatGPT درخواستی که فرستادیم را دوباره و به شکل بهتری می‌نویسد. این نوع عامل کمک‌حال ماست در کارهایی که ناآشنا هستیم یا داریم از مدل‌های جدید استفاده می‌کنیم.
    بر فرض یک روزنامه‌نگار می‌خواهد برای مطلبش عکس بگذارد. او از طریق یک رابط کاربری (مثل یک وبسایت یا برنامه) درخواست خود را به یک ابزار تولید هوشمند تصویر (مانند
    Dall-E از طریق ChatGPT) می‌دهد. ChatGPT به عنوان واسطه، درخواست اولیه‌ی روزنامه‌نگار را می‌گیرد و آن را به یک پرامپت یا دستور دقیق‌تر برای Dall-E تبدیل می‌کند تا تصویر بهتری تولید شود.
  • عامل/دستیار[5]: مثل وقتی که از یک افزونه ChatGPT یا دستیار GPT استفاده می‌کنید. در این حالت، مدل زبانی بزرگ می‌داند که چه افزونه‌ها یا عملکردهایی وجود دارد و آماده استفاده از آنها می‌شود. اما پیش از استفاده، اجازه می‌گیرد. اگر اجازه بدهید، آن افزونه یا عملکرد اجرا می‌شود و نتیجه به مدل زبانی بزرگ برمی‌گردد. بعد مدل زبانی بزرگ آن جواب را به زبان ساده به شما می‌گوید.
    برای مثال، یک روزنامه‌نگار می‌خواهد یک فایل صوتی مصاحبه را به متن تبدیل کند. او از یک افزونه یا دستیار هوش مصنوعی در یک پلتفرم ویرایش صدا استفاده می‌کند. این دستیار می‌داند که می‌تواند فایل صوتی را به متن تبدیل کند. قبل از شروع کار، از روزنامه‌نگار اجازه می‌خواهد. اگر روزنامه‌نگار اجازه دهد، دستیار فایل صوتی را پردازش کرده و متن آن را برمی‌گرداند. سپس روزنامه‌نگار می‌تواند از این متن در گزارش خود استفاده کند.
    در واسطه عامل/دستیار، مدل زبانی بزرگ درخواست کاربر را اصلاح می‌کند تا به ابزار دیگری کمک کند کارش را بهتر انجام دهد. بنابراین، تفاوت اصلی عامل/دستیار با روش پیشین این است که در نوع اول، مدل زبانی بزرگ درخواست را تغییر می‌دهد، در حالی که در نوع دوم، از ابزارهای دیگر با اجازه کاربر استفاده می‌کند.

     
  • دستیار خودمختار: در این حالت، عامل درخواست شما را می‌فهمد، یک برنامه برای انجام آن می‌ریزد و مراحل کار را مشخص می‌کند. بعد خودش آن مراحل را اجرا می‌کند و تصمیم‌های لازم را می‌گیرد. ممکن است بعد از انجام بعضی قسمت‌های مهم کار از شما نظر بخواهد، اما بیشتر اوقات خودش کار را پیش می‌برد و اگر بتواند یاد می‌گیرد. این نوع عامل از نظر اخلاقی و ایمنی بیشتر مورد توجه است.
    برای نمونه، یک روزنامه‌نگار به یک عامل هوش مصنوعی دستور می‌دهد که در مورد یک رسوایی مالی خاص تحقیق و یک گزارش اولیه تهیه کند. عامل به طور خودکار منابع مختلف خبری، گزارش‌های دولتی و داده‌های مالی را می‌گردد، ارتباطات بین آنها را می‌یابد، طرحی کلی برای گزارش تهیه می‌کند و و پیش‌نویس اولیه‌ای از خبر را می‌نویسد. ممکن است در مراحل مهم از روزنامه‌نگار برای تأیید برخی یافته‌ها یا جهت‌گیری‌های گزارش نظر بخواهد، اما بیشتر مراحل تحقیق و نگارش را به طور مستقل انجام می‌دهد.
    روزنامه‌نگاران می‌توانند از قابلیت «پژوهش عمیق» یا
    Deep Research (که در مدل‌هایی مثل جمینای، گروک رایگان است) برای پردازش حجم زیادی از اطلاعات و تشخیص ارتباطات پیچیده کمک بگیرند و نتایج را به صورت منسجم ارائه دهند. این همان کاری است که یک عامل خودمختار برای انجام وظایف پیچیده مانند تحقیق روزنامه‌نگاری به آن نیاز دارد.



تصویر ۱.۱ چهار روش مختلف را نشان می‌دهد که یک کاربر می‌تواند با یک مدل زبانی بزرگ (LLM) ارتباط برقرار کند.

د
ر بخش دوم یادداشت‌های آموزشی «هوش‌نگار» درباره‌ی 
تعاملات پیشرفته و اجزای کلیدی دستیاران هوشمند در کار روزنامه‌نگاری و تولید محتوا صحبت می‌کنیم.
 
[1] AI Agents in Action
[2] Micheal Lanham
[3] Large Language Models (LLMs)
 
[4] Agent/assistant proxy
[5] Agent/assistant