۱۵ بهمن ۱۴۰۴

روزنامه‌نگاری داده‌محور

بررسی چیستی «روزنامه‌نگاری داده‌محور» و تجربه‌ روزنامه‌نگاری از میان حجم زیاد داده‌ها

1. آموزش
2. روزنامه نگاری
علی شاكر
1395-03-05 10:42:00
کد مطلب : 3873
نسخه چاپ
https://hamshahritraining.ir/3873

اطلاعات و آمار همیشه جزو بخش‌های سخت‌فهم مطالب روزنامه‌نگاران است. حالا فرض کنید ناگهان 11.5 میلیون سند به دست شما برسد. اتفاقی که برای روزنامه‌ زودویچه سایتونگ افتاد. روزنامه‌نگاران باید 4.8 میلیون ایمیل، سه میلیون سند با فرمت پایگاه‌های داده، دو میلیون پی‌دی‌اف، یک میلیون عکس و 320 هزار متن را بررسی می‌کردند. این اسناد که به پاناما معروف شدند مربوط به دفتر وکالت موساک فونسکا بودند. موضوع این اسناد 40 ساله نیز شامل مواردی حساس می‌شد. مواردی همچون پولشویی، فرار مالیاتی و دور زدن تحریم‌های بین‌المللی.

سوال اینجاست که بعد از دریافت این حجم از اطلاعات تخصصی باید چگونه آن را انعکاس دهیم؟ جوری که هم مخاطبان متوجه آن شوند و هم به اصل اطلاعات خدشه‌ای وارد نشود. این درست است که داده‌ها و اطلاعات جزئی جدانشدنی از روزنامه‌نگاری‌اند، ولی یادمان باشد که فرق روزنامه‌نگاری داده‌محور با روزنامه‌نگاری سنتی این است که اکنون روزنامه‌نگارن در حال به‌وجود آوردن اپ‌ها و امکان‌های متعاملی هستند تا مردم به این واسطه بتوانند اطلاعات را راحت‌تر بفهمند، در آن بیشتر عمیق شوند و نکات دیگری از آن استخراج کنند. در تمام دنیا روزنامه‌نگاران با اطلاعات و حجم زیادی از داده‌هایی که از دولت، شبکه‌های اجتماعی، ابزارهای ارتباطی و ... دست و پنجه نرم می‌کنند و از آن جالب‌تر اینکه با این اطلاعات باید گزارش‌های فوری و فوتی تهیه کنند. با این همه روزنامه‌نگاری داده‌محور با چالش‌های زیادی مواجه است. از جمله سواد پایین دیجیتال و دسترسی‌های محدود به اطلاعات و آمار. (Havard, 2015: 2)

ظهور ویکی‌لیکس و چالش‌هایی را برای روزنامه‌های سنتی به‌وجود آورد سبب شد تا آنها به شیوه‌های جدیدِ یافتن و ارائه اخبار بیندیشند. روزنامه‌نگاران حالا با حجم زیادی از دیتا و داده مواجه بودند. برای نمونه 92 هزار سند مربوط به جنگ افغانستان بود که به زبان نظامی نوشته شده بود و فهمش برای غیرنظامیان چندان ساده نبود(Roger, 2011) در زمینه اسناد پاناما هم با مشکلی مشابه روبه‌رویم. فهم ادبیات اقتصادی و مالی نیازمند پیشینه‌ و دانشی حداقلی در این زمینه است. این مشکل هم مربوط به روزنامه‌نگاران است که می‌خواهند داستان خویش را بنویسند و هم خوانندگان عادی که می‌خواهند نگاهی از نزدیک به ماجرا بیندازند. از طرف دیگر تعداد اسناد به‌قدری زیاد باست که بررسی آن از سوی روزنامه‌نگاران وقت زیادی می‌گیرد. اینکه بخواهند هر روز به این اسناد سرکشی کنند و مثل سابق پس از یادداشت‌برداری از آن شروع کنند به گزارش‌ نوشتن عملی نیست.

این نکته را نیویورک‌تایمز و گاردین خیلی زود فهمیدند. به همین خاطر ابزارهایی برای جست‌وجو در این داده‌ها بکارگرفتند تا اطلاعات را به شکل مجسم و در وبسایت‌هایی با قابلیت ارتباط متعامل قرار دهند. بدین ترتیب خوانندگان راحت‌تر به محتوای آن دسترسی داشتند. این شکل از گزارش را «روزنامه‌نگاری داده‌محور»[1] نامیدند. البته در شکل‌گیری و گسترش این روند ویکی‌لیکس نقش مهمی داشته است. هرچند این شیوه روزنامه‌نگاری سابقه زیادی دارد، ولی هیچ‌وقت تا این حد مورد نیاز روزنامه‌نگاران نبوده است. اما در این شیوه باید چه کنیم؟

چه‌طور اطلاعات را مدیریت کنیم؟

ریچ گوردن[2] استاد دانشگاه روزنامه‌نگاری نورث‌ایسترنِ آمریکا معتقد است کار به شیوه روزنامه‌نگاری داده‌محور باید گروهی باشد؛ چون در عمل یک فرد توان انجام آن را ندارد.

او می‌گوید که سردبیران باید به سه بعد از روزنامه‌نگاری داده‌محور بیندیشند و سه نوع از مهارت‌های روزنامه‌نگاری را با آن همراه کند. وی طبق این شکل آن را توضیح می‌دهد:

مدل1

روزنامه‌ها باید افرادی را با سه مهارت مجزا به کار بگیرند. بخش‌هایی که با شماره مشخص شده‌اند افراد و شغل‌هایی را نشان می‌دهد که به بیش از یک مهارت نیاز دارند. چه‌قدر خوب است اگر تحریریه‌ای بتواند کسی را با بیش از یک مهارت جذب کند. این سه بعد عبارتند از:

1) گزارشگری به یاری رایانه[3]: این روزنامه‌نگاران کارشان را با گزارش خبری شروع می‌کنند و آن را با گشتن و پیدا کردن اطلاعات ارزشمند در دیتاهای دیگر تکمیل می‌کنند.(گزارش به یاری رایانه نامی است که از اواخر دهه 80 میلادی وارد حرفه روزنامه‌نگاری شد) معمولا این گزارشگران اطلاعاتی در ذهن دارند و خوب می‌دانند که چه‌طور برای تکمیل آن به پرس‌وجو بپردازند تا بتوانند جنبه‌های دیگر آن را روشن و مشخص کنند. آنها این اطلاعات را از آرشیو اسناد، دیتابیس‌ها بیرون می‌آورند و بعد با نرم‌افزارهای ترسیم اطلاعات آن را ارائه می‌دهند. البته به شکلی همه‌فهم و ساده.

2) برنامه‌نویسان اپلیکیشن‌های خبری[4]: این افراد تازه ‌وارد‌ترین روزنامه‌نگاری داده‌محور هستند و آنچه که به‌عنوان برنامه‌نویسی و مهارت‌های مربوط به آن برای ارائه اطلاعات یادگرفته‌اند به‌طور مستقیم مربوط به کار حرفه‌ای آنان در عرصه روزنامه‌نگاری می‌شود. کار آنان بررسی این امر است که ببینند بهترین شکل ارائه داده‌ها و اطلاعات به‌طور آنلاین چگونه است. این اعضا دستی در برنامه‌نویسی، مدیریت دیتابیس و شبکه دارند و با زبان‌های HTML، CSS و Java نیز آشنایی دارند و می‌توانند اپ بنویسند.

3) خبرگان مصورسازی داده‌ها: از قدیم تحریریه‌ها مدیر هنری و گرافیست داشتند که یکی از کارهای‌شان ترسیم و طراحی گرافیک‌های خبری بوده است. ترسیم این گرافیک‌ها به فهم مطلب نویسنده کمک زیادی می‌کرد و می‌کند. در روزنامه‌نگاری داده‌محور همزمان با نوشته شدن مطلب، تصویرگر این داده‌ها نیز دست به کار می‌شود. او باید خودش اول توجیه و اطلاعات را درست فهمیده باشد.(Gordon, 2013)

در مثال اسناد پاناما پس از لو رفتن اسناد و رسیدن آن به تحریریه روزنامه، ما باید ابتدا به دقت محتوای آن را بررسی کنیم. اسناد را در قالب‌های نرم‌افزاری بریزیم تا بتوانیم راحت‌تر در میان آن دنبال اطلاعات مورد نظر خویش بگردیم. مثلا می‌توانیم به پایگاه (http://www.onlineocr.net/) برویم و فایل‌های اسکن شده PDF را تبدیل به Word کنیم. بدین ترتیب گشتن در میان اسناد با ترفند CTRL- F بسیار راحت‌ می‌شود.

برای مصور کردن داده‌ها وبسایت ManyEyes نمونه خوبی است. می‌توانیم در این وبسایت به‌طور رایگان اطلاعات خویش را بارگذاری و سپس این داده‌ها را مصور کنیم. البته همان‌طور که بردشو نیز تاکید می‌کند این چهار مرحله به کارگروهی نیازمند است. چون در واقع یک نفر به تنهایی نمی‌تواند همه این‌کارها را با هم انجام دهد. دست آخر نیز بهتر است اصلِ اطلاعات خام در اختیار خوانندگان قرار گیرد. لورنز این جریان را نوعی پالایش اطلاعات می‌داند که در آن یک سری داده خام به اطلاعاتی معنی‌دار و قابل فهم تبدیل می‌شوند.(Lorenz,2010:12).

این چهار مرحله و بایسته مهم و ضروری در انجام کار روی اطلاعات در روزنامه‌نگاری داده‌محور اهمیت اساسی دارد:

1- بخش مهمی از داده‌ها و دیتاها در فضای آنلاین در دسترس هستند. به‌ویژه در ایالات متحده آمریکا و بریتانیا که با ابتکار دولت بخش خیلی زیادی از داده‌ها در دسترس عموم قرار دارد. مشکل در اینجا همان است که پیش از این هم مطرح شد؛ یعنی اگر قابلیت دسترسی وجود نداشته باشد دسترسی‌داشتن صرف به اطلاعات کافی نیست. .

2- وجود ابزارهایی برای مدیریت، بررسی و ارائه ساده‌تر این دیتاها بسیار مهم است. مثل وبسایت ManyEyes

3- امکان دردسترس قراردادن داده‌ها به شکلی متعامل در اپلیکیشن‌های شبکه‌ای باید فراهم باشد.

4- بسیاری از کارشناسان معتقدند که اکنون دوره فوق‌العاده‌ای برای روزنامه‌نگاران است. آنان مدام برای پیدا کردن یک داستان خوب و انتشار سریع آن تحت فشارند و این در حالی است که با انتشار داده‌های خام این امکان را فراهم می‌کنیم تا مردم عادیِ بیرون از اتاق‌های خبر نیز تبدیل به عوامل جمع‌آوری و تجزیه‌وتحلیل داده‌های خام باشند و بتوانند در کنار روزنامه‌نگاران قرار بگیرند و به آنان کمک کنند. با این کار در وقت و منابع نیز صرفه‌جویی می‌شود.(Baack, 2011: 5)

نقش ویکی‌لیکس، هکرها و کاربران در روزنامه‌نگاری داده‌محور

آیا ویکی‌لیکس نیز کار روزنامه‌نگاری داده‌محور را انجام می‌دهد؟ دو استدلال مخالف وجود دارد؛ اول اینکه ویکی‌لیکس دنبال مصور کردن اطلاعات و آمار نیست و از دل آن اطلاعات و آماری که در اختیار دارد نیز داستان یا گزارشی تولید نمی‌کند. دقیقا این دو کار را رسانه‌های خبری و کاربران با اطلاعات خام ویکی‌لیکس انجام می‌دهند. (Lovink et al, 2010) بنابراین می‌توان گفت که در جریان و مراحل کاری روزنامه‌نگاری داده‌محور ویکی‌لیکس تنها مرحله اول و دوم را انجام می‌دهد؛ یعنی فقط داده‌ها را جمع‌آوری و بررسی می‌کند و نه بیشتر؛ یعنی داده‌های خام به اطلاعاتی مفید و قابل فهم برای عموم تبدیل نمی‌شود.

هرچند که برخی کارشناسان می‌گویند خود رسانه‌ها باید تبدیل به یک قطب اطلاعات و داده‌ شوند و نباید به نشت اطلاعات از سوی ویکی‌لیکس یا هکرهای دیگر دلخوش بود، ولی با این همه نمی‌توان نقش ویکی‌لیکس و اسناد پاناما را در مستحکم‌ شدن پایه‌ها و تجربه‌های روزنامه‌نگاری داده‌محور انکار کرد.

در جنگ افغانستان 391 هزار و 832 گزارش جنگی از سربازان وجود داشت. هر گزارش یک واقعه و اتفاق را شرح می‌داد. مسلما شرح تک‌تک این‌ها گیج‌کننده است. پس به کمک تکنولوژی‌های مصورسازی اطلاعات روی نقشه می‌توان تصویر بهتری از این اتفاق‌ها ارائه داد. این درحالی است که گزارش‌ها به زبانی خودمانی و البته قابل فهم برای ارتشی‌ها نوشته شده بود که برای دیگر مخاطب سخت‌فهم و سنگین به نظر می‌رسید. گاردین در انعکاس این اطلاعات هریک از آنها را دسته‌بندی کرد. مثلا کشته‌ها(نیروهای خودی، شهروندان و نیروهای دشمن) زمان، مکان و...(Rogers,2011) راجرز که در مقاله‌ای به تجربه‌ خود از جنگ عراق پرداخته می‌گوید که برای نشان دادن اطلاعات کشته‌ها از جدول‌ها و امکانات [5]Google Fusion استفاده کردیم. در عکس زیر می‌توانید نمونه‌ای از این نقشه‌ها را ببینید:

نقشه

بدین ترتیب از طریق امکاناتی که گوگل فیوژن در اختیار ما می‌گذارد یک دید کلی نسبت به کشته‌ها پیدا می‌کنیم و مخاطبان را بیشتر به متن ماجرا می‌بریم. گاردین یک گرافیک زنده یا متعامل نیز طراحی کرد؛ یعنی یک نقشه درست کرد و ساعتی بالای آن. هر ساعت و هر دقیقه که می‌گذشت روی این نقشه می‌توانستید ببینید چه اتفاقی افتاده و چند نفر از غیر نظامیان در یک روز خاص کشته‌ شده‌اند. منابعی که در صحنه حضور داشتند گزارش‌هایی را به گاردین می‌فرستادند و در عمل شاهد نوعی گرافیک متعامل بودیم. اینجاست که اعداد مجرد تبدیل به چیزهایی بامعنا می‌شوند.

اما همه اتفاق‌ها شبیه نشت اطلاعاتی ویکی‌لیکس و اسناد پاناما نیست. در این دو پرونده خبرنگاران روی جریانی از اطلاعات خام کار می‌کردند و سپس روی نقشه و یا نمودارهایی این اطلاعات را به شکلی همه فهم ارائه می‌‌دادند. ولی گاهی این اطلاعات با زندگی روزمره مردم سروکار دارد. مثلا گاردین در بخش تعاملی (در این نشانی http://www.theguardian.com/interactive) خود دارد چنین کاری را انجام می‌دهد.

خودمان قطب اطلاعات باشیم

اما یکی از مهمترین درس‌های ماجراهای ویکی‌لیکس و اسناد پاناما برای روزنامه‌نگاران این است که نباید صبر کنند تا اطلاعات و آمار به سمت‌شان بیاید. در عوض باید امکان‌هایی را که روزنامه‌نگاری داده‌محور در اختیارشان می‌گذارد، مغتنم بشمارند و سراغ کانون‌هایی بروند که می‌توان از آنجا اطلاعات درست و قابل اطمینان کسب کرد. ما همیشه نباید سر و شکل دهنده به اطلاعات باشیم. بلکه بهتر است یابنده و ارائه دهنده آن نیز خودمان باشیم. هنوز مهمترین ابزار کار روزنامه‌نگاری دیتا و داده‌های اطلاعاتی است فقط شیوه جمع‌آوری و ارائه سهل و قابل فهم آن اندکی با قدیم متفاوت شده است.

اینجاست که کسانی مثل کایسر، لورنز و مک‌گی، بر اهمیت تبدیل رسانه‌ها به قطب اطلاعاتی و دیتا در دنیای جدید تاکید دارند و می‌گویند که رسانه‌ها از حالتی جزیره‌ای به حالتی قطب‌گونه تبدیل شوند و اتفاقا خود همین سازمان‌ها باشند که اطلاعات را جمع و آن را تحلیل و بازنشر می‌کنند. (Kayser and et al, 2011)

اگر چنین اتفاقی بیفتد، این رسانه‌ها هستند که شیوه روزنامه‌نگاری داده‌محور را متداول‌تر می‌کنند و دیگر برای انعکاس اخبار نیاز نیست منتظر نشت اطلاعات از ویکی‌لیکس یا موساک فونسکا باشیم.

البته در این میان برای روزنامه‌نگاری داده‌محور مهمتر از ظرفیت‌های تکنولوژیک طریقه استفاده از این شیوه روزنامه‌نگاری است. اگر رسانه‌ها تبدیل به قطب داده‌ها و اطلاعات شوند خودشان حتما به این نتیجه می‌رسند که باید از امکان‌هایی جدید برای ارتقای کیفیت گزارش‌های خبری استفاده کنند و در این میان فقط و فقط سرعت نباید مهم باشد.

منابع:

- Baack, Stefan (2011) 'A new style of news reporting: Wikileaks and data-driven journalism' Cyborg Subjects: Discourses on Digital Culture, edited by Bonni Rambatan and Jacob Johanssen

- Bradshaw, Paul (2010): 'How to be a data journalist', The Guardian, Friday 1th October 2010 http://www.theguardian.com/news/datablog/2010/oct/01/data-journalism-how-to-guide

- Gray, Jonathan, (2012) Liliana Bounegru, Lucy Chambers 'The Data Journalism Handbook' O'Railly media Inc, Firs edition

- Gordon, Rich (2013) 'Want to build a data journalism team? You'll need these three people' http://knightlab.northwestern.edu/2013/06/28/want-to-build-a-data-journalism-team-youll-need-these-three-people/

- Howard, Alexander Benjamin (2015) 'The art and science of Data-Driven Journalism', Tow center for digital journalism, Colombia Journalism School

- Lorenz, Mirko (2010) 'Status and Outlook for data-driven journalism. In: European Journalism Center: Data-driven journalism: What is there to learn?' A paper on the datadriven journalism roundtable held in Amsterdam on 24 August 2010, P. 8-17.

- Lovink, Geert (2010) Patrice Riemens 'Twelve theses on WikiLeaks'http://mondediplo.com/openpage/twelve-theses-on-wikileaks

- Kayser-Bril, Nicolas/Lorenz, Mirko/McGhee, Geoff (2011) 'Media Companies must become trusted Data Hubs' Europian journalist Center http://ejc.net/magazine/article/media-companies-must-become-trusted-data-hubs#.Vzm4UNR95ko

- Rogers, Simon (2010) 'Florence Nightingale, datajournalist: information has always been beautiful.' Friday 13 August 2010 http://www.theguardian.com/news/datablog/2010/aug/13/florence-nightingale-graphics

- Rogers, Simon (2011): Wikileaks data journalism: how we handled the data. http://www.guardian.co.uk/news/datablog/2011/jan/31/wikileaks-data-journalism

* این نوشتار بخشی از مقاله‌ای است با عنوان «روزنامه‌نگاری داده‌محور از اسناد ویکی‌لیکس تا پاناما» که پیش از این در همایش دانشجویی دانشکده علوم ارتباطات علامه طباطبایی ارائه شده است.

[1] Data-driven journalism

[2] Rich Gordon

[3] Computer-assisted reporter

[4] News applications developer

[5] یکی دیگر از خدمات روی وب گوگل تلفیق اطلاعات است که می‌تواند در کار مدیریت داده‌ها بکار آید. می‌توان از طریق این سرویس اطلاعات را جمع‌آوری، مصورسازی کرد و به اشتراک گذاشت. آلون هالی و ربکا شیپلی در سال 2009 این وبسایت را راه‌ انداختند. همچنین از طریق این وبسایت می‌توان نمودارهای دایره‌ای، میله‌ای و همچنین نقشه‌های اطلاع‌رسان نیز طراحی کرد.

روزنامه‌نگاری داده‌محور

تازه ترین مطالب

نقشه راه بقای روزنامه‌نگاری در عصر هوش مصنوعی + نقد تحلیلی و پادکست خلاصه کتاب «خبرسازان»

مأموریت بقا؛ روزنامه‌نگاری در عصر هوش مصنوعی و بهینه‌سازی برای پاسخ (GEO)

قطب‌نمای تحریریه در مِه جنگ

گاف هوش مصنوعی و چالش نوین اعتماد در رسانه

روزنامه‌نگاری داده‌محور

نیم نگاه

اشتراک گذاری

تازه ترین مطالب

نقشه راه بقای روزنامه‌نگاری در عصر هوش مصنوعی + نقد تحلیلی و پادکست خلاصه کتاب «خبرسازان»

مأموریت بقا؛ روزنامه‌نگاری در عصر هوش مصنوعی و بهینه‌سازی برای پاسخ (GEO)

قطب‌نمای تحریریه در مِه جنگ

گاف هوش مصنوعی و چالش نوین اعتماد در رسانه