بررسی چیستی «روزنامهنگاری دادهمحور» و تجربه روزنامهنگاری از میان حجم زیاد دادهها
اطلاعات و آمار همیشه جزو بخشهای سختفهم مطالب روزنامهنگاران است. حالا فرض کنید ناگهان 11.5 میلیون سند به دست شما برسد. اتفاقی که برای روزنامه زودویچه سایتونگ افتاد. روزنامهنگاران باید 4.8 میلیون ایمیل، سه میلیون سند با فرمت پایگاههای داده، دو میلیون پیدیاف، یک میلیون عکس و 320 هزار متن را بررسی میکردند. این اسناد که به پاناما معروف شدند مربوط به دفتر وکالت موساک فونسکا بودند. موضوع این اسناد 40 ساله نیز شامل مواردی حساس میشد. مواردی همچون پولشویی، فرار مالیاتی و دور زدن تحریمهای بینالمللی.
سوال اینجاست که بعد از دریافت این حجم از اطلاعات تخصصی باید چگونه آن را انعکاس دهیم؟ جوری که هم مخاطبان متوجه آن شوند و هم به اصل اطلاعات خدشهای وارد نشود. این درست است که دادهها و اطلاعات جزئی جدانشدنی از روزنامهنگاریاند، ولی یادمان باشد که فرق روزنامهنگاری دادهمحور با روزنامهنگاری سنتی این است که اکنون روزنامهنگارن در حال بهوجود آوردن اپها و امکانهای متعاملی هستند تا مردم به این واسطه بتوانند اطلاعات را راحتتر بفهمند، در آن بیشتر عمیق شوند و نکات دیگری از آن استخراج کنند. در تمام دنیا روزنامهنگاران با اطلاعات و حجم زیادی از دادههایی که از دولت، شبکههای اجتماعی، ابزارهای ارتباطی و ... دست و پنجه نرم میکنند و از آن جالبتر اینکه با این اطلاعات باید گزارشهای فوری و فوتی تهیه کنند. با این همه روزنامهنگاری دادهمحور با چالشهای زیادی مواجه است. از جمله سواد پایین دیجیتال و دسترسیهای محدود به اطلاعات و آمار. (Havard, 2015: 2)
ظهور ویکیلیکس و چالشهایی را برای روزنامههای سنتی بهوجود آورد سبب شد تا آنها به شیوههای جدیدِ یافتن و ارائه اخبار بیندیشند. روزنامهنگاران حالا با حجم زیادی از دیتا و داده مواجه بودند. برای نمونه 92 هزار سند مربوط به جنگ افغانستان بود که به زبان نظامی نوشته شده بود و فهمش برای غیرنظامیان چندان ساده نبود(Roger, 2011) در زمینه اسناد پاناما هم با مشکلی مشابه روبهرویم. فهم ادبیات اقتصادی و مالی نیازمند پیشینه و دانشی حداقلی در این زمینه است. این مشکل هم مربوط به روزنامهنگاران است که میخواهند داستان خویش را بنویسند و هم خوانندگان عادی که میخواهند نگاهی از نزدیک به ماجرا بیندازند. از طرف دیگر تعداد اسناد بهقدری زیاد باست که بررسی آن از سوی روزنامهنگاران وقت زیادی میگیرد. اینکه بخواهند هر روز به این اسناد سرکشی کنند و مثل سابق پس از یادداشتبرداری از آن شروع کنند به گزارش نوشتن عملی نیست.
این نکته را نیویورکتایمز و گاردین خیلی زود فهمیدند. به همین خاطر ابزارهایی برای جستوجو در این دادهها بکارگرفتند تا اطلاعات را به شکل مجسم و در وبسایتهایی با قابلیت ارتباط متعامل قرار دهند. بدین ترتیب خوانندگان راحتتر به محتوای آن دسترسی داشتند. این شکل از گزارش را «روزنامهنگاری دادهمحور»[1] نامیدند. البته در شکلگیری و گسترش این روند ویکیلیکس نقش مهمی داشته است. هرچند این شیوه روزنامهنگاری سابقه زیادی دارد، ولی هیچوقت تا این حد مورد نیاز روزنامهنگاران نبوده است. اما در این شیوه باید چه کنیم؟
چهطور اطلاعات را مدیریت کنیم؟
ریچ گوردن[2] استاد دانشگاه روزنامهنگاری نورثایسترنِ آمریکا معتقد است کار به شیوه روزنامهنگاری دادهمحور باید گروهی باشد؛ چون در عمل یک فرد توان انجام آن را ندارد.
او میگوید که سردبیران باید به سه بعد از روزنامهنگاری دادهمحور بیندیشند و سه نوع از مهارتهای روزنامهنگاری را با آن همراه کند. وی طبق این شکل آن را توضیح میدهد:
روزنامهها باید افرادی را با سه مهارت مجزا به کار بگیرند. بخشهایی که با شماره مشخص شدهاند افراد و شغلهایی را نشان میدهد که به بیش از یک مهارت نیاز دارند. چهقدر خوب است اگر تحریریهای بتواند کسی را با بیش از یک مهارت جذب کند. این سه بعد عبارتند از:
1) گزارشگری به یاری رایانه[3]: این روزنامهنگاران کارشان را با گزارش خبری شروع میکنند و آن را با گشتن و پیدا کردن اطلاعات ارزشمند در دیتاهای دیگر تکمیل میکنند.(گزارش به یاری رایانه نامی است که از اواخر دهه 80 میلادی وارد حرفه روزنامهنگاری شد) معمولا این گزارشگران اطلاعاتی در ذهن دارند و خوب میدانند که چهطور برای تکمیل آن به پرسوجو بپردازند تا بتوانند جنبههای دیگر آن را روشن و مشخص کنند. آنها این اطلاعات را از آرشیو اسناد، دیتابیسها بیرون میآورند و بعد با نرمافزارهای ترسیم اطلاعات آن را ارائه میدهند. البته به شکلی همهفهم و ساده.
2) برنامهنویسان اپلیکیشنهای خبری[4]: این افراد تازه واردترین روزنامهنگاری دادهمحور هستند و آنچه که بهعنوان برنامهنویسی و مهارتهای مربوط به آن برای ارائه اطلاعات یادگرفتهاند بهطور مستقیم مربوط به کار حرفهای آنان در عرصه روزنامهنگاری میشود. کار آنان بررسی این امر است که ببینند بهترین شکل ارائه دادهها و اطلاعات بهطور آنلاین چگونه است. این اعضا دستی در برنامهنویسی، مدیریت دیتابیس و شبکه دارند و با زبانهای HTML، CSS و Java نیز آشنایی دارند و میتوانند اپ بنویسند.
3) خبرگان مصورسازی دادهها: از قدیم تحریریهها مدیر هنری و گرافیست داشتند که یکی از کارهایشان ترسیم و طراحی گرافیکهای خبری بوده است. ترسیم این گرافیکها به فهم مطلب نویسنده کمک زیادی میکرد و میکند. در روزنامهنگاری دادهمحور همزمان با نوشته شدن مطلب، تصویرگر این دادهها نیز دست به کار میشود. او باید خودش اول توجیه و اطلاعات را درست فهمیده باشد.(Gordon, 2013)
در مثال اسناد پاناما پس از لو رفتن اسناد و رسیدن آن به تحریریه روزنامه، ما باید ابتدا به دقت محتوای آن را بررسی کنیم. اسناد را در قالبهای نرمافزاری بریزیم تا بتوانیم راحتتر در میان آن دنبال اطلاعات مورد نظر خویش بگردیم. مثلا میتوانیم به پایگاه (http://www.onlineocr.net/) برویم و فایلهای اسکن شده PDF را تبدیل به Word کنیم. بدین ترتیب گشتن در میان اسناد با ترفند CTRL- F بسیار راحت میشود.
برای مصور کردن دادهها وبسایت ManyEyes نمونه خوبی است. میتوانیم در این وبسایت بهطور رایگان اطلاعات خویش را بارگذاری و سپس این دادهها را مصور کنیم. البته همانطور که بردشو نیز تاکید میکند این چهار مرحله به کارگروهی نیازمند است. چون در واقع یک نفر به تنهایی نمیتواند همه اینکارها را با هم انجام دهد. دست آخر نیز بهتر است اصلِ اطلاعات خام در اختیار خوانندگان قرار گیرد. لورنز این جریان را نوعی پالایش اطلاعات میداند که در آن یک سری داده خام به اطلاعاتی معنیدار و قابل فهم تبدیل میشوند.(Lorenz,2010:12).
این چهار مرحله و بایسته مهم و ضروری در انجام کار روی اطلاعات در روزنامهنگاری دادهمحور اهمیت اساسی دارد:
1- بخش مهمی از دادهها و دیتاها در فضای آنلاین در دسترس هستند. بهویژه در ایالات متحده آمریکا و بریتانیا که با ابتکار دولت بخش خیلی زیادی از دادهها در دسترس عموم قرار دارد. مشکل در اینجا همان است که پیش از این هم مطرح شد؛ یعنی اگر قابلیت دسترسی وجود نداشته باشد دسترسیداشتن صرف به اطلاعات کافی نیست. .
2- وجود ابزارهایی برای مدیریت، بررسی و ارائه سادهتر این دیتاها بسیار مهم است. مثل وبسایت ManyEyes
3- امکان دردسترس قراردادن دادهها به شکلی متعامل در اپلیکیشنهای شبکهای باید فراهم باشد.
4- بسیاری از کارشناسان معتقدند که اکنون دوره فوقالعادهای برای روزنامهنگاران است. آنان مدام برای پیدا کردن یک داستان خوب و انتشار سریع آن تحت فشارند و این در حالی است که با انتشار دادههای خام این امکان را فراهم میکنیم تا مردم عادیِ بیرون از اتاقهای خبر نیز تبدیل به عوامل جمعآوری و تجزیهوتحلیل دادههای خام باشند و بتوانند در کنار روزنامهنگاران قرار بگیرند و به آنان کمک کنند. با این کار در وقت و منابع نیز صرفهجویی میشود.(Baack, 2011: 5)
نقش ویکیلیکس، هکرها و کاربران در روزنامهنگاری دادهمحور
آیا ویکیلیکس نیز کار روزنامهنگاری دادهمحور را انجام میدهد؟ دو استدلال مخالف وجود دارد؛ اول اینکه ویکیلیکس دنبال مصور کردن اطلاعات و آمار نیست و از دل آن اطلاعات و آماری که در اختیار دارد نیز داستان یا گزارشی تولید نمیکند. دقیقا این دو کار را رسانههای خبری و کاربران با اطلاعات خام ویکیلیکس انجام میدهند. (Lovink et al, 2010) بنابراین میتوان گفت که در جریان و مراحل کاری روزنامهنگاری دادهمحور ویکیلیکس تنها مرحله اول و دوم را انجام میدهد؛ یعنی فقط دادهها را جمعآوری و بررسی میکند و نه بیشتر؛ یعنی دادههای خام به اطلاعاتی مفید و قابل فهم برای عموم تبدیل نمیشود.
هرچند که برخی کارشناسان میگویند خود رسانهها باید تبدیل به یک قطب اطلاعات و داده شوند و نباید به نشت اطلاعات از سوی ویکیلیکس یا هکرهای دیگر دلخوش بود، ولی با این همه نمیتوان نقش ویکیلیکس و اسناد پاناما را در مستحکم شدن پایهها و تجربههای روزنامهنگاری دادهمحور انکار کرد.
در جنگ افغانستان 391 هزار و 832 گزارش جنگی از سربازان وجود داشت. هر گزارش یک واقعه و اتفاق را شرح میداد. مسلما شرح تکتک اینها گیجکننده است. پس به کمک تکنولوژیهای مصورسازی اطلاعات روی نقشه میتوان تصویر بهتری از این اتفاقها ارائه داد. این درحالی است که گزارشها به زبانی خودمانی و البته قابل فهم برای ارتشیها نوشته شده بود که برای دیگر مخاطب سختفهم و سنگین به نظر میرسید. گاردین در انعکاس این اطلاعات هریک از آنها را دستهبندی کرد. مثلا کشتهها(نیروهای خودی، شهروندان و نیروهای دشمن) زمان، مکان و...(Rogers,2011) راجرز که در مقالهای به تجربه خود از جنگ عراق پرداخته میگوید که برای نشان دادن اطلاعات کشتهها از جدولها و امکانات [5]Google Fusion استفاده کردیم. در عکس زیر میتوانید نمونهای از این نقشهها را ببینید:
بدین ترتیب از طریق امکاناتی که گوگل فیوژن در اختیار ما میگذارد یک دید کلی نسبت به کشتهها پیدا میکنیم و مخاطبان را بیشتر به متن ماجرا میبریم. گاردین یک گرافیک زنده یا متعامل نیز طراحی کرد؛ یعنی یک نقشه درست کرد و ساعتی بالای آن. هر ساعت و هر دقیقه که میگذشت روی این نقشه میتوانستید ببینید چه اتفاقی افتاده و چند نفر از غیر نظامیان در یک روز خاص کشته شدهاند. منابعی که در صحنه حضور داشتند گزارشهایی را به گاردین میفرستادند و در عمل شاهد نوعی گرافیک متعامل بودیم. اینجاست که اعداد مجرد تبدیل به چیزهایی بامعنا میشوند.
اما همه اتفاقها شبیه نشت اطلاعاتی ویکیلیکس و اسناد پاناما نیست. در این دو پرونده خبرنگاران روی جریانی از اطلاعات خام کار میکردند و سپس روی نقشه و یا نمودارهایی این اطلاعات را به شکلی همه فهم ارائه میدادند. ولی گاهی این اطلاعات با زندگی روزمره مردم سروکار دارد. مثلا گاردین در بخش تعاملی (در این نشانی http://www.theguardian.com/interactive) خود دارد چنین کاری را انجام میدهد.
خودمان قطب اطلاعات باشیم
اما یکی از مهمترین درسهای ماجراهای ویکیلیکس و اسناد پاناما برای روزنامهنگاران این است که نباید صبر کنند تا اطلاعات و آمار به سمتشان بیاید. در عوض باید امکانهایی را که روزنامهنگاری دادهمحور در اختیارشان میگذارد، مغتنم بشمارند و سراغ کانونهایی بروند که میتوان از آنجا اطلاعات درست و قابل اطمینان کسب کرد. ما همیشه نباید سر و شکل دهنده به اطلاعات باشیم. بلکه بهتر است یابنده و ارائه دهنده آن نیز خودمان باشیم. هنوز مهمترین ابزار کار روزنامهنگاری دیتا و دادههای اطلاعاتی است فقط شیوه جمعآوری و ارائه سهل و قابل فهم آن اندکی با قدیم متفاوت شده است.
اینجاست که کسانی مثل کایسر، لورنز و مکگی، بر اهمیت تبدیل رسانهها به قطب اطلاعاتی و دیتا در دنیای جدید تاکید دارند و میگویند که رسانهها از حالتی جزیرهای به حالتی قطبگونه تبدیل شوند و اتفاقا خود همین سازمانها باشند که اطلاعات را جمع و آن را تحلیل و بازنشر میکنند. (Kayser and et al, 2011)
اگر چنین اتفاقی بیفتد، این رسانهها هستند که شیوه روزنامهنگاری دادهمحور را متداولتر میکنند و دیگر برای انعکاس اخبار نیاز نیست منتظر نشت اطلاعات از ویکیلیکس یا موساک فونسکا باشیم.
البته در این میان برای روزنامهنگاری دادهمحور مهمتر از ظرفیتهای تکنولوژیک طریقه استفاده از این شیوه روزنامهنگاری است. اگر رسانهها تبدیل به قطب دادهها و اطلاعات شوند خودشان حتما به این نتیجه میرسند که باید از امکانهایی جدید برای ارتقای کیفیت گزارشهای خبری استفاده کنند و در این میان فقط و فقط سرعت نباید مهم باشد.
منابع:
- Baack, Stefan (2011) 'A new style of news reporting: Wikileaks and data-driven journalism' Cyborg Subjects: Discourses on Digital Culture, edited by Bonni Rambatan and Jacob Johanssen
- Bradshaw, Paul (2010): 'How to be a data journalist', The Guardian, Friday 1th October 2010 http://www.theguardian.com/news/datablog/2010/oct/01/data-journalism-how-to-guide
- Gray, Jonathan, (2012) Liliana Bounegru, Lucy Chambers 'The Data Journalism Handbook' O'Railly media Inc, Firs edition
- Gordon, Rich (2013) 'Want to build a data journalism team? You'll need these three people' http://knightlab.northwestern.edu/2013/06/28/want-to-build-a-data-journalism-team-youll-need-these-three-people/
- Howard, Alexander Benjamin (2015) 'The art and science of Data-Driven Journalism', Tow center for digital journalism, Colombia Journalism School
- Lorenz, Mirko (2010) 'Status and Outlook for data-driven journalism. In: European Journalism Center: Data-driven journalism: What is there to learn?' A paper on the datadriven journalism roundtable held in Amsterdam on 24 August 2010, P. 8-17.
- Lovink, Geert (2010) Patrice Riemens 'Twelve theses on WikiLeaks'http://mondediplo.com/openpage/twelve-theses-on-wikileaks
- Kayser-Bril, Nicolas/Lorenz, Mirko/McGhee, Geoff (2011) 'Media Companies must become trusted Data Hubs' Europian journalist Center http://ejc.net/magazine/article/media-companies-must-become-trusted-data-hubs#.Vzm4UNR95ko
- Rogers, Simon (2010) 'Florence Nightingale, datajournalist: information has always been beautiful.' Friday 13 August 2010 http://www.theguardian.com/news/datablog/2010/aug/13/florence-nightingale-graphics
- Rogers, Simon (2011): Wikileaks data journalism: how we handled the data. http://www.guardian.co.uk/news/datablog/2011/jan/31/wikileaks-data-journalism
* این نوشتار بخشی از مقالهای است با عنوان «روزنامهنگاری دادهمحور از اسناد ویکیلیکس تا پاناما» که پیش از این در همایش دانشجویی دانشکده علوم ارتباطات علامه طباطبایی ارائه شده است.
[1] Data-driven journalism
[2] Rich Gordon
[3] Computer-assisted reporter
[4] News applications developer
[5] یکی دیگر از خدمات روی وب گوگل تلفیق اطلاعات است که میتواند در کار مدیریت دادهها بکار آید. میتوان از طریق این سرویس اطلاعات را جمعآوری، مصورسازی کرد و به اشتراک گذاشت. آلون هالی و ربکا شیپلی در سال 2009 این وبسایت را راه انداختند. همچنین از طریق این وبسایت میتوان نمودارهای دایرهای، میلهای و همچنین نقشههای اطلاعرسان نیز طراحی کرد.