معنادار کردن آمار برای مردم

درس‌نامه آنلاین روزنامه‌نگاری علمی- درس نهم/1

معنادار کردن آمار برای مردم

اشاره: درس‌نامه آنلاین روزنامه‌نگاری علمی از سوی فدراسیون جهانی روزنامه‌نگاران علمی (WFSJ)  و با همکاری شبکه علوم و توسعه (SciDev.Net) طراحی شده است. پیش از این هفت درس از این مجموعه با عناوین زیر از نظرتان گذشت:

1-      طراحی و ساختاربندی روزنامه نگاری علمی

2-      سوژه یابی و داوری در باره اعتبار منابع  اطلاعاتی

3-      آمادگی های پیش ،آغاز و انجام مصاحبه

4-      مهارت های نگارش

5-      چیستی علم و روش  روزنامه نگارانه در دنیای علم

6-      گزارشگری در مورد مناقشات علمی

7-      گزارشگری سیاست های علمی

8-      تصویر برداری از علم

در نهمین درس از این مجموعه با عنوان 'درک آمار' چگونگی درک و دریافت روزنامه نگاران از ، آمار و ارقام و نیز نحوه معنا دار کردن آمار و ارقام برای عموم مردم  مورد بحث و برسی قرا ر  گرفته است . در ادامه  بخش اول  این درسنامه با عنوان معنا دارکردن آمار برای مردم  از نظرتان می گذرد.

***

  

9.1: مقدمه

آیا ضرورتی دارد که یک روزنامه نگار علمی چیزی درباره آمار بداند؟ اگر شما دوست آمار دانی دارید که می توانید هر ساعتی از شبانه رو به او زنگ بزنید، لازم نیست چیزی از آمار بدانید . اما در غیر این صورت لازم است که حداقل مبانی اولیه‌ای درباره درصدها، میانگین ها، انحراف[1] ها و معناداری آماری[2] بدانید. شاید لازم نباشد این آگاهی شما جزیی و عمل گرایانه باشد - به هر حال کسی از یک روزنامه نگار انتظار ندارد آزمون خی- دو[3] را روی داده هایش اعمال کند - اما همیشه اطلاعاتی پایه‌ای و عمومی در این مورد لازم و کارآمد است.

این فصل سعی می کند به شما اصول اولیه اعداد و آمارها را بیاموزد. اما این درس را نباید با آمار مقدماتی اشتباه بگیرید. موضوع مورد نظر این بحث به قدری گسترده است که در یک فصل نمی گنجد. برخی از مدخل های آماری در ویکی پدیای انگلیسی توضیحات مقدماتی شفافی را ارایه داده اند و می توانید به کتاب های پایه آمار مقدماتی مراجعه کنید تا اطلاع دقیق تری در این زمینه ها به دست آورید. در این فصل بیشتر شما درباره مسایلی اطلاع کسب می کنید که ممکن است منجر به اشتباه شود و اغلب اوقات در گزارش های علمی اشتباه مورد اشاره قرار می گیرد - هم از سوی دانشمندان و هم از سوی روزنامه نگارها.

زمانی که این فصل را مطالعه کنید، درک بهتری از ادعاهای متفاوتی که در زمینه علم و مبتنی بر اعداد مطرح می شود، پیدا خواهید کرد و قادر خواهید بود سوال های سخت تری را مطرح کنید. حداقل دیگر در برابر اعدادی که در راه تهیه گزارشتان مطرح می شود خلع سلاح نیستید و البته اغلب اوقات با این اعداد سرو کار خواهید داشت.

 

9.2: اعداد

اندازه و ابعاد یک کرم غبار[4] چقدر است؟ چه تعداد سلول خونی در یک رگ انسان وجود دارد؟ مساحت یک زمین مسابقه فوتبال چقدر است؟ فاصله ماه با ما چقدر است؟

اعداد را در چشم انداز قرار دهید. این تنها راهی است که به کمک آن می‌توانید آنها را در اختیار بگیرید، ابعاد و اهمیت چیزهای مختلف را درک کنید و به آنها معنی بدهید. اعداد موجوداتی مجرد هستند  و به همین دلیل کار کردن با آنها ساده است، اما برای اینکه اعداد رابرای مخاطبانتان معنی دار کنید باید آنها را از این حالت خارج کنید. به قول کلیشه ای رایج در این باره به آنها بعد انسانی بدهید.

درک اینکه  اندازه باغی به مساحت 0/735 هکتار چقدر است برای همه مشکل است اما اگر به جای آن بگویید باغی به اندازه یک زمین فوتبال، هر کسی می تواند آن را در ذهن خود مجسم کند. طول یک کرم غبار در حدود 0/125 میلی متر است بنابر این در سطحی به مساحت یک میلی متر مربع (کوچکتر از نقطه ای که در انتهای این جمله می آید) می توانیم 8 در 8 و یا 64 کرم غبار را جای دهیم. همیشه در هر داستانی مناسب است که این اعداد را با مثال های خوب و مقایسه های خوب به زبان آدمیزاد بدل کنیم. اما این کار در عین حال به این دلیل هم مهم است که بتواینم ابعاد آنها را درک کنیم. تنها به این روش است که متوجه می شوید آیا مثلا هزار برابر چیزی واقعا خیلی بزرگ یا خیلی کوچک است.

اعداد را بررسی کنید.

یک هزار برابر معمولا مقدار زیادی است. ما به راحتی برای مدت یک میلیون ثانیه زندگی می کنیم (این مدت اندکی کمتر از 12 روز است)  اما هزار برابر آن و یک میلیارد ثانیه معادل با 32 سال و 1000 برابر آن معادل با 32 هزار سال است  - به یاد داشته باشید که 32 هزار سال پیش زمانی بود آخرین نئاندرتال ها از بین رفتند. همچنین به تفاوت نام های اعداد دقت کنید. واژه تریلیون در فرهنگ آنگلو ساکسون ها (1 به همراه 12 صفر در مقابل آن) معادل بیلیون اروپایی است و (میلیارد) آنگلو ساکسون ها (9 صفر در مقابل یک)، در اروپا به شکل هزار میلیون گفته می شود.

به یاد داشته باشید که اغلب اعداد بزرگ شاید بر اساس تخمین های مکانی و یا موقعیتی ساخته شده باشند مثلا تعداد شرکت کننده ها در یک راهپیمایی سیاسی، یا تعداد دخترانی که هر سال ربوده می شوند و یا تعداد بیننده های  تلویزیونی مسابقات المپیک. یک سوال خوب در این موارد آن است که این اعداد از کجا آمده اند و از کجا آنها این تعداد را می دانند؟ آیا اصولا دانستن آن امکان پذیر است؟ و آیا این اعداد در این چهارچوب خاص زیاد یا ناچیز به شمار می روند؟

 

9.3: درصدها

درصدها به نسبت مساله ساده ای به شمار می روند. یک درصد به معنی یک صدم یک مقدار مشخص است. بدین ترتیب مثلا 8 درصد 80 کیلوگرم یعنی 4/6 کیلوگرم و اگر ما تعداد گاو های یک گاوداری را از 50 راس به 70 راس افزایش دهیم یعنی شاهد افزاایشی 40 درصدی بوده ایم.

اولین چیزی که باید در این باره بدانید این است که همه افراد نمی دانند معنی 40 درصد دقیقا یعنی چه. یک مطالعه نشان داده است در آلمان که این مساله تنها برای اندکی بیش از نصف جمعیت (در حدود 54 درصد مردم) قابل درک فوری است. چیزی که برای ما ساده به شمار می رود الزاما برای مخاطب ما ساده نیست.

البته درصدها هم به ندرت این قدر ساده هستند. ما صورت کسر را بر مخرج کسر تقسیم می کنیم و نتیجه را در قالب یک عدد بیان می کنیم و در این بین ممکن است یک جایی برخی از اطلاعات گم شوند. یک دانشمند به ما می گوید که داروهای ضد افسردگی منجر به بروز مسایل طبیعی در ماهیت رفتار جنسی در 40 درصد موارد شده است. اما این مشخص نمی کند که آیا یک مصرف کننده 40 درصد مشکل بیشتر داشته است یا 40 درصد مصرف کننده ها مشکلاتی را تجربه کرده اند؟

چهارچوب

همانند اعداد، در مواجهه با درصدها نیز نخستین گام باید قرار دادن آنها در چهارچوبی منظقی و قابل درک باشد 8 درصد افزایش می تواند معانی زیادی داشته باشد (برای مثال در مورد وزن شما) یا ممکن است تنها یک نوسان کوچک و قابل چشمپوشی باشد (مثلا در مورد میزان کلسترول یا فشار خون). حتی 40 درصد کاهش خطر مثلا حمله قبلی می تواند زمانی که خطر اولیه فوق العاده پایین بوده است به طور کامل بی معنی باشد. شاید به نظر چنین عددی تاثیرگذار باشد اما این به معنی جالب بودن - یا از نظر کلینیکی مرتبط بودن آن نیست. هرچقدر  بازه نوسان و تغییرات طبیعی بیشتر باشد تغییرات اندک درصد بی معنی تر است

نقطه درصد

گاهی اوقات دو مفهوم درصد و نقطه درصد  (Percent Point-pp) عمدا یا سهوا با هم اشتباه گرفته می شود. اگر سال گذشته نرخ بیکاری 4.8درصد و امسال 6 درصد بوده باشد آیا افزایش نرخ بیکاری معادل است با (6.0 - 4.8) / 4.8 = 0.25 یا به طور ساده تر 25 درصد است؟ یا اینکه این مقدار برابر است با  4.8-6.0 = 1.2 درصد؟ ما می توانیم از هر دو استفاده کنیم اما برای اینکه از اشتباه و گیج کردن دیگران پرهیز کنیم اقتصاد دان ها از مورد دوم با  اصطلاح نقطه درصد نام می برند. در این مورد خاص دولت ترجیح می دهد از مفهوم نقطه درصد به جای درصد استفاده کنید و مخالفان سعی می کنند از درصد به جای نقطه درصد استفاده کنند. قانونی در این باره وجود ندارد - غیر از اینکه داده های اولیه را درخواست و آنها را بررسی کنید. ممکن است دولتها برای آنکه عملکرد متفاوتی را نشان بدهند یا وضعیت را بهتر از آنچه واقعا هست توصیف کنند. آنها حتی تعریف بیکاری و تورم را تغییر دهند و در این موارد نیز ممکن است از این دو مفهوم به جای هم استفاده کنند. گاهی سوال های تند و تیزی باید پرسید تا بتوان به اعداد پشت پرده یک آمار دسترسی پیدا کرد.

 

* نقطه درصد یا pp  تفاضل دو درصد را نشان می دهد. در مثال بالا تفاوت 6 درصد بیکاری و 8/4 درصد بیکاری به معنی افزایش 2/1 درصدی نقطه درصد است اما زمانی که می گوییم درصد بیکاری 25 درصد افزایش یافته است به این معنی است که مقدار بیکاری به اندازه 25 درصد مقداری که در سال قبل بوده است بیشتر شده است.  

 

9.4: میانگین ها

 

پسربچه ای 4 سکه دارد، پسر دومی 5 سکه دارد و سومی 9 سکه. هر یک از آنها به طور میانگین (4 + 5 + 9) / 3 = 6 سکه دارند. اگر درآمد کودک سوم دوبرابر شود میانگین درآمد آنها (4 + 5 + 18) / 3 = 9 سکه می شود و این در شرایطی است که دو نفر دیگر چیزی بیشتر از قبل در آمد نداشته اند.

بعضی از مردم از واژه های متعدد و متفاوتی برای میانگین استفاده می کنند و مثلا ممکن است از مفهوم متوسط برای بیان این مفهوم  استفاده کنند. همانند مفهوم درصد، میانگین مفهوم ساده ای است و همانند درصد این سادگی می تواند گمراه کننده باشد. اگر 19 کارگر 100 سکه و رییس آنها 2100 سکه دریافت کندمجموع  این افراد با هم (کارگران بعلاوه رئیس) به طور متوسط200 سکه دریافت می کنند اما این آن زاویه ای نیست که اتحادیه کارگری به موضوع نگاه می کند.

 

 

میانه

در مثال مربوط به پسرها، میانگین سکه های آنها 6 عدد بود اما همه آنها 6 سکه نداشتند. اگر اغلب خانواده ها یا فرزندی نداشتند و یا دو فرزند می داشتند ما تعداد زیادی خانه متناسب با یک خانواده متوسط نمی داشتیم. تقریبا همه مردمی که روی زمین زندگی می کنند دارای تعداد پاهایی بیش از تعداد متوسط پای یک انسان هستند. دو تا از آن پسرها کمتر از میانگین دارایی دارند. ما با فکر کردن به میانگین گاهی می خواهیم به ارزش میانی فکر کنیم اما این همیشه درست نیست. برخی از توزیع ها بسیار نا متوازن است - مانند سطح درآمدی در بسیاری از کشورها - و در این موارد مفهوم میانگین اغلب بی معنی است. در اینجا آمار دانها ترجیح می دهند از مفهوم میانه - که ارزش میانی است که نیمی از جمعیت مثلا دارایی کمتر از آن و نیمی دیگر دارایی بالاتر از آن دارند - استفاده کنند برای مثال پسرها میانه 5 است چه قبل و چه بعد از آنکه پسر سوم شانس بیشتری نصیبش شود بنابراین مفهوم میانه کمتر تحت تاثیر ارزش های کرانه ای قرار دارد. در شرکتی که مثال زدیم میانه درآمد 100 سکه است.

میانگین می تواند خیلی غلط انداز باشد و احتمال زیادی دارد که روزنامه نگاران سهل انگار و یا بی توجه را فریب دهد. آتش نشان ها به این موضوع اعتراض دارند که میانگین  درآمد آنها به طور چشمگیری در سال گذشته کاهش پیدا کرده است و در خواست جبران آن را دارند اما در این بین یک نفر می تواند تحقیق کند که این ماجرا از آنجایی نشات گرفته است که در سال گذشته تعداد زیادی آتش‌نشان جدید استخدام شده اند و آنها چون در ابتدای استخدامشان حداقل حقوق را داشته اند این امر باعث شده است تا میانگین حقوق پایین بیاید.

دربسیاری از کشورهای غربی، میانگین سنی که مادران نخستین فرزند خود را به دنیا می آورند بالا رفته است و این مساله در تیتر های خبری خود را به شکل : «تعداد بیشتر مادران سالخورده تر» ، خود را نشان می دهد.  اما آیا علت بالا رفتن میانگین سن، تولد نخستین نوزادان است که آنها در سن بالاتری نخستین بچه را به دنیا می آورند و یا اینکه آمار بچه دار شدن نوجوانان کاهش پیدا کرده است؟ یا ترکیبی از هر دو مورد رخ داده است؟ دانشمندان برای بیان این تغییر کدام یک از سال ها را با هم مقایسه می کنند و چرا دقیقا این دو سال را انتخاب می کنند؟ میانگین ها معمولا تغییرات طبیعی  را زیر سایه خود قرار می دهند. بعضی وقت های این اتفاق خوبی است اما گاهی اوقات با این کار اطلاعات زیادی دور ریخته می شود - تغییرات موجود در نمونه ها و پراکندگی آنها  بسیار بیش از میانه یا میانگین می توانند جالب توجه باشند. البته دانشمندان راهی ابداع کردند که به این محدودیتها غلبه کنند: آنها از انحراف و یا پراکندگی مختص این تغییرات استفاده می کنند که عدد دیگری است.

 

9.5:  پراکندگی

پسرهای مثال قبل، 4، 5 و 9 سکه داشتند که میانگین آن نفری 6 سکه می شد. حال در نظر بگیرید 3 دختر به ترتیب  5،6 و 7 سکه داشته باشند. در این مورد میانگین دارایی آنها نیز همان 6 سکه است. اما پراکندگی توزیع سکه ها در بین پسرها بیشتر از دختر ها است - تفاوت بیشتری در دارایی سکه های پسرها نسبت به دخترها وجود دارد.

آمار دان ها برای برای توصیف این ویژگی توزیع ها از عبارتی به نام انحراف معیار استفاده می کنند. در اکثر مقاله های علمی جدول هایی از داده ها وجود دارند که مثلا بیان می کنند داده ای مانند سن با میانگین 65 سال و انحراف معیار 5 (SD) سال بوده است. نکته مهم برای روزنامه نگارها این است که بدانند در  بخش عمده ای از داده ها در  بازه ای به طول 4 برابر انحراف معیار قرار می گیرند.  یعنی در این مثالی که زدیم  4x 5 = 20  سال. بنابراین اغلب بیمارها در این بررسی سنی میان 55 تا 75 سال داشته اند. این موضوع حتی در زمانی که توزیع، نامتقارن نیز باشد مصداق دارد.

 

برای مثال، میانه 15 نخ سیگار در روز با انحراف معیار 25 سیگار در روز. نکته بسیار مهمی که در این باره باید در نظر داشته باشید این است که بررسی این مساله ممکن است به شما نشان دهد گروهی که در حال بررسی آن هستید متعادل نیست. (به یاد داشته باشید این اعداد برای توزیع نرمال به دست آمده اند)

با انحراف معیار 4 تایی می توانید درباره 95 درصد جمعیت (دارای توزیع نرمال) اظهار نظر کنید. (به این معنی که اگر انحراف معیار را در 4 ضرب کنید و در دو طرف میانه پخش کنید، این بازه 95 درصد نمونه های شما را در خود می گیرد) اگر بخواهید درباره وضعیت 99 درصد جمعیت اطلاعاتی به دست آورید باید از 6 برابر انحراف معیار استفاده کنید ( 99 درصد نمونه های شما در فاصله میانه منهای سه برابر انحراف معیار تا میانه + سه برابر انحراف معیار قرار دارد) و اگر تنها بر دو سوم نمونه های اطراف میانه تمرکز داشته باشید این ضریب به دو می رسد ( یعنی دو سوم نمونه ها در فاصله میانه منهای انحراف معیار تا میانه + انحراف معیار قرار دارند)

برخی اوقات به جای انحراف معیار از پارامتر دیگری به نام واریانس استفاده می شود: واریانس مربع انحراف معیار است.

طبیعی است که در استفاده از انحراف معیار و تقریب ها مورد نظر مشکلاتی وجود دارد اما اگر با دقت از آنها استفاده کنید به ابزارهای قدرتمندی بدل می شوند. اگر درصد تغییرات را بر انحراف معیار تقسیم کنید برداشت قابل قبول اولیه ای از معنی نتایج به دست می آورید.

برای مثال ضریب هوشی در یک کشور 100 با انحراف معیار 15 است. سال بعد این عدد به 105 می رسد. این یعنی  5 درصد افزایش برای رسیدن به عدد 105 از 100. حال این تفاوت درصد را بر انحراف معیار تقسیم می کنیم به عدد 5/15 = 0.33 برابر انحراف معیار می رسیم. این عدد را z-score  می نامند. در این مثال عدد z  0.33  شده است و این نتیجه چندان بدی نیست. - در علوم انسانی معمولا اگر z-score  0.2 باشد نتیجه را دارای  تاثیر ضعیف ارزیابی می کنند. 0.5 معمولی و متوسط و 0.8 تاثیری قوی است.  کودکان در هر سال حدود 6 سانتی متر قدشان افزایش می یابد که یک برابر انحراف معیار است و در نتیجه اثری قوی و مشهود به شمار می رود.

 

9.6: نرخ ها

دانشمندان به نرخ ها و نسبت ها علاقه مندند. خطرات مرتبط، نسبت خطر نسبت شانس، نرخ استاندارد شده مرگ و میر... خبرنگار بیچاره با این نام ها باید چه کند؟ بار دیگر همانند مواردی که درباره میانگین و درصد ها دیدیم سرتان را بالا بگیرید و داده هایی که تحقیق بر مبنای آن بنا شده است را درخواست د و سعی کنید آنها را در چشم انداز قرار دهید.

خطر نسبی (Relative Risk)

بیایید با یک مثال از جهان واقعی شروع کنیم. استفاده از استاتین ها (گروهی از داروهای کاهنده فشار خون)  باعث می شود خطر ابتلا به حمله قلبی در طول 4 سال بعدی تا 50 درصد کاهش پیدا کند - خطر نسبی حمله قلبی در مقابل دارونماها 0.5  است. از میان افرادی که به آنها دارو نما داده شده بود برای مدت 4 سال حدود 3 درصد آنها دچار حمله قلبی شدند اما در گروهی که استاتین دریافت کردند این آمار به 1.5  در صد کاهش یافت . به عبارت دیگر از بین هزار نفری که دارو نما گرفته بودند 30 نفر دچار حمله قلبی شدند و از بین آنهایی که داروی اصلی را دریافت کرده بودند 15 نفر. بدین ترتیب برای اینکه جلوی سکته آن 15 نفر گرفته شود باید به هزار نفر استاتین داده می شد - عدد درمان لازم برای اینکه شخصی در طی 4 سال دچار سکته نشود1000/15 = 67 است. بهترین راه برای بیان این مساله این است که اگر شما 67 نفری را که تحت این درمان قرار گرفته اند انتخاب کنید و از بین آنها تنها یک نفر در اثر این دارو خطر ابتلا به سکته را پشت سر گذاشته است و بقیه 66 نفر تنها اثرات جنبی دارو را تجربه می کنند و تفاوتی از نظر خطر ابتلا به حمله قلب را تجربه نخواهند کرد.

نسبت خطر (Hazard ratio)

نسبت های خطر از نظر مفهوم و هدف معادل خطر نسبی هستند (اگر خطرها چندان بزرگ نباشند و مثلا در حدود 10 درصد باشند) به طور معمول خطرها با توجه به همه متغیر ها اصلاح می شوند بنابراین محققان مثلا زنان را با مردان مقایسه نمی کنند یا زنان بالای 50 سال را با زنان زیر 20 سال مقایسه نمی کنند یا مثلا سیگاری ها را با غیر سیگاری ها مقایسه نمی کنند. اما به طور خاص، شرایط اقتصادی - اجتماعی برای اصلاح و جبران کردن دشوار هستند و این چیزی است که موقعی که درون یک مقاله را بررسی می کنید باید به آن نگاه کنید. ممکن است یک مقاله از نظر آماری کاملا منطقی و درست به نظر آید اما اگر این مقاله به نوعی جانبدارانه طراحی شده باشد تفسیر آن بسیار مشکل خواهد بود.

برخی از اوقات پیدا کردن داده های اصلی نیاز به تحقیق وسیعی دارد به خصوص زمانی که سودها و خطرها ی مواد غذایی - نظیر قهوه، چای، لبنیات، گوشت قرمز - و حتی مواردی مانند  تماشای تلوزیون و فعالیت های بدنی با  خطر نسبی قابل توجهی همراه باشد و بعد از محسابات متعدد مشخص شود که کاهش خطر مطلق و واقعی در این موارد ( با جود خطر نسبی بالا) بسیار پایین و ناچیز است.

  

نسبت شانس یا ترجیح Odds ratio

یکی از تله ها و دام هایی که پیش پای روزنامه نگاران وجود دارد و لازم است اینجا درباره آن صحبت شود نسبت شانس است. نسبت شانس را معمولا به عنوان خطرهای نسبی تفسیر می کنند اما این خطرناک است (مگر اینکه خطرها خیلی بزرگ نباشند و مثلا در حد 10 درصد باشند) برای هر 100 کودکی که در یک کشور به دنیا می آیند، 52 مورد پسر هستند. نسبت جنسیتی (شانس اینکه فرزند شما پسر باشد در برابر اینکه فرزندتان دختر باشد) برابر است با 52/48 = 1.08. در کشور دیگری این نسبت 51 به 49 است و بنابراین این نسبت به 1.04 می رسد. حال نسبت شانس میان این دو 1.08/1.04 = 1.04 است. پس آیا می توانیم بگوییم در این شرایط تولد پسرها 4 درصد بیشتر است؟ نه: خطر نسبی در اینجا تنها 2 درصد است : (52/100)/(51/100) = 1.02 شانس بله ها را در مقابل خیر می شمارد و در نظر می گیرد اما خطر  درباره گزینه های  بله یا مثبت  در برابر همه امکانات (اعم از مثبت و منفی) صحبت می کند. دانشمندان از نسبت شانس آزادانه در تحقیقات و صحبت هایشان استفاده می کنند اما این نسبتی نیست که در رسانه ها و یا از سوی رسانه ها مورد استفاده قرار گیرد.

مثال دیگری را در نظر  بگیرید:  ژن موثری در آسم کشف شده است. بر اساس خبرها: «کودکان که این ژن را دارند 51 درصد خطر بیشتری برای ابتلا به آسم در مقایسه با کسانی دارند که این ژن را ندراند». با خواندن مقاله پژوهشی اصلی مشخص می شود، 62 درصد همه کودکانی که این ژن را دارند مبتلا به آسم هستند و کسانی که این ژن را ندارند 52 درصد ابتلا به آسم به چشم می خورد. نسبت شانس در این مورد (62/38)/(52/48) = 1.51 است اما تفاوت مطلق میان دو گروه تنها 10 نقطه درصد (PP)  است. این ژن موضوع جالبی است اما پاسخ قطعی برای جلوگیری از آسم کودکان نیست. اغلب مردم به ژن ها به چشم مساله صفر و یک یا مرتبط و غیر مرتبط نگاه می کنند به همین دلیل این موارد جایی است که دانشمندان و رو زنامه نگاران باید نهایت دقت را انجام دهند.

البته نباید گفت کوچک بودن خطرهای قطعی در این موارد همیشه به معنی نادیده گرفتن آنها است. در سال 1995 مشخص شد که قرص های پیش گیری از بارداری نسل سوم دو برابر بیش از قرص های نسل دوم باعث ایجاد ترومبوسی یا ایجاد لخته خون در رگ ها می شود تفاوت بسیار اندک بود 6/10,000 در برابر 3/10,000  و اصولا ایجاد لخته خونی در رگها هم پدیده نادری است. اما از آنجایی که برخی از زنان از این قرص ها استفاده می کنند کماکان می توان آن را عاملی موثر در نظر گرفت.

مانند همیشه اعداد و آمار مهم هستند اما درک واقعی از یک تحقیق از آنها مهم تر است و مانند همیشه سعی کنید مردم واقعی را در ذهن داشته باشید و اینکه آنها با چه خطرهایی روبرو هستند.

 

9.7 شانس

اگر فقط قرار باشد یک چیز مردم عادی را با آمار دان ها متمایز کند، آن شانس است. آمار دان ها می دانند که شانس، عامل تصادفی و رندم نقش بسیار بزرگی در زندگی همه ما و در همه روند ها و رویدادهایی که می توان به آن فکر کرد بازی می کند. اگر کسی یک مسابقه بخت آزمایی را دو بار پشت سر هم ببرد این اتفاق می تواند به سرخط خبرها بدل شود -  اما آمار دان ها می دانند با توجه به تعدد همه لاتاری هایی که در جهان در حال رخ دادن است این اتفاق در نهایت در جایی و در مکانی رخ خواهد داد. ما افرادی را ملاقات می کنیم که زمانی در خواب آنها را دیده بودیم و رویای ملاقات با آنها را داشتیم به نظرمان شگفتی غریبی می آید و اینکه چه دنیای کوچکی است. اما آمار دان ها به شما می گویند ما هر شب خواب بسیاری از افراد را می بینیم و اگر این اتفاق برای شما بیفتد چندان هم تصادف غیر مترقبه و عجیبی نیست.

از آن گذشته مردم همیشه علاقه دارند دنبال الگو هایی بگردند. حتی اگر چنین الگوهایی وجود نداشته باشند. این روش عجیب و غیر عادی عملکرد مغز ما است - ما در ماه صورت و یا  در پشت بوته ها ببری پنهان، را می بینیم و هرچیز که سه بار پشت سر هم رخ بدهد را رویدادی چشمگیر ارزیابی می کنیم. به خصوص این اتفاق زمانی تشدید می شود که بتوانیم یک ارتباط مستقیم ظاهری را تشخیص دهیم: اگر تعداد بروز سرطان خون در نزدیکی یک نیروگاه تولید برق بالا باشد سرخط ها ممکن است تبدیل به این شوند که «نیروگاه باعث افزایش سرطان خون شده است». حتی اگر با یک سکه سالم و کامل و بی نقص شیر و خط بیاندازید احتمال اینکه 7 بار پشت سر هم شیر یا خط بیاید بعید نیست. - اما آیا می توانید طبیعی بودن این را برای مخاطب خود اثبات کنید؟  یک تیم فوتبال یک تمرین دهنده جدید استخدام می کند و بلافاصله پس از آن سه بازی را پشت سر هم می برند. چه کسی باید اعتبار این پیروزی ها را صاحب شود، تمرین دهنده جدید یا شانس؟

شاید کسی بگوید علم، تلاشی برای جدا کردن رخ دادهای واقعی با رخ دادهای تصادفی و شانسی و متمایز کردن ارتباطات شانسی از ارتباطات واقعی است. و در این مورد تمرین دهنده برای اینکه موفق باشد باید کاری بهتر از اتکا به شانس انجام دهد. به طور عمومی منصفانه است بگوییم هر جمله و گفته و یا گزاره ساده دلانه ای در باره شانس و تصادف اشتباه است. نه تنها مردم عادی قدرت شانس را کمتر از واقعیت در نظر می گیرند که هیچ روش ذاتی برای مقابله و کنار آمدن با آن ندارند.

همین داستان درباره خطر ها هم وجود دارد. مردم دوست دارند خطرهایی که با آنها آشنا هستند و می توانند کنترلی بر آنها داشته باشند  را دست کم بگیرند. (مثل رانندگی ماشین). اما آنها میزان و جایگاه خطرهایی که با آن ها نا آشنا هستند و کنترلی برآنها ندراند را بیش از اندازه بزرگنمایی می کنند و به آن واکنش نشان می دهند ( مثلا خطرات زیست محیطی) همانند مورد درصد ها و میانگین ها بهترین کار این است که این خطرها را به زبانی ترجمه کنید که برای مردم آشنا  و قابل فهم باشد. به جای اینکه شانس این اتفاق یک در 50 است  یا به جای اینکه بگویید امکان یک اتفاقی  یک در ده هزار است می توایند آن را با میزان خطر آسیب دیدن در یک سانحه رانندگی یا صاعقه زدگی مقایسه کنید.

 


[1] deviations

[2] significance tests

[3] chi-square test

[4] dust mite