مرکز کنترل و پیشگیری از بیماریها (United States Centers for Disease Control and Prevention) هزینهی چند صد میلیون دلاری کرد که در مورد گسترش آنفلوانزا اطلاعات به دست بیاره. کارشون هم این بود که از تکتک دکترها خواسته بودن که آمار بیماران آنفلوانزا رو براشون بفرستن. همون زمان یک گروه با استفاده از دادههای توییتر خیلی راحت، بدون دردسر و با هزینهی کم تونستن در مورد گسترش آنفوانزا و وضعیتاش در اون لحظه اطلاعات به نسبت دقیق و به مراتب بهروزتری کسب بکنن.
اما موضوع به این سادگی هم نیست. به محض این که خبر این استفادهی خارقالعاده از توییتر به روزنامهها رسید، کاربران توییتر در موردش توییت کردن. چنان توییتها در مورد آنفلوانزا زیاد شد که توییتر رو تحت تاثیر قرار داد و دیگه امکانش نبود با استفاده از توییتر در مورد آنفلوانزا اطلاعات قابل اعتمادی کسب کرد!
متن بالا از گفتههای «کاوان کپس» از ادارهی آمار و سرشماری بود. سخنران میگفت درسته که ممکنه دادههای شبکههای اجتماعی با هزینهی کمتر و تلاش کمتر بتونن نتیجههای بهروزتر و دقیقتری تولید کنن، اما همچنان مشکل پابرجاست که این دادهها خیلی هم قابل اعتماد نیستن و میتونن به همون راحتی که اومدهان، به همون راحتی هم برن.
اگه درست متوجه شده باشم اشکالی که در اینجا به این روش جمع آوری اطلاعات وارد شده تخمین بیش از حد(overestimation)موارد انفلوانزا است که بدلیل اطلاع کاربران توییتر از این نوع جمع آوری اطلاعات رخ داده.
به نظر من این مساله مشکل اصلی مطالعه نیست و این عامل مخدوش کننده رو میشه با عدم اطلاع رسانی به افراد مورد مطالعه برطرف کرد. وفقط در پایان مطالعه نتایج رو اعلام کرد==> مطالعه یک سو کور (single blind)
اما یه اشکال ذاتی که در این نوع جمع آوری داده از ابتدا وجود داره اینه که لزوما” تمام افرادی که انفلوانزا گرفته اند نمیان در بارش توییت کنن (مثلا” اهل توییت کردن نیستند / عدم دسترسی به اینترنت/ افراد پیر یا اطفال / ناتوانان جسمی یا ذهنی) یا اگر هم توییت میکنن ممکنه در مورد انفلوانزاشون صحبت نکنن .
که این مساله باعث کم تخمین زده شدن(underestimation) میزان واقعی انفلوانزا میشه که یه اشکال غیر قابل رفع برای اینطور جمع آوری داده است.
تصور من اینه اشکال موضوع نه overestimation و نه underestimation هستش، بلکه اعتماد به داده ها و مهمتر از اون حجم زیادی از داده های غیرقابل استفاده و غیرکاربردی هستش که حول موضوع تولید میشه و از طریق شبکه های اجتماعی بدست میاد
رضا و حسین: ما که کامنتهای شما رو خوندیم و استفاده کردیم!