كيف يعطي التغريد العلماء نافذة في سعادة الإنسان وصحته

منذ إطلاقها العام 10 منذ سنوات ، تم استخدام Twitter كمنصة للشبكات الاجتماعية بين الأصدقاء ، وهي خدمة مراسلة فورية لمستخدمي الهواتف الذكية وأداة ترويجية للشركات والسياسيين.

ولكنه كان أيضًا مصدرًا قيّمًا للبيانات للباحثين والعلماء - مثلي - الذين يرغبون في دراسة كيف يشعر البشر ويعملون ضمن الأنظمة الاجتماعية المعقدة.

من خلال تحليل التغريدات ، تمكنا من مراقبة وجمع البيانات حول التفاعلات الاجتماعية لملايين الأشخاص "في البرية" ، خارج التجارب المعملية المسيطرة.

مكننا ذلك من تطوير أدوات لمراقبة مشاعر جماعية من عدد كبير من السكان، والعثور على أسعد الأماكن في الولايات المتحدة وأكثر بكثير.

إذن ، كيف أصبح موقع تويتر ، على وجه الدقة ، مصدراً فريداً لعلماء الاجتماع الحساسين؟ وما الذي سمح لنا باكتشافه؟


رسم الاشتراك الداخلي


أكبر هدية على تويتر للباحثين

في شهر يوليو 15 و 2006 و Twittr (كما كان يُعرف آنذاك) علانية أطلقت كخدمة متنقلة تساعد مجموعات من الأصدقاء على ارتداد الأفكار العشوائية حولها مع الرسائل النصية القصيرة SMS. "أدت القدرة على إرسال مجموعة نصية مجانية من 140 إلى جعل العديد من المستخدمين الأوائل (بما فيهم أنا) يستخدمون النظام الأساسي.

مع مرور الوقت ، وعدد من المستخدمين انفجرت: من 20 مليون في 2009 إلى 200 مليون في 2012 و 310 مليون اليوم. فبدلاً من التواصل المباشر مع الأصدقاء ، يمكن للمستخدمين ببساطة أن يخبروا متابعهم كيف يشعرون ، أو يستجيبون للأخبار بشكل إيجابي أو سلبي ، أو يمزحون النكات.

بالنسبة للباحثين ، كانت أكبر هدايا تويتر هي توفير كميات كبيرة من البيانات المفتوحة. كانت تويتر واحدة من أوائل الشبكات الاجتماعية الرئيسية التي تقدم عينات البيانات من خلال ما يسمى واجهات برمجة التطبيقات (APIs) ، والتي تمكن الباحثين من الاستعلام عن تويتر لأنواع معينة من التغريدات (مثل التغريدات التي تحتوي على كلمات معينة) ، بالإضافة إلى معلومات حول المستخدمين .

هذا أدى إلى انفجار مشاريع البحوث استغلال هذه البيانات. واليوم ، ينتج بحث الباحث العلمي من Google عن "Twitter" ستة ملايين زيارة ، مقارنة بـ5 ملايين نتيجة لـ "Facebook". والفرق مثير للإعجاب بشكل خاص نظرًا لأن Facebook يمتلك تقريبًا خمسة أضعاف عدد المستخدمين مثل تويتر (وهي أقدم من عامين).

مما لا شك فيه أن سياسة البيانات السخية على تويتر أدت إلى بعض الدعاية المجانية الممتازة للشركة ، حيث حصلت الدراسات العلمية المثيرة للاهتمام على وسائل الإعلام الرئيسية.

دراسة السعادة والصحة

مع وجود بيانات التعداد التقليدية البطيئة والمكلفة ، فإن تغذية البيانات المفتوحة مثل تويتر لديها القدرة على توفير نافذة في الوقت الحقيقي لرؤية التغيرات في أعداد كبيرة من السكان.

جامعة فيرمونت مختبر الحوسبة القصصية تأسست في 2006 ودراسة المشاكل عبر الرياضيات التطبيقية وعلم الاجتماع والفيزياء. منذ 2008 ، جمعت Story Lab مليارات من التغريدات عبر خلاصة "Gardenhose" على Twitter ، وهي واجهة برمجة تطبيقات تقوم بتدفق عينة عشوائية من 10 في المئة من جميع التغريدات العامة في الوقت الفعلي.

قضيت ثلاث سنوات في مختبر الحوسبة الحسابية وحالفني الحظ لأن أكون جزءًا من العديد من الدراسات المثيرة للاهتمام باستخدام هذه البيانات. على سبيل المثال ، قمنا بتطوير hedonometer يقيس سعادة Twittersphere في الوقت الحقيقي. من خلال التركيز على التغريدات الجغرافية المرسلة من الهواتف الذكية ، تمكنا من ذلك رسم خريطة أسعد الأماكن في الولايات المتحدة. ربما ليس من المستغرب ، وجدنا هاواي لتكون أسعد ولاية نابليون وأسعد مدينة النبيذ أسعد ل2013. 

خريطة 13 مليون تغريدة مختارة من الولايات المتحدة من 2013 ، ملوّنة بالسعادة ، باللون الأحمر تشير إلى السعادة والأزرق مما يشير إلى الحزن. PLOS واحد ، قدم المؤلفخريطة 13 مليون تغريدة مختارة من الولايات المتحدة من 2013 ، ملوّنة بالسعادة ، باللون الأحمر تشير إلى السعادة والأزرق مما يشير إلى الحزن. بلوس ONEالمؤلف المقدمة.كانت لهذه الدراسات تطبيقات أعمق: ساعدنا ربط استخدام كلمة Twitter مع المعلومات السكانية في فهم الأنماط الاجتماعية الاقتصادية الكامنة في المدن. على سبيل المثال ، يمكننا ربط استخدام الكلمات بالعوامل الصحية مثل السمنة ، لذلك قمنا ببناء lexicocalorimeter لقياس "المحتوى من السعرات الحرارية" في وسائل الإعلام الاجتماعية. أدت التغريدات من منطقة معينة ذكرت أطعمة عالية السعرات الحرارية إلى زيادة "المحتوى الحراري" في تلك المنطقة ، بينما أدت التغريدات التي ذكرت أنشطة التمارين الرياضية إلى تقليل مقياسنا. وجدنا أن هذا الإجراء البسيط يرتبط مع مقاييس الصحة والرفاهية الأخرى. بعبارة أخرى ، كانت التغريدات قادرة على إعطائنا لمحة سريعة ، في وقت محدد ، عن الصحة العامة لمدينة أو منطقة.

باستخدام ثراء بيانات تويتر ، تمكنا أيضًا من ذلك انظر أنماط الحركة اليومية الناس بتفاصيل غير مسبوقة. فهم أنماط التنقل البشري ، بدوره ، لديه القدرة على تحويل نمذجة المرض ، وفتح المجال الجديد لل علم الأوبئة الرقمية.

بالنسبة لدراسات أخرى ، نظرنا في ما إذا كان المسافرون يعبرون عن سعادة أكبر على تويتر من أولئك الذين يبقون في المنزل (الإجابة: يفعلون) وما إذا كانوا يميل الأفراد السعداء إلى الالتصاق ببعضهم البعض في شبكة اجتماعية (مرة أخرى ، يفعلون). في الواقع، يبدو ايجابية مخبأة في اللغة نفسهابمعنى أن لدينا كلمات أكثر إيجابية من الكلمات السلبية. لم يكن هذا هو الحال فقط على تويتر ولكن عبر مجموعة متنوعة من الوسائط المختلفة (مثل الكتب والأفلام والصحف) واللغات.

هذه الدراسات - وآلاف آخرين مثلهم من جميع أنحاء العالم - كانت ممكنة فقط بفضل تويتر.

في السنوات المقبلة 10

إذن ما الذي نتوقع أن نتعلمه من Twitter خلال السنوات العشر القادمة من 10؟

يتضمن بعض أكثر الأعمال إثارة في الوقت الحالي ربط بيانات وسائل الإعلام الاجتماعية بنماذج رياضية للتنبؤ بظواهر على مستوى السكان مثل تفشي الأمراض. وقد حقق الباحثون بالفعل بعض النجاح في زيادة نماذج الأمراض باستخدام بيانات تويتر للتنبؤ بالأنفلونزا ، ولا سيما FluOutlook منصة وضعت من قبل جامعة نورث إيسترن ومعهد للتبادل العلمي.

ومع ذلك ، لا يزال هناك عدد من التحديات. وتعاني بيانات الشبكات الاجتماعية من "نسبة الإشارة إلى الضجيج" منخفضة جدًا. وبعبارة أخرى ، غالبًا ما يتم إغراق تغريدات ذات صلة بدراسة معينة بواسطة "ضجيج" غير ذي صلة.

لذلك ، يجب علينا باستمرار أن نكون مدركين لما تم تسميته "معجزة البيانات الكبيرة"عند تطوير أساليب جديدة وعدم المبالغة في الثقة بنتائجنا. وينبغي أن يكون الهدف من هذا الاتصال هو إنتاج تنبؤات "صندوق زجاجي" قابلة للتفسير من هذه البيانات (على عكس توقعات "الصندوق الأسود" ، التي تكون فيها الخوارزمية مخفية أو غير واضحة).

غالبًا ما تنتقد بيانات وسائل الإعلام الاجتماعية (إلى حد ما) لكونها صغيرة ، عينة غير تمثيلية من السكان على نطاق أوسع. أحد التحديات الرئيسية للباحثين هو معرفة كيفية حساب مثل هذه البيانات المنحرفة في النماذج الإحصائية. في حين المزيد من الناس يستخدمون وسائل التواصل الاجتماعي كل عام، يجب أن نستمر في محاولة فهم التحيزات في هذه البيانات. على سبيل المثال ، لا تزال البيانات تميل إلى الإفراط في تمثيل الأفراد الأصغر سنا على حساب السكان الأكبر سنا.

فقط بعد تطوير أساليب تصحيح التحيز بشكل أفضل ، سيتمكن الباحثون من إجراء تنبؤات كاملة الثقة من التغريدات.

نبذة عن الكاتب

لويس ميتشل ، محاضر في الرياضيات التطبيقية ، جامعة أديلايد

تم نشر هذه المقالة في الأصل المحادثة. إقرأ ال المقال الأصلي.

كُتبٌ ذاتُ صِلَةٍ

at سوق InnerSelf و Amazon