كيف تساعد أجهزة الكمبيوتر علماء الأحياء كسر أسرار الحياة

وبمجرد تسلسل الجينوم البشري الذي يبلغ طوله ثلاثة مليارات رسالة ، هرعنا إلى "OMICSعصر البحوث البيولوجية. يسارع العلماء الآن إلى تسلسل الجينومات (كل الجينات) أو البروتينات (جميع البروتينات) للكائنات الحية المختلفة - وفي هذه العملية يتم تجميع كميات هائلة من البيانات.

على سبيل المثال ، يمكن للعالم استخدام أدوات "omics" مثل تسلسل الحمض النووي للكشف عن أي الجينات البشرية تتأثر في عدوى فيروسية. ولكن بسبب وجود الجينوم البشري على الأقل في جينات 25,000 ، فإن عدد الجينات التي تم تعديلها حتى في ظل مثل هذا السيناريو البسيط من المحتمل أن يكون بالآلاف.

على الرغم من أن التسلسل وتحديد الجينات والبروتينات يمنحهما اسمًا ومكانًا ، إلا أنه لا يخبرنا بما يفعلان. نحن بحاجة لفهم كيفية هذه الجينات والبروتينات و كل الاشياء بينهما التفاعل في العمليات البيولوجية المختلفة.

اليوم ، حتى التجارب الأساسية تنتج بيانات كبيرة ، وأحد أكبر التحديات هو فصل النتائج ذات الصلة من الضوضاء في الخلفية. تساعدنا أجهزة الكمبيوتر في التغلب على جبل البيانات هذا ؛ ولكن يمكنهم حتى الذهاب خطوة أبعد من ذلك ، مما يساعدنا على التوصل إلى فرضيات علمية وشرح عمليات بيولوجية جديدة. علم البيانات ، في جوهره ، تمكن البحوث البيولوجية المتطورة.

أجهزة الكمبيوتر لإنقاذ

أجهزة الكمبيوتر مؤهلة بشكل فريد للتعامل مع مجموعات البيانات الضخمة لأنها يمكن أن تتبع في الوقت نفسه كل الشروط الهامة اللازمة للتحليل.


رسم الاشتراك الداخلي


على الرغم من أنهم يمكن أن تعكس الأخطاء البشرية فمع أنها مبرمجة ، يمكن لأجهزة الكمبيوتر التعامل مع كميات كبيرة من البيانات بكفاءة وليست متحيزة نحو المألوف ، كما قد يكون المحققون البشريون.

كما يمكن تعليم الكمبيوتر للبحث عن أنماط محددة في مجموعات البيانات التجريبية - وهو مفهوم يسمى التعلم الآلي ، الذي تم اقتراحه أولاً في 1950s ، وأبرزها رياضيات آلان تورينج. يمكن بعد ذلك أن يُطلب من الخوارزمية التي تعلمت الأنماط من مجموعات البيانات إجراء تنبؤات تستند إلى بيانات جديدة لم يتم مواجهتها من قبل.

أحدثت التعلّم الآلي ثورة في الأبحاث البيولوجية حيث أصبح بإمكاننا الآن استخدام مجموعات البيانات الضخمة ونطلب من أجهزة الكمبيوتر المساعدة في فهم علم الأحياء الأساسي.

تدريب أجهزة الكمبيوتر إلى التفكير عن طريق محاكاة عمليات الدماغ

لقد استخدمنا نوعًا واحدًا مثيرًا من التعلم الآلي ، يسمى الشبكة العصبية الاصطناعية (ANN) ، في مختبرنا الخاص. العقول عبارة عن شبكات مترابطة للغاية من الخلايا العصبية ، التي تتواصل عن طريق إرسال نبضات كهربائية عبر الأسلاك العصبية. وبالمثل ، يحاكي ANN في الكمبيوتر شبكة من الخلايا العصبية أثناء تشغيلها وإيقافها استجابة لإشارات الخلايا العصبية الأخرى.

من خلال تطبيق الخوارزميات التي تحاكي عمليات الخلايا العصبية الحقيقية ، يمكننا أن نجعل الشبكة تتعلم حل العديد من أنواع المشاكل. تستخدم Google ANN قوية لشهرتها الآن مشروع الحلم العميق حيث تستطيع أجهزة الكمبيوتر تصنيف وحتى إنشاء الصور.

مجموعتنا تدرس نظام المناعة ، بهدف اكتشاف علاجات جديدة للسرطان. لقد استخدمنا نماذج حسابية لـ ANN لدراسة رموز البروتين السطحي القصيرة التي تستخدمها الخلايا المناعية لتحديد ما إذا كان شيء ما غريبًا على جسمنا وبالتالي يجب مهاجمته. إذا فهمنا المزيد عن كيفية تمييز خلايا المناعة لدينا (مثل الخلايا التائية) بين الخلايا الطبيعية / الذاتية والخلايا غير الطبيعية / الأجنبية ، يمكننا تصميم لقاحات وعلاجات أفضل.

بحثنا عن كتالوجات متاحة للجمهور من آلاف رموز البروتين التي حددها الباحثون على مر السنين. قسمنا هذه البيانات الضخمة إلى قسمين: رموز البروتين الذاتي الطبيعي المشتقة من خلايا بشرية سليمة ، ورموز بروتينية غير طبيعية مشتقة من الفيروسات والأورام والبكتيريا. ثم تحولنا إلى شبكة عصبية اصطناعية تم تطويرها في مختبرنا.

بمجرد تغذية رموز البروتين إلى ANN ، كانت الخوارزمية قادرة على تحديد الاختلافات الأساسية بين رموز البروتين العادية وغير الطبيعية. سيكون من الصعب على الناس تتبع هذه الأنواع من الظواهر البيولوجية - هناك حرفياً آلاف رموز البروتين لتحليلها في مجموعة البيانات الكبيرة. إنها تتطلب آلة لتجادل هذه المشاكل المعقدة وتعريف البيولوجيا الجديدة.

التنبؤات عن طريق التعلم الآلي

أهم تطبيق للتعلم الآلي في علم الأحياء هو فائدته في عمل تنبؤات مبنية على بيانات كبيرة. يمكن للتنبؤات المستندة إلى الكمبيوتر أن تفهم البيانات الضخمة ، واختبار الافتراضات وتوفير الوقت والموارد الثمينة.

على سبيل المثال ، في مجال البيولوجيا T-cell لدينا ، معرفة أي البروتينات الفيروسية لاستهدافها أمر بالغ الأهمية في تطوير اللقاحات والعلاجات. ولكن هناك الكثير من رموز البروتين الفردية من أي فيروس معين ، وهي مكلفة للغاية ويصعب اختبار كل منها تجريبياً.

بدلا من ذلك ، قمنا بتدريب الشبكة العصبية الاصطناعية لمساعدة الآلة على تعلم جميع الخصائص الكيميائية الحيوية الهامة لنوعين من رموز البروتين - طبيعي مقابل غير طبيعي. ثم طلبنا من النموذج أن "يتنبأ" برموز البروتين الفيروسي الجديدة التي تشبه فئة "غير طبيعية" ويمكن أن تشاهدها الخلايا التائية وبالتالي جهاز المناعة. قمنا باختبار نموذج ANN على بروتينات فيروس مختلفة لم يتم دراستها من قبل.

ومن المؤكد أنه ، كطالب مجتهد حريص على إرضاء المعلم ، تمكنت الشبكة العصبية من التعرف بدقة على غالبية بروتينات تنشيط الخلايا التائية هذه داخل هذا الفيروس. قمنا أيضًا باختبار رموز البروتين التي تم التحقق منها للتحقق من دقة تنبؤات ANN. باستخدام هذا النموذج الشبكي العصبي ، يمكن لعالم هكذا التنبؤ بسرعة جميع رموز البروتين القصيرة المهمة من فيروس ضار واختبارها لتطوير علاج أو لقاح ، بدلا من التخمين واختبارها بشكل فردي.

تنفيذ الآلة التعلم بحكمة

بفضل التكرير المستمر ، أصبحت علوم البيانات الكبيرة والتعلم الآلي لا غنى عنها بشكل متزايد لأي نوع من البحث العلمي. إن إمكانيات استخدام أجهزة الكمبيوتر للتدريب والتنبؤ بالبيولوجيا تكاد تكون لا حصر لها. من معرفة أي مجموعة من المرقمات الحيوية هي الأفضل لكشف المرض لفهم السبب فقط يستفيد بعض المرضى من علاج سرطان معين، أصبح التعدين مجموعات البيانات الكبيرة باستخدام أجهزة الكمبيوتر طريقا قيما للبحوث.

بالطبع ، هناك قيود. أكبر مشكلة في علم البيانات الضخمة هي البيانات نفسها. إذا كانت البيانات التي تم الحصول عليها عن طريق الدراسات -omics خاطئة للبدء بها ، أو على أساس العلم غير المطابقة للمواصفات ، فستتلقى الأجهزة تدريبًا على البيانات السيئة - مما يؤدي إلى التوقعات السيئة. الطالب جيد فقط كمعلم.

لأن أجهزة الكمبيوتر ليست واعية (حتى الآن) ، يمكنهم في سعيهم لأنماط الخروج معهم حتى عندما لا تكون موجودة ، مما يؤدي إلى الارتفاع مرة أخرى ، إلى البيانات السيئة والعلوم غير قابلة للاسترجاع.

وقد أثار بعض الباحثين مخاوف بشأن أن تصبح أجهزة الكمبيوتر مربعات سوداء من البيانات للعلماء الذين لا يفهمون بوضوح التلاعبات والميكنة التي يقومون بها نيابة عنهم.

على الرغم من هذه المشاكل ، ستستمر فوائد البيانات الكبيرة والآلات لجعلها شركاء قيّمين في البحث العلمي. مع وضع التحذيرات في الاعتبار ، فنحن مستعدون بشكل فريد لفهم البيولوجيا من خلال عيون الآلة.

نبذة عن الكاتبالمحادثة

سري كريشنا ، دكتوراه ، تصميم بيولوجي ، كلية هندسة النظم البيولوجية والصحية ، جامعة ولاية أريزونا ، دييجو تشاويل ، طالب دكتوراه في الرياضيات التطبيقية ، جامعة ولاية أريزونا

تم نشر هذه المقالة في الأصل المحادثة. إقرأ ال المقال الأصلي.


كتاب ذات الصلة:

at سوق InnerSelf و Amazon