الصحة

يعمل محرك بحث ثوري للحمض النووي على تسريع الاكتشافات الجينية

وأصبح من الممكن الآن اكتشاف الأمراض الوراثية النادرة لدى المرضى، وتحديد الطفرات الخاصة بالورم ــ وهو إنجاز أصبح ممكناً بفضل تسلسل الحمض النووي، الذي أحدث تحولاً في البحوث الطبية الحيوية منذ عقود من الزمن. في السنوات الأخيرة، أدى إدخال تقنيات التسلسل الجديدة (تسلسل الجيل التالي) إلى موجة من الاختراقات. خلال عامي 2020 و2021، على سبيل المثال، مكنت هذه الأساليب من فك التشفير السريع والمراقبة العالمية لجينوم SARS-CoV-2.

وفي الوقت نفسه، يقوم عدد متزايد من الباحثين بإتاحة نتائج التسلسل الخاصة بهم للجمهور. وقد أدى ذلك إلى انفجار البيانات المخزنة في قواعد البيانات الرئيسية مثل SRA الأمريكية (أرشيف قراءة التسلسل) وENA (أرشيف النوكليوتيدات الأوروبي) الأوروبي. تحتوي هذه الأرشيفات معًا الآن على حوالي 100 بيتابايت من المعلومات، وهو ما يعادل تقريبًا إجمالي كمية النص الموجود عبر الإنترنت بالكامل، حيث يساوي البيتابايت الواحد مليون جيجابايت.

وحتى الآن، كان علماء الطب الحيوي بحاجة إلى موارد حاسوبية هائلة للبحث في هذه المستودعات الجينية الضخمة ومقارنتها ببياناتهم الخاصة، مما يجعل إجراء عمليات بحث شاملة شبه مستحيلة. لقد طور الباحثون في ETH Zurich الآن طريقة للتغلب على هذا القيد.

البحث عن النص الكامل بدلاً من تنزيل مجموعات البيانات بأكملها

أنشأ الفريق أداة تسمى MetaGraph، والتي تعمل على تبسيط العملية وتسريعها بشكل كبير. بدلاً من تنزيل مجموعات البيانات بأكملها، يتيح MetaGraph إجراء عمليات بحث مباشرة داخل بيانات DNA أو RNA الخام – تمامًا مثل استخدام محرك بحث على الإنترنت. يقوم العلماء ببساطة بإدخال التسلسل الجيني محل الاهتمام في حقل البحث، وفي غضون ثوان أو دقائق حسب الاستعلام، يمكنهم معرفة مكان ظهور هذا التسلسل في قواعد البيانات العالمية.

يوضح البروفيسور جونار راتش، عالم البيانات في قسم علوم الكمبيوتر في جامعة ETH زيوريخ: “إنه بمثابة محرك بحث Google للحمض النووي”. في السابق، كان بإمكان الباحثين البحث فقط عن البيانات الوصفية ثم كان عليهم تنزيل مجموعات البيانات الكاملة للوصول إلى التسلسلات الأولية. وكان هذا النهج بطيئا وغير مكتمل ومكلفا.

وفقًا لمؤلفي الدراسة، تعد MetaGraph أيضًا فعالة من حيث التكلفة بشكل ملحوظ. إن تمثيل جميع التسلسلات البيولوجية المتاحة للجمهور لن يتطلب سوى عدد قليل من محركات الأقراص الصلبة للكمبيوتر، ولن تكلف الاستعلامات الكبيرة أكثر من حوالي 0.74 دولار لكل ميجا قاعدة.

ونظرًا لأن محرك البحث الجديد عن الحمض النووي سريع ودقيق، فيمكنه تسريع الأبحاث بشكل كبير – خاصة في تحديد مسببات الأمراض الناشئة أو تحليل العوامل الوراثية المرتبطة بمقاومة المضادات الحيوية. وقد يساعد النظام أيضًا في تحديد موقع الفيروسات المفيدة التي تدمر البكتيريا الضارة (العاثيات) المخبأة داخل قواعد البيانات الضخمة هذه.

الضغط بعامل

في دراستهم المنشورة في 8 أكتوبر طبيعة، أظهر فريق ETH كيفية عمل MetaGraph. تقوم الأداة بتنظيم وضغط البيانات الجينية باستخدام الرسوم البيانية الرياضية المتقدمة التي تنظم المعلومات بشكل أكثر كفاءة، على غرار الطريقة التي يقوم بها برنامج جداول البيانات بترتيب القيم. يوضح راتش: “من الناحية الرياضية، إنها مصفوفة ضخمة تحتوي على ملايين الأعمدة وتريليونات الصفوف”.

يعد إنشاء فهارس لجعل مجموعات البيانات الكبيرة قابلة للبحث مفهومًا مألوفًا في علوم الكمبيوتر، ولكن منهج ETH يتميز بكيفية ربط البيانات الأولية بالبيانات الوصفية مع تحقيق معدل ضغط استثنائي يصل إلى حوالي 300 مرة. يعمل هذا التخفيض مثل تلخيص كتاب إلى حد كبير – فهو يزيل التكرار مع الحفاظ على السرد والعلاقات الأساسية، مع الاحتفاظ بجميع المعلومات ذات الصلة في شكل أصغر بكثير.

يقول الدكتور أندريه كاليس، الذي هو، مثل راتش، عضو في مجموعة المعلوماتية الطبية الحيوية في ETH زيوريخ: “نحن ندفع حدود ما هو ممكن من أجل الحفاظ على مجموعات البيانات مدمجة قدر الإمكان دون فقدان المعلومات الضرورية”. وعلى النقيض من أقنعة بحث الحمض النووي الأخرى التي يتم بحثها حاليًا، فإن نهج الباحثين في ETH قابل للتطوير. وهذا يعني أنه كلما زادت كمية البيانات التي يتم الاستعلام عنها، قلت قوة الحوسبة الإضافية التي تتطلبها الأداة.

نصف البيانات متاحة بالفعل الآن

تم تقديم MetaGraph لأول مرة في عام 2020، وقد تم تحسينه بشكل مطرد. أصبحت الأداة الآن متاحة للعامة لعمليات البحث (وهي تقوم بالفعل بفهرسة الملايين من تسلسلات الحمض النووي والحمض النووي الريبي (RNA) والبروتينات من الفيروسات والبكتيريا والفطريات والنباتات والحيوانات والبشر. وفي الوقت الحالي، يتم تضمين ما يقرب من نصف جميع مجموعات بيانات التسلسل العالمية المتاحة، ومن المتوقع أن يتبعها الباقي بحلول نهاية العام. وبما أن MetaGraph مفتوح المصدر، فقد يجذب أيضًا اهتمام شركات الأدوية التي تدير كميات كبيرة من بيانات البحث الداخلية.

يعتقد كاليس أنه من الممكن أن يتم استخدام محرك بحث الحمض النووي يومًا ما من قبل الأفراد: “في الأيام الأولى، حتى جوجل لم يكن يعرف بالضبط ما هو محرك البحث المناسب له. إذا استمر التطور السريع في تسلسل الحمض النووي، فقد يصبح من الشائع تحديد نباتات الشرفة الخاصة بك بشكل أكثر دقة”.

المصدر :- Health & Medicine News — ScienceDaily

السابق
قد يحدد معدل ذكائك مدى سماعك وسط حشد من الناس
التالي
أوصاف الخيال العلمي للتلاعب بالذاكرة قد تصبح حقيقة