lifestyle

प्रोटीन डिजाइन की चुनौती के लिए आर्टिफिशियल इंटेलिजेंस: अल्फाफोल्ड की शक्ति और सीमाएं

SARS-CoV-2 से जुड़ी महामारी हमारी कोशिकाओं पर वायरस की गतिविधि को सीमित करने में सक्षम अणुओं की संरचना पर सवाल उठाती है – एक ऐसा तंत्र जिसमें बहुत बड़े अणु होते हैं जो मॉडल के लिए मुश्किल होते हैं, प्रोटीन, अधिक… गति।

Google के AlphaFold2 से शुरू होने वाले आर्टिफिशियल इंटेलिजेंस सिस्टम अब इस क्षेत्र में अनुसंधान में क्रांतिकारी बदलाव करते हुए प्रभावशाली तरीके से इन प्रोटीनों के विन्यास की भविष्यवाणी करते हैं। ये तरीके कैसे काम करते हैं? उनकी वर्तमान सीमाएँ क्या हैं?

SARS-CoV-2 का प्रवेश: एक उभरती हुई कहानी

SARS-CoV-2 द्वारा हमारी कोशिकाओं में से एक का संक्रमण, कोविड -19 के लिए जिम्मेदार वायरस, एक तरह के ब्रेक-इन से शुरू होता है: वायरस, प्रोटीन लिफाफा का एक टुकड़ा जिसमें इसकी आनुवंशिक सामग्री होती है, चोर की तरह काम करता है। इमारत की पहली मंजिल पर अपार्टमेंट में प्रवेश करना। ग्रैपलिंग हुक (“रिसेप्टर बाइंडिंग डोमेन” या आरबीडी जिसे प्रोटीन के रूप में जाना जाता है ” नोकदार चीज़ “), यह रेलिंग से चिपक जाता है (“ACE2” कोई कम प्रसिद्ध प्रोटीन नहीं है)। फिर, हथौड़े (फ्यूजन डोमेन, स्पाइक का दूसरा क्षेत्र) का उपयोग करके, यह कांच (कोशिका झिल्ली) को तोड़ता है और अपनी आनुवंशिक सामग्री को इंजेक्ट करता है।

यह तंत्र गतिशील है, जिसका अर्थ है कि अणु भंग के दौरान संरचना (आकार) बदलते हैं। एक ओर, वायरस अंतिम क्षण में बस अपने हुक को “खींचता” है; दूसरी ओर, “विंडो ब्रेकेज” एक प्रकार के टेलीस्कोपिक पोल का उपयोग करता है जिसके लिए जटिल असेंबली की आवश्यकता होती है।

कोशिका झिल्ली और वायरस का संलयन; स्रोत: ClarafiSciViz।

ये दो नायक (स्पाइक और ACE2) प्रोटीन हैं। प्रोटीन के बीच की बातचीत अधिकांश जैविक कार्यों का आधार है, और इन अंतःक्रियाओं को समझने के लिए सबसे पहले भागीदारों के ज्यामितीय आकार के ज्ञान की आवश्यकता होती है – हम अक्सर इस तथ्य की कल्पना करने के लिए “कुंजी” और “ताले” की बात करते हैं कि प्रोटीन में ज्यामिति होनी चाहिए। उनके साथ संवाद करने के लिए पर्याप्त होना चाहिए।

1950-60 के दशक से इन आणविक संरचनाओं का प्रयोगात्मक रूप से अध्ययन किया गया है और एक अंतरराष्ट्रीय डेटाबेस, प्रोटीन डेटा बैंक में संग्रहीत किया गया है।

[Près de 80 000 lecteurs font confiance à la newsletter de The Conversation pour mieux comprendre les grands enjeux du monde. Abonnez-vous aujourd’hui]

SARS-CoV-2 के मामले में, स्पाइक प्रोटीन को व्यापक रूप से एक कुंजी के रूप में प्रस्तुत किया गया है जो ACE2 “लॉक” में फिट बैठता है। लेकिन की-लॉक तंत्र कुछ हद तक सरलीकृत दृष्टि है, और जैसा कि हमने देखा है, प्रोटीन एक निश्चित लचीलेपन (वे विकृत) के साथ संपन्न होते हैं, जो उन्हें परिस्थितियों के अनुकूल होने की अनुमति देता है।

दरअसल, SARS-CoV-2 द्वारा संक्रमण को रोकने का एक तरीका ग्रैपलिंग हुक (स्पाइक प्रोटीन) और विशेष रूप से इसके रिसेप्टर बाइंडिंग डोमेन (RBD) को ACE2 लक्ष्य से बांधने से रोकना है। यह आपकी प्रतिरक्षा प्रणाली द्वारा स्रावित विशिष्ट एंटीबॉडी का लक्ष्य है।

दुर्भाग्य से, उत्परिवर्तन के माध्यम से, वायरस लगातार इस नियंत्रण से बचने की कोशिश कर रहा है: कुछ अमीनो एसिड बदलते हैं, जिसका अर्थ है कि इसके स्पाइक प्रोटीन की संरचना एंटीबॉडी द्वारा मान्यता प्राप्त नहीं है। अब पर्याप्त आत्मीयता नहीं होने के कारण, प्रतिरक्षा प्रणाली को अनुकूल होना चाहिए, जो कि वायरल उपभेदों की एक विस्तृत श्रृंखला के खिलाफ प्रभावी होने के लिए एक चुनौती है।

दो बायोमोलेक्यूल्स के बीच आत्मीयता: संरचना और गतिशीलता

“ग्रेपलिंग हुक” (आरबीडी) के “रेलिंग” (एसीई 2) से जुड़ाव को बेहतर ढंग से समझने के लिए, आइए एक जटिल सी बनाने के लिए दो प्रोटीन ए और बी की बातचीत को देखें।

परमाणु स्तर पर, दो घटनाएं प्रतिस्पर्धा करती हैं: परमाणुओं के बीच आकर्षक बलों के कारण अणु एक दूसरे को आकर्षित करते हैं; लेकिन, थर्मल आंदोलन के प्रभाव में – अर्थात, तापमान बढ़ाने वाले परमाणुओं का यादृच्छिक विस्थापन, अणु विकृत हो जाते हैं।

इस थर्मल आंदोलन का मतलब है कि एक बार सी कॉम्प्लेक्स बनने के बाद यह ए और बी में अलग हो सकता है, पार्टनर फिर से जुड़ सकते हैं और इसी तरह। यह एक रासायनिक संतुलन है और अणुओं ए और बी और कॉम्प्लेक्स सी की सापेक्ष मात्रा बातचीत की स्थिरता का एक उपाय है। C जितना अधिक जटिल होता है, B के लिए A की आत्मीयता उतनी ही अधिक होती है, और इसलिए उनकी अंतःक्रिया उतनी ही अधिक स्थिर होती है।

स्पाइक और एसीई2 के मामले में, “रेलिंग” (एसीई2) के लिए “ग्रेपल” (आरबीडी) की एक उच्च आत्मीयता वायरस संक्रामकता को बढ़ाएगी (ग्रैपलिंग हुक रेलिंग से अधिक मजबूती से चिपक जाएगा। क्योंकि यह लंबा है)।

AlphaFold2: संरचना से आत्मीयता तक

बाध्यकारी आत्मीयता की भविष्यवाणी करने के लिए औसत आणविक संरचना के आसपास विरूपण को ध्यान में रखा जाना चाहिए। लॉक-की रूपक में, बाद वाले के आकार को कम से कम लगभग ज्ञात होना चाहिए। माना जाता है कि प्रोटीन विभिन्न अमीनो एसिड की लंबी श्रृंखलाओं से बने होते हैं, जो मोतियों की लंबी स्ट्रिंग की तरह एक साथ बंधे होते हैं।

प्रोटीन के अमीनो एसिड अनुक्रम (दूसरे शब्दों में, जिस क्रम में वे जुड़े हुए हैं) को जानने के बाद, क्या हम कंप्यूटर द्वारा इसकी गणना कर सकते हैं और अनुमान लगा सकते हैं कि यह किस आकार का होगा?

यह विषय Google डीपमाइंड के एक शोध समूह द्वारा अल्फाफोल्ड2 पद्धति और इसी नाम के सॉफ्टवेयर के विकास के साथ प्रमुख प्रगति का विषय रहा है। विधि ने 2020 में CASP14 प्रतियोगिता में प्रतियोगियों को स्पष्ट रूप से मात दी, जो उन संरचनाओं की तुलना करके भविष्यवाणियों की गुणवत्ता का आकलन करती है जिन्हें प्रयोगात्मक रूप से हल किया गया है लेकिन प्रतिस्पर्धियों के संपर्क में नहीं आया है।

बहुत योजनाबद्ध रूप से, अमीनो एसिड के अनुक्रम को देखते हुए, जिसकी संरचना की भविष्यवाणी की जानी चाहिए, AlphaFold2 इनपुट के रूप में समरूप अनुक्रमों के डेटाबेस का उपयोग करता है (विभिन्न अनुक्रम, लेकिन जिसके लिए अमीनो एसिड परिवर्तन प्रोटीन के कार्य को नहीं बदलते हैं), साथ ही साथ कुछ संरचनाएं भी। प्रायोगिक प्रोटीन डाटा बैंक से। यह विधि प्रोटीन के लिए एक प्रशंसनीय संरचना के साथ-साथ गणना की गई संरचना में प्रत्येक अमीनो एसिड के लिए प्रोटीन की मुड़ी हुई अवस्था के लिए “आत्मविश्वास स्कोर” का उत्पादन करती है, जो यह देखने में मदद करती है कि कौन से अमीनो एसिड उजागर हुए हैं और उनके साथ बातचीत करने की संभावना है। बाहर

विधि दो मुख्य ब्लॉकों का उपयोग करती है। पहला अमीनो एसिड के बीच कुछ बाधाओं को कूटबद्ध करके एक मोटा मॉडल बनाता है, विशेष रूप से तीन से तीन की दूरी जो त्रिकोण असमानता का सम्मान करना चाहिए। दूसरा, स्ट्रक्चर मॉड्यूल, स्पष्ट रूप से एक 3D मॉडल पेश करता है जहां अमीनो एसिड एक दूसरे के संबंध में स्थित होते हैं, “फोकस मैकेनिज्म” के लिए धन्यवाद, एक एल्गोरिथम तकनीक जो परिकल्पना की यादृच्छिक खोज की अनुमति देती है और मॉडल के साथ सबसे अधिक संगत रखती है। विकसित अंत में, तंत्रिका नेटवर्क एक प्रशंसनीय संरचना का निर्माण करता है।

तिथि करने के लिए, विधि अच्छी तरह से संरचित प्रोटीन डोमेन (सबसे कठोर) के लिए विशेष रूप से प्रभावी रही है, लेकिन असंरचित क्षेत्रों (सबसे लचीला) या यहां तक ​​​​कि लचीली छोरों के लिए भी कम है जिसके लिए कोई समान एकल संरचना की भविष्यवाणी नहीं की गई है। व्याख्या इसके अलावा, ऊपर उल्लिखित आत्मविश्वास स्कोर के बावजूद, समग्र परिणाम बिना किसी गारंटी के दिया जाता है।

SARS-CoV-2 एंटीबॉडी के लिए विधि लागू करें

इस दृष्टिकोण की रोमांचक सफलता ने, निश्चित रूप से, आत्मीयता की भविष्यवाणी में रुचि पैदा की है, जिसे हाल ही में SARS-Cov-2 के RDB के खिलाफ एंटीबॉडी बनाने के लिए खोजा गया है, ताकि इन एंटीबॉडी में विभिन्न वायरस उपभेदों के लिए उच्च आत्मीयता हो।

इस उद्देश्य के लिए विधि “म्यूटैनेसिस” डेटाबेस का उपयोग करती है: यह परिसर की संरचना, उसी परिसर की संरचना, जिसका प्रोटीन आनुवंशिक रूप से उत्परिवर्तित किया गया है, और इन दोनों परिसरों में से प्रत्येक के सापेक्ष संबंध दोनों देता है। तो यह सीखने का सवाल है कि उत्परिवर्तन आत्मीयता को कैसे प्रभावित करते हैं। एक पद्धतिगत दृष्टिकोण से, एल्गोरिथ्म अमीनो एसिड की पहचान करता है जो बाध्यकारी आत्मीयता में महत्वपूर्ण योगदान देता है।

उल्लेखनीय रूप से, इस रणनीति ने SARS-CoV-2 (लेकिन डेल्टा नहीं) के अल्फा, बीटा और गामा वेरिएंट के खिलाफ प्रभावी एंटीबॉडी का उत्पादन किया।

डायनेमिक्स भविष्यवाणी एक खुली समस्या बनी हुई है

हमारे मैक्रोस्कोपिक अवलोकनों से औसत गुणों की गणना करने के लिए प्रोटीन जैसे बड़े अणुओं में बाध्यकारी आत्मीयता का मज़बूती से अनुमान लगाने के लिए बहुत उच्च-आयामी स्थान (परमाणु असंख्य हैं और अंतरिक्ष के 3 आयामों में चलते हैं) की खोज की आवश्यकता है।

साथ ही, AlphaFold2 और मशीन लर्निंग के संदर्भ में, डेटा उपलब्ध होना चाहिए ताकि एल्गोरिथम संरचना और उसके गुणों को संबद्ध करना सीख सके। हमारे मामले में, स्थिर जानकारी मौजूद है प्रोटीन डाटा बैंक और अन्य डेटाबेस में निश्चित रूप से आवश्यक सभी गतिशील जानकारी नहीं होती है।

“मान लीजिए व्याख्या नहीं करता है”

SARS-CoV-2 जैसे वायरस को प्रभावी ढंग से अवरुद्ध करने का व्यावहारिक प्रश्न दिखाता है कि ये आणविक डिजाइन प्रश्न कितने कठिन हैं, फिर भी शास्त्रीय इंजीनियरिंग अनुकूलन कार्यों के दायरे में नहीं हैं।

आत्मीयता की धारणा “भविष्यवाणी” और कानूनों और मॉडलों के माध्यम से स्पष्टीकरण के बीच महामारी विज्ञान में देखे गए विरोध को भी समझाती है, जिससे कार्य-कारण की एक श्रृंखला स्थापित करना संभव हो जाता है। जैसा कि गणितज्ञ और ज्ञानमीमांसा रेने थॉम ने कहा, “भविष्यवाणी स्पष्टीकरण नहीं है,” और मशीन सीखने की तकनीक इस विसंगति को अच्छी तरह से समझाती है।

हालांकि, हम शर्त लगाते हैं कि डेटा का संचय, विशेष रूप से गतिशील, इस अर्थ में अभिसरण की अनुमति देगा कि मशीन लर्निंग स्पष्टीकरण के साथ अपनी भविष्यवाणियों का मिलान करने में सक्षम होगी।

Back to top button

Adblock Detected

Ad Blocker Detect please deactivate ad blocker