[ad_1]

در تحقیقی که در Science Today منتشر شد ، برگر و همکارانش چندین مورد از این رشته ها را با هم ترکیب کردند و از NLP برای پیش بینی جهش در ویروس ها استفاده کردند که به آنها اجازه می دهد تا از شناسایی آنتی بادی در سیستم ایمنی بدن انسان جلوگیری کنند ، این فرایند به عنوان فرار ایمنی ویروسی شناخته می شود. . ایده اصلی این است که تفسیر ویروس توسط سیستم ایمنی بدن مشابه تفسیر یک جمله توسط انسان است.

علی مدنی ، دانشمند Salesforce که از NLP برای پیش بینی توالی پروتئین ها استفاده می کند ، گفت: “این کاغذ ساده است و بر روی حرکت قبلی کار می کند.”

تیم Berger از دو مفهوم زبان مختلف استفاده می کند: دستور زبان و معناشناسی (یا معنی). مناسب بودن ژنتیکی یا تکاملی یک ویروس – به عنوان مثال ، چقدر خوب است یک میزبان آلوده شود – از نظر درستی دستوری قابل تفسیر است. یک ویروس مسری و موفق از نظر دستورالعمل صحیح است. ناموفق نیست

به همین ترتیب ، جهش ویروس را می توان از نظر معناشناسی تفسیر کرد. ویروس ، که به گونه ای جهش می یابد که شرایط اطراف خود را تغییر می دهد – مانند جهش در پروتئین های سطحی که آن را برای برخی از آنتی بادی ها نامرئی می کند – معنای خود را تغییر داده است. ویروس ها با جهش های مختلف ممکن است معنی های متفاوتی داشته باشند و ویروس ها با معنی های مختلف برای خواندن آن به آنتی بادی های مختلفی احتیاج داشته باشند.

برای مدل سازی این خصوصیات ، محققان از LTSM ، نوعی شبکه عصبی که قبل از ترانسفورماتورهای استفاده شده توسط مدل های بزرگ زبانی مانند GPT-3 است ، استفاده کردند. این شبکه های قدیمی را می توان با داده های بسیار کمتری نسبت به ترانسفورماتور آموزش دید و در عین حال عملکرد خوبی برای بسیاری از کاربردها دارد.

به جای میلیون ها جمله ، آنها مدل NLP را بر روی هزاران توالی ژنتیکی گرفته شده از سه ویروس مختلف آموزش می دهند: 45000 دنباله منحصر به فرد برای آنفلوانزا ، 60000 مورد برای سویه HIV و بین 3000 تا 4000 برای سویه Sars-Cov-2 ، ویروسی که باعث ایجاد ویروس می شود -19 برایان هی از دانشگاه MIT ، که این مدل ها را ایجاد کرده است ، گفت: “اطلاعات کمتری در مورد ویروس کرونا وجود دارد زیرا نظارت کمتری وجود دارد.”

مدل های NLP با رمزگذاری کلمات در فضای ریاضی کار می کنند به طوری که کلمات با معانی مشابه در مدل نزدیک تر به کلمات با معانی مختلف هستند. این به عنوان تعبیه شناخته می شود. برای ویروس ها ، ترکیب توالی های ژنتیکی ، ویروس ها را با توجه به شباهت جهش آنها ، گروه بندی می کند. این امر باعث می شود که پیش بینی جهش هایی که برای یک سویه بیشتر از بقیه است آسان تر باشد.

هدف کلی این روش شناسایی جهش هایی است که می تواند ویروس را از سیستم ایمنی بدن فرار دهد بدون اینکه عفونت کمتری ایجاد کند – یعنی جهش هایی که معنی ویروس را تغییر می دهند بدون اینکه از نظر دستوری نادرست باشند. برای آزمایش این ابزار ، تیم از معیار متداولی برای ارزیابی پیش بینی های انجام شده توسط مدل های یادگیری ماشین استفاده کرد که دقت را در مقیاس بین 0.5 (بهتر از تصادفی) تا 1 (کامل) ارزیابی نمی کنند. در این حالت ، آنها بهترین جهش های شناسایی شده توسط این ابزار را گرفتند و بررسی کردند که چه تعداد از آنها جهش واقعی فرار با استفاده از ویروس های واقعی در آزمایشگاه بوده اند. نتایج آنها از 0.69 برای HIV و 0.85 برای یک سویه ویروس کرونا است. آنها می گویند این از سایر مدلهای مدرن بهتر است.

اخطار قبلی

دانستن اینکه جهش هایی ممکن است رخ دهد ، می تواند بیمارستان ها و مقامات بهداشت عمومی را برای برنامه ریزی پیش رو آسان کند. به عنوان مثال ، اگر از مدلی بخواهید تا به شما بگوید که میزان آنفلوانزا نسبت به سال گذشته چه مقدار تغییر کرده است ، به شما ایده می دهد که آنتی بادی هایی که افراد از قبل تولید کرده اند امسال چقدر کار می کنند.

این تیم می گوید که اکنون از مدل های جدید ویروس کرونا استفاده می کند ، از جمله جهش به اصطلاح در انگلیس ، جهش راسو از دانمارک و انواع گرفته شده از آفریقای جنوبی ، سنگاپور و مالزی. آنها تقریباً در همه آنها پتانسیل بالایی برای فرار از سیستم ایمنی بدن پیدا کرده اند – اگرچه این مورد هنوز در طبیعت آزمایش نشده است. یک استثنا نسخه به اصطلاح آفریقای جنوبی است که این نگرانی را ایجاد می کند که ممکن است بتواند از واکسن فرار کند اما توسط این ابزار مشخص نشده است. آنها سعی می کنند دلیل آن را بفهمند.

استفاده از NLP روند کندی را سرعت می بخشد. پیش از این ، ژنوم ویروس که از بیمار مبتلا به کوید 19 در بیمارستان گرفته شده بود ، می تواند توالی یابی شود و جهش های آن دوباره ساخته و در آزمایشگاه آزمایش شود. برایان برایسون ، زیست شناس MIT که همچنین در حال کار بر روی این پروژه است ، می گوید ممکن است هفته ها طول بکشد. مدل NLP بلافاصله جهش های بالقوه را پیش بینی می کند ، که کار آزمایشگاهی را متمرکز کرده و آن را تسریع می کند.

برایسون گفت: “زمان کار مغتنمی است که باید روی آن کار کنید.” سکانس های ویروسی جدید هر هفته منتشر می شوند. “این وحشی است که همزمان مدل خود را به روز کنید و سپس به آزمایشگاه بروید تا آن را در آزمایشات آزمایش کنید. این بهترین زیست شناسی محاسباتی است. “

اما این فقط آغاز کار است. درمان جهش های ژنتیکی به عنوان تغییر معنی می تواند به روش های مختلف در سراسر زیست شناسی اعمال شود. برایسون گفت: “یک تشبیه خوب می تواند کمک زیادی کند.”

به عنوان مثال ، Hie معتقد است که می توان از رویکرد آنها برای مقاومت به دارو استفاده کرد. وی می گوید: “به یک پروتئین سرطانی فکر کنید که در برابر شیمی درمانی مقاوم می شود یا پروتئین باکتریایی که در برابر آنتی بیوتیک مقاوم می شود.” این جهش ها را می توان دوباره به عنوان تغییرات معنایی درک کرد. “روشهای خلاقانه بسیاری برای شروع تفسیر مدلهای زبان وجود دارد.

مدنی گفت: “من فکر می کنم زیست شناسی مصنوعی در اوج انقلاب است.” “اکنون ما از جمع آوری بسیاری از داده ها به سمت یادگیری نحوه درک عمیق آن حرکت می کنیم.”

محققان در حال مشاهده پیشرفت در NLP و اختراع تشبیهات جدید بین زبان و زیست شناسی هستند تا از آنها استفاده کنند. اما برایسون ، برگر و هی معتقدند که این کراس اوور با الگوریتم های جدید NLP با الهام از مفاهیم زیست شناسی می تواند به هر دو جهت پیش برود. برگر می گوید: “زیست شناسی زبان خاص خود را دارد.”

[ad_2]

منبع: unbox-khabar.ir

ایندکسر