کاربردهای هوش مصنوعی در بیوانفورماتیک – به زبان ساده
«بیوانفورماتیک» (Bioinformatic) یکی از بهرهبرداران اصلی پیشرفتهای اخیر به وقوع پیوسته در زمینه «هوش مصنوعی» (Artificial Intelligence | AI) است. در این مطلب، به بررسی کاربردهای هوش مصنوعی در بیوانفورماتیک پرداخته شده است. بیوانفورماتیک به عنوان یک زمینه علمی و فناوری میانرشتهای، قصد دارد تا روشها، ابزارها و نرمافزارهایی را در جهت بهبود درک دادههای زیستشناسی توسعه دهد. «یادگیری ماشین» (Machine Learning) یک شاخه از هوش مصنوعی است که به ابزاری قدرتمند برای بسیاری از کاربردهای بیوانفورماتیک مبدل شده است.
روشهای یادگیری ماشین به ویژه در زمینه پیشبینی و تشخیص الگو بر پایه مجموعه دادههای بزرگ، مفید هستند. کاربردهای نوظهوری از یادگیری ماشین در حوزه بیوانفورماتیک نیز وجود دارند. در این مطلب، به بررسی این موضوع پرداخته میشود که یادگیری ماشین چگونه در «تعیین توالی دیانای» (DNA Sequencing)، دستهبندی پروتئین و تحلیل «بیان ژن» (Gene Expressions) در «ریزآرایه دیانای» (DNA Microarrays) مورد استفاده قرار میگیرد.
تعیین توالی DNA با هوش مصنوعی در بیوانفورماتیک
ساختار مولکول دیانای (DNA)، مارپیچ دوگانهای است که از پیوند چهار بلوک شیمیایی که به آنها مبنا گفته میشود («آدنین» (Adenine | A)، «تیمین» (Thymine | T)، «سیتوزین» (Cytosine | C) و «گوانین» (Guanine | G) تشکیل شده است.
مبناها با یکدیگر پیوند میخورند و یک توالی خاص از این پیوندها در «حلقه دیانای» (DNA Segment) یک مولکول کارکردی که به آن «ژن» گفته میشود را رمزگذاری میکند. ملکولهای کارکردی رمزگذاری شده به وسیله ژنها، مبنای شیمیایی عناصر گوناگون موروثی که فیزیولوژی انسان را تشکیل دادهاند مانند رنگ مو را میسازند.
در بیوانفورماتیک، فرایند تعیین موقعیت ناحیهای از دیانای که ژن را رمزگذاری میکند، معمولا «پیشبینی ژن» (Gene Prediction) یا «کشف ژن» (Gene Finding) نامیده میشود. فرایند کشف ژن شامل ترکیبی از جستجوهای بیرونی و ذاتی میشود. به عنوان بخشی از جستجوی بیرونی، «ژنوم» (Genome) هدف برای توالیهایی که مشابه با شواهد بیرونی هستند مورد جستجو قرار میگیرد. این کار به صورت توالیهای رمزگذاری ژن شناخته شده که پیشتر کشف و برچسبگذاری شدهاند باید انجام شود.
اگرچه، با توجه به هزینه ذاتی و دشواری که تعیین شواهد بیرونی برای بسیاری از ژنها دارد، جستجوی ذاتی نیز هنگامی که الگوریتمهای پیشبینی در تلاش برای تعیین حلقههای دیانای هستند که میتوانند میزبان توالیهای رمزنگاری ژن باشند، انجام میشود. این مدلهای پیشبین به طور سیستماتیک، دیانای ژنومیک را برای ژنهای کد-پروتئین جستجو میکنند.
برای انجام پیشبینی، این الگوریتمها ترکیبی از سیگنالها، توالیهای خاص، محتوا و مشخصات آماری را به کار میگیرند. در حال حاضر، مدلهای یادگیری ماشین و «یادگیری عمیق» (Deep Learning) متعددی در این حوزه توسعه پیدا کردهاند که از این جمله میتوان به «جنگل تصادفی» (Random Forest)، «ماشین بردار پشتیبان» (Support Vector Machine | SVM)، «پرسپترون چند لایه» (Multilayer Perceptron) و «K-نزدیکترین همسایگی» (K-Nearest Neighbour) اشاره کرد.
در مقالات منتشر شده «مقایسه روشهای دستهبندی برای پیشبینی ژن در متاژنومیکس» (A comparison of classification methods for gene prediction in metagenomics) [+] و «پیشبینی ژن با استفاده از یادگیری عمیق» (Gene prediction using Deep Learning) [+] از روشهای مذکور برای پیشبینی ژن بیرونی استفاده شده است.
دستهبندی پروتئین با هوش مصنوعی در بیوانفورماتیک
پروتئینها «عاملهای» سلولهای بدن هستند که بسیاری از کارکردهایی که در نهایت منجر به حیات بشر میشود را اجرا میکنند. پروتئینها در واقع مسئول آرایه وسیعی از کارکردهای درون اندامگان مانند کارکردهای متابولیک، پاسخ به محرکها، ساختاردهی به سلولها، حمل و نقل مولکولها و بسیاری از دیگر موارد هستند. پروتئینها به وسیله ژنها کدگذاری شدهاند و مبنای بافتهای زنده را تشکیل میدهند. دستهبندی الگوهای پروتئین در سلولهای انسان یک گام اساسی در درک کامل پیچیدگی بدن انسان است.
با پیشرفتهای اخیر در میکروسکوپهای توان بالا، تصاویر سلولی سریعتر از هر تیم انسانی قابل تحلیل و دستهبندی هستند. در نتیجه، مدلهای یادگیری ماشین با دستهبندی الگوهای پروتئین در سلولهای انسان از طریق روشهای یادگیری ماشین و «بینایی کامپیوتری» (Computer Vision) گوناگون مانند «میدانهای عصبی پیچشی عمیق» (Deep Convolutional Neural Fields | DCNF) پیشگام هستند. در شرکت هوش مصنوعی «اُپتیما ایآی» (Optima AI) روی توسعه مدل دستهبندی پروتئینی کار میشود که دستهبندیهای چندکلاسی چندبرچسبی را بر اساس تصاویر سلولی تولید شده به وسیله میکروسکوپهای توان بالا انجام میدهد.
تحلیل بیان ژن
میکروآرایههای DNA، یک نوع آز-تراشه (آزمایشگاه روی تراشه | Lab-on-a-Chip | LOC) و در واقع مجموعهای از نقاط دیانای هستند که به یک سطح جامد متصل شدهاند. میکروآرایهها برای گردآوری و سنجش خودکار سطح بیان ژن در اندامگان مورد استفاده قرار میگیرند. بیان ژن فرایندی است که طی آن اطلاعات یک ژن در سنتز محصول کارکردی ژن مورد استفاده قرار میگیرد. محصول کارکردی ژن معمولا یک پروتئین یا در زمینه کدگذاری غیر پروتئینی یک آراِنای (اسید ریبونوکلئیک | Ribonucleic Acid) کارکردی است. یادگیری ماشین معمولا در تحلیلها، تعیین الگو و دستهبندی بیان ژن مورد استفاده قرار میگیرد.
در زمینه پژوهشهای سرطان، ظهور میکروآرایهها و توالیهای RNA با روشهای یادگیری ماشین لبه علم، پتانسیل قابل توجهی را برای شناسایی و دستهبندی تومورها در سطح مولکولی از خود نشان دادهاند. از این رو، پزشکان را قادر به پیشنهاد درمانهای شخصیسازی شده برای بیماران مبتلا به سرطان بر مبنای ساختار ژنتیکی یک تومور خاص میسازند.
نتایج پژوهشی که با عنوان «روشهای یادگیری ماشین اعمال شده روی دادههای میکروآرایههای دیانای میتوانند تشخیص سرطان را بهبود ببخشند» انجام شده است، نتایج و روشهای یادگیری ماشین مورد استفاده برای مسائل دستهبندی را نشان میدهد. پیشرفتهای اخیر در زمینه بیوانفورماتیک و یادگیری ماشین، حاکی از فرصتهای بسیاری در زمینه ژنتیک، زیستشناسی سلولی، پژوهشهای سرطان و درمان شخصیسازی شده است.
اگر نوشته بالا برای شما مفید بوده است، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای هوش مصنوعی
- آموزش مقدماتی بیوانفورماتیک (Bioinformatics)
- آموزش آنالیز توالی یک ژن با نرم افزارهای بیوانفورماتیک
- هوش مصنوعی چیست؟ ــ بخش پنجم: کاربردها
- دادهکاوی (Data Mining) و پایتون برای تحلیل چاقی کودکان — راهنمای کاربردی
- نقشه دانش فناوریهای هوش مصنوعی و دستهبندی آنها — راهنمای جامع
^^
سلام و وقت بخیر.
ضمن تشکر از مطالب مفیدتون . عالی بود. اگه ممکنه منبع این آموزش و آموزش مربوط به انواع rna ها را به ایمیلم بفرستید.ممنون