«بیوانفورماتیک» (Bioinformatic) یکی از بهره‌برداران اصلی پیشرفت‌های اخیر به وقوع پیوسته در زمینه «هوش مصنوعی» (Artificial Intelligence | AI) است. در این مطلب، به بررسی کاربردهای هوش مصنوعی در بیوانفورماتیک پرداخته شده است. بیوانفورماتیک به عنوان یک زمینه علمی و فناوری میان‌رشته‌ای، قصد دارد تا روش‌ها، ابزارها و نرم‌افزارهایی را در جهت بهبود درک داده‌های زیست‌شناسی توسعه دهد. «یادگیری ماشین» (Machine Learning) یک شاخه از هوش مصنوعی است که به ابزاری قدرتمند برای بسیاری از کاربردهای بیوانفورماتیک مبدل شده است.

روش‌های یادگیری ماشین به ویژه در زمینه پیش‌بینی و تشخیص الگو بر پایه مجموعه داده‌های بزرگ، مفید هستند. کاربردهای نوظهوری از یادگیری ماشین در حوزه بیوانفورماتیک نیز وجود دارند. در این مطلب، به بررسی این موضوع پرداخته می‌شود که یادگیری ماشین چگونه در «تعیین توالی دی‌ان‌ای» (DNA Sequencing)، دسته‌بندی پروتئین و تحلیل «بیان ژن» (Gene Expressions) در «ریزآرایه دی‌ان‌ای» (DNA Microarrays) مورد استفاده قرار می‌گیرد.

تعیین توالی دی‌ان‌ای با هوش مصنوعی در بیوانفورماتیک

ساختار مولکول دی‌ان‌ای (DNA)، مارپیچ دوگانه‌ای است که از پیوند چهار بلوک شیمیایی که به آن‌ها مبنا گفته می‌شود («آدنین» (Adenine | A)، «تیمین» (Thymine | T)، «سیتوزین» (Cytosine | C) و «گوانین» (Guanine | G)) تشکیل شده است. مبناها با یکدیگر پیوند می‌خورند و یک توالی خاص از این پیوندها در «حلقه دی‌ان‌ای» (DNA Segment) یک مولکول کارکردی که به آن «ژن» گفته می‌شود را رمزگذاری می‌کند. ملکول‌های کارکردی رمزگذاری شده به وسیله ژن‌ها، مبنای شیمیایی عناصر گوناگون موروثی که فیزیولوژی انسان را تشکیل داده‌اند مانند رنگ مو را می‌سازند.

کاربردهای هوش مصنوعی در بیوانفورماتیک -- راهنمای کاربردی

در بیوانفورماتیک، فرایند تعیین موقعیت ناحیه‌ای از دی‌ان‌ای که ژن را رمزگذاری می‌کند، معمولا «پیش‌بینی ژن» (Gene Prediction) یا «کشف ژن» (Gene Finding) نامیده می‌شود. فرایند کشف ژن شامل ترکیبی از جستجوهای بیرونی و ذاتی می‌شود. به عنوان بخشی از جستجوی بیرونی، «ژنوم» (Genome) هدف برای توالی‌هایی که مشابه با شواهد بیرونی هستند مورد جستجو قرار می‌گیرد. این کار به صورت توالی‌های رمزگذاری ژن شناخته شده که پیش‌تر کشف و برچسب‌گذاری شده‌اند باید انجام شود.

اگرچه، با توجه به هزینه ذاتی و دشواری که تعیین شواهد بیرونی برای بسیاری از ژن‌ها دارد، جستجوی ذاتی نیز هنگامی که الگوریتم‌های پیش‌بینی در تلاش برای تعیین حلقه‌های دی‌ان‌ای هستند که می‌توانند میزبان توالی‌های رمزنگاری ژن باشند، انجام می‌شود. این مدل‌های پیش‌بین به طور سیستماتیک، دی‌ان‌ای ژنومیک را برای ژن‌های کد-پروتئین جستجو می‌کنند. برای انجام پیش‌بینی، این الگوریتم‌ها ترکیبی از سیگنال‌ها، توالی‌های خاص، محتوا و مشخصات آماری را به کار می‌گیرند. در حال حاضر، مدل‌های یادگیری ماشین و «یادگیری عمیق» (Deep Learning) متعددی در این حوزه توسعه پیدا کرده‌اند که از این جمله می‌توان به «جنگل تصادفی» (Random Forest)، «ماشین بردار پشتیبان» (Support Vector Machine | SVM)، «پرسپترون چند لایه» (Multilayer Perceptron) و «K-نزدیک‌ترین همسایگی» (K-Nearest Neighbour) اشاره کرد.

در مقالات منتشر شده «مقایسه روش‌های دسته‌بندی برای پیش‌بینی ژن در متاژنومیکس» (A comparison of classification methods for gene prediction in metagenomics) [+] و «پیش‌بینی ژن با استفاده از یادگیری عمیق» (Gene prediction using Deep Learning) [+] از روش‌های مذکور برای پیش‌بینی ژن بیرونی استفاده شده است.

دسته‌بندی پروتئین با هوش مصنوعی در بیوانفورماتیک

پروتئین‌ها «عامل‌های» سلول‌های بدن هستند که بسیاری از کارکردهایی که در نهایت منجر به حیات بشر می‌شود را اجرا می‌کنند. پروتئین‌ها در واقع مسئول آرایه وسیعی از کارکردهای درون اندامگان مانند کارکردهای متابولیک، پاسخ به محرک‌ها، ساختاردهی به سلول‌ها، حمل و نقل مولکول‌ها و بسیاری از دیگر موارد هستند. پروتئین‌ها به وسیله ژن‌ها کدگذاری شده‌اند و مبنای بافت‌های زنده را تشکیل می‌دهند. دسته‌بندی الگوهای پروتئین در سلول‌های انسان یک گام اساسی در درک کامل پیچیدگی بدن انسان است.

کاربردهای هوش مصنوعی در بیوانفورماتیک

با پیشرفت‌های اخیر در میکروسکوپ‌های توان بالا، تصاویر سلولی سریع‌تر از هر تیم انسانی قابل تحلیل و دسته‌بندی هستند. در نتیجه، مدل‌های یادگیری ماشین با دسته‌بندی الگوهای پروتئین در سلول‌های انسان از طریق روش‌های یادگیری ماشین و «بینایی کامپیوتری» (Computer Vision) گوناگون مانند «میدان‌های عصبی پیچشی عمیق» (Deep Convolutional Neural Fields | DCNF) پیشگام هستند. در شرکت هوش مصنوعی «اُپتیما ای‌آی» (Optima AI) روی توسعه مدل دسته‌بندی پروتئینی کار می‌شود که دسته‌بندی‌های چندکلاسی چندبرچسبی را بر اساس تصاویر سلولی تولید شده به وسیله میکروسکوپ‌های توان بالا انجام می‌دهد.

تحلیل بیان ژن

میکروآرایه‌های DNA، یک نوع آز-تراشه (آزمایشگاه روی تراشه | Lab-on-a-Chip | LOC) و در واقع مجموعه‌ای از نقاط دی‌ان‌ای هستند که به یک سطح جامد متصل شده‌اند. میکروآرایه‌ها برای گردآوری و سنجش خودکار سطح بیان ژن در اندامگان مورد استفاده قرار می‌گیرند. بیان ژن فرایندی است که طی آن اطلاعات یک ژن در سنتز محصول کارکردی ژن مورد استفاده قرار می‌گیرد. محصول کارکردی ژن معمولا یک پروتئین یا در زمینه کدگذاری غیر پروتئینی یک آر‌اِن‌ای (اسید ریبونوکلئیک | Ribonucleic Acid) کارکردی است. یادگیری ماشین معمولا در تحلیل‌ها، تعیین الگو و دسته‌بندی بیان ژن مورد استفاده قرار می‌گیرد.

در زمینه پژوهش‌های سرطان، ظهور میکروآرایه‌ها و توالی‌های RNA با روش‌های یادگیری ماشین لبه علم، پتانسیل قابل توجهی را برای شناسایی و دسته‌بندی تومورها در سطح مولکولی از خود نشان داده‌اند. از این رو، پزشکان را قادر به پیشنهاد درمان‌های شخصی‌سازی شده برای بیماران مبتلا به سرطان بر مبنای ساختار ژنتیکی یک تومور خاص می‌سازند. نتایج پژوهشی که با عنوان «روش‌های یادگیری ماشین اعمال شده روی داده‌های میکروآرایه‌های دی‌ان‌ای می‌توانند تشخیص سرطان را بهبود ببخشند» انجام شده است، نتایج و روش‌های یادگیری ماشین مورد استفاده برای مسائل دسته‌بندی را نشان می‌دهد. پیشرفت‌های اخیر در زمینه بیوانفورماتیک و یادگیری ماشین، حاکی از فرصت‌های بسیاری در زمینه ژنتیک، زیست‌شناسی سلولی، پژوهش‌های سرطان و درمان شخصی‌سازی شده است.

اگر نوشته بالا برای شما مفید بوده است، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

telegram
twitter

الهام حصارکی

«الهام حصارکی»، فارغ‌التحصیل مقطع کارشناسی ارشد مهندسی فناوری اطلاعات، گرایش سیستم‌های اطلاعات مدیریت است. او در زمینه هوش مصنوعی و داده‌کاوی، به ویژه تحلیل شبکه‌های اجتماعی، فعالیت می‌کند.

بر اساس رای 2 نفر

آیا این مطلب برای شما مفید بود؟

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *