هوش مصنوعی و اکتشافات علمی جدید بر اساس مقالات قدیمی

پژوهشگران همه روزه قابلیتهای جدیدی از «هوش مصنوعی» (Artificial Intelligence) را کشف میکنند که به بهبود زندگی بشر کمک شایان توجهی میکند. این قابلیتها، گاه حتی از تواناییهای انسان در انجام یک کار خاص نیز فراتر رفته و در اینجا است که هوش مصنوعی گوی سبقت را در انجام امور از انسان میرباید. در یکی از جدیدترین پژوهشهای انجام شده در حوزه هوش مصنوعی، پژوهشگران موفق شدهاند الگوریتم یادگیری ماشینی طراحی کنند که با استفاده از مقالات قدیمی به انجام اکتشافات علمی جدید میپردازد.
در واقع، دانشمندان از «یادگیری ماشین» (Machine Learning) برای کشف دانش جدید از مقالات قدیمی، استفاده کردهاند. در همین راستا، یگ الگوریتم یادگیری ماشین، توانسته است تنها با بهرهگیری از زبان (ادبیات پژوهش) موجود در میلیونها مقاله علمی قدیمی، اکتشافات علمی کاملا جدیدی داشته باشد. در پژوهشی که سوم جولای سال ۲۰۱۹ در نشریه هفتگی جامع «نِیچِر» (Nature) چاپ شده و حاصل کار پژوهشگرانی از «آزمایشگاه ملی لارنس برکلی» (Lawrence Berkeley National Laboratory) است، از الگوریتم Word2Vec به عنوان روشی نام برده شده که برای برقراری ارتباط بین مفاهیم موجود در مقالات قدیمی و کشف آنچه از نظر انسانها دور مانده استفاده شده است. پژوهشگران آزمایشگاه لارنس، از این الگوریتم برای وارسی مقالات علمی قدیمی جهت کشف ارتباطات موجود در آنها که از چشم انسان دور مانده، استفاده کردهاند.
الگوریتم «Word2Vec» پس از بررسی مقالاتی که به آن داده شده، توانسته است پیشبینیهایی را پیرامون مواد «ترموالکتریک» (Thermoelectric) احتمالی انجام دهد (موادی که احتمالا دارای خصوصیت مواد ترموالکتریک هستند) که گرما را به انرژی تبدیل میکنند و در بسیاری از کاربردهای گرمایشی و سرمایشی مورد استفاده قرار میگیرند. این در حالی است که الگوریتم مذکور درکی از مفهوم ترموالکتریک نداشته است. این الگوریتم تنها با استفاده از ارتباطات موجود میان کلمات، کاندیداهایی احتمالی برای مواد ترموالکتریک آتی که کشف خواهند شد را پیشبینی کرده است. امکان دارد این کاندیداها حتی از مواد ترموالکتریک کنونی که در زمینههای مختلف استفاده میشوند نیز بهتر باشند.
«انوبو جین» (Anubhav Jain)، یکی از محققان این پروژه در این رابطه چنین میگوید: «الگوریتم میتواند هر مقالهای در حوزه علم مواد را بخواند، بنابراین میتواند ارتباطاتی را بین آنها پیدا کند که هیچ دانشمندی (انسانی) نتوانسته است. گاهی، این الگوریتم کاری را انجام میدهد که پژوهشگران نیز میتوانند و گاهی میتواند ارتباطات میان رشتهای را پیدا کند». برای آموزش دادن الگوریتم، پژوهشگران، زبان (ادبیات پژوهش) موجود در ۳٫۳ میلیون چکیده مربوط به مقالات علم مواد را با استفاده از الگوریتم، ارزیابی کردهاند و در نهایت این کار با ایجاد واژهنامهای شامل ارتباطات بین کلمات با بالغ بر ۵۰۰,۰۰۰ کلمه به پایان رسیده است. در واقع، پژوهشگران چکیده مقالات را به الگوریتم دادهاند و الگوریتم از یادگیری ماشین برای تحلیل ارتباطات بین کلمات موجود در آنها استفاده کرده است.
جین میگوید: «روش کار Word2vec بدین صورت است که کاربر یک مدل «شبکه عصبی» (Neural Network) را برای حذف هر کلمه و پیشبینی اینکه کلمه بعدی آن چه میتواند باشد آموزش میدهد. با آموزش دادن شبکه عصبی روی یک کلمه، الگوریتم نمایشی از کلمات را در اختیار کاربر قرار میدهد که میتوان از آن برای کسب دانش بهره برد». الگوریتم تنها با استفاده از کلماتی که در چکیدههای مقالات علمی وجود داشته، قادر به درک مفاهیمی مانند جدول تناوبی و ساختار شیمیایی ملکولها بوده است. این الگوریتم، کلماتی را که نزدیک بهم دانسته، به یکدیگر ارتباط داده و برداری از کلمات مرتبط ساخته که به تعریف مفاهیم کمک کرده است. در برخی از موارد، کلماتی به مفاهیم ترموالکتریک مرتبط شدهاند که هرگز در چکیده هیچ یک از مقالاتی که مورد بررسی قرار گرفتهاند به عنوان یک ماده ترموالکتریک پیرامون آنها مطلبی نوشته نشده بوده است. فهمیدن و کشف چنین شکاف دانشی با چشمهای انسانی دشوار و اما برای این الگوریتم کاری آسان است.
پس از آنکه الگوریتم ظرفیت خود برای پیشبینی مواد آینده را نشان داده، پژوهشگران مجددا آن را به شیوه دیگری آزمودهاند. آنها برای این ارزیابی، الگوریتم را روی مقالات قدیمی آزمودهاند تا ببینند که آیا الگوریتم میتواند اکتشافات علمی را قبل از وقوع آنها پیش بینی کند یا خیر؛ این بار نیز الگوریتم به خوبی عمل کرده است. طی یکی از آزمایشهایی که در این راستا انجام شده، پژوهشگران مقالاتی را که پیش از سال ۲۰۰۹ منتشر شده بوده با بهرهگیری از الگوریتم، تحلیل کردهاند. پس از آن، مشاهده شده که الگوریتم در این شرایط نیز قادر به پیشبینی یکی از بهترین مواد ترموالکتریک مدرن روز بوده است. این ماده، چهار سال پس از مقالات مورد بررسی توسط الگوریتم، یعنی در سال ۲۰۱۲ کشف شده است.
این کاربرد جدید از یادگیری ماشین در زمینههایی فراتر از علم مواد در حال پیشروی است. با توجه به اینکه الگوریتم روی مجموعه داده علمی خاصی آموزش داده نشده، کاربران میتوانند به سادگی آن را در دیگر رشتههای علمی نیز به کار ببرند و مجددا آن را روی زبان (ادبیات پژوهش) هر رشته علمی که در نظر دارند آموزش بدهند. «واحه تستویان» (Vahe Tshitoyan) نویسنده اصلی مقاله این پژوهش میگوید: «این الگوریتم، «نظارت نشده» (Unsupervised) است و ارتباطات خاص خودش را روی دادهها میسازد. کاربر میتواند از این الگوریتم برای کارهایی مانند تحقیقات پزشکی یا کشف داروها استفاده کند. اطلاعات در دنیای بیرون هستند؛ اما انسان هنوز ارتباط بین آنها را برقرار نکرده چون نمیتواند همه مقالات را بخواند».
اگر نوشته بالا برای شما مفید بوده است، آموزشهای زیر نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای هوش مصنوعی
- مجموعه آموزشهای پردازش تصویر در متلب
- مجموعه آموزشهای کسب و کار و استارتاپ
- آشنایی با صد استارتاپ برتر هوش مصنوعی در سال 2۰1۹
- مهارتهای مورد نیاز شرکتها در سال 13۹۸ — به همراه منابع یادگیری
- ده زبان برنامهنویسی که باید در سال 13۹۸ یاد بگیرید
- مهارتهای لازم برای فرصتهای شغلی برجسته 2۰1۹
^^
سلام
ممنون از مطلب ترجمه شده. فکر می کنم عبارت
“«انوبو جین» (Anubhav Jain)، یکی از محققان تیم سازنده الگوریتم Word2Vec” صحیح نیست . روش word2vec روشی هست سالها استفاده میشه در واقع این گروه از نویسندگان برای این کار خاص از این روش استفاده کرده اند. یعنی Anubhav Jain محقق این مقاله و تحقیق هست نه از سازندگان word2vec
درود؛
از همراهی شما با مجله فرادرس بسیار سپاسگزارم. اصلاحات لازم در این رابطه، در متن انجام شده است. سپاسگزارم.