داکینگ مولکولی چیست؟ — کاربردها، روش ها و نرم افزارها — به زبان ساده ‌

۴۵۳۲ بازدید
آخرین به‌روزرسانی: ۰۹ اردیبهشت ۱۴۰۲
زمان مطالعه: ۳۹ دقیقه
داکینگ مولکولی چیست؟ — کاربردها، روش ها و نرم افزارها — به زبان ساده ‌

داکینگ مولکولی یک ابزار کلیدی در زیست شناسی مولکولی ساختاری و طراحی داروهای رایانه‌ای است. هدف اتصال لیگاند - پروتئین این است که حالت یا حالت‌های متصل کننده اصلی لیگاند را با پروتئینی دارای ساختار سه بعدی شناخته شده پیش بینی کنیم. در این مطلب به تعریف داکینگ مولکولی و انواع آن و همچنین روش‌های انجام آن با استفاده از نرم افزارهای مختلف می‌پردازیم، علاوه بر این منابع یادگیری داکینگ مولکولی را نیز معرفی می‌کنیم.

فهرست مطالب این نوشته

داکینگ مولکولی چیست؟

«داکینگ مولکولی» (Molecular Docking) یا متصل کردن مولکولی یک روش محاسباتی است که برای پیش‌بینی برهمکنش دو مولکول متصل شونده استفاده می‌شود. داکینگ مولکولی به دلیل توانایی آن در پیش‌بینی اتصال و ترکیب لیگاندهای مولکولی کوچک به محل اتصال مناسب، یکی از متداول‌ترین روش‌ها در طراحی دارو است. تعیین مشخصات و رفتار اتصال دهنده نقش مهمی در طراحی منطقی داروها و همچنین روشن ساختن فرایندهای بیوشیمیایی اساسی دارد.

داکینگ یک روش محاسباتی برای جستجوی یک لیگاند مناسب است که هم از نظر انرژی و هم از نظر هندسی با محل اتصال پروتئین مطابقت دارد. به عبارت دیگر، در مطالعات داکینگ این مسئله مطرح است که چگونه دو یا چند مولکول در اتصال با هم متناسب هستند و مشابه حل کردن یک پازل سه بعدی است.

تعریف داکینگ مولکولی

فرایند داکینگ مولکولی چگونه است؟

داکینگ مولکولی به عنوان ابزار بسیار کارآمد برای کشف داروهای جدید برای هدف قرار دادن پروتئین ثابت شده است. در بین انواع مختلف داکینگ، اتصال پروتئین - لیگاند به دلیل کاربرد آن در صنعت پزشکی از اهمیت خاصی برخوردار است. اتصال پروتئین - لیگاند به جستجوی سازگاری دقیق لیگاند در یک پروتئین هدف هنگامی که ساختار پروتئین‌ها مشخص است اشاره دارد. می‌توان داکینگ مولکولی را به عنوان یک مسئله قفل و کلید در نظر گرفت که در آن می‌خواهیم جهت نسبی صحیح کلید را پیدا کنیم که قفل را باز می‌کند (جایی که در سطح قفل سوراخ کلید وجود دارد، پس از قرار دادن کلید به کدام جهت بپیچد و غیره)، که می‌توان پروتئین را قفل و لیگاند را کلید در نظر گرفت.

در حال حاضر، مکانیک مولکولی پایه اکثر برنامه‌های داکینگ است. مکانیک مولکولی شامل توصیف یک سیستم چند اتمی با استفاده از فیزیک کلاسیک است. پارامترهای تجربی مانند بارها، زاویه‌های پیچشی و هندسی برای محدود کردن تفاوت بین داده‌های تجربی و پیش بینی‌های مکانیک مولکولی استفاده می‌شود. به دلیل کمبودها و محدودیت‌های پارامترهای تجربی، معادلات ریاضی اغلب ممکن است بر اساس محاسبات نظری مکانیک کوانتوم نیمه تجربی و بدوی پارامتر شوند. به این ترتیب، میدان‌های نیروی مولکولی مجموعه‌ای از معادلات با پارامترهای مختلف با هدف نهایی توصیف سیستم‌ها هستند. با استفاده از میدان‌های نیرو، مدل مولکولی و پروتئینی در اوایل دهه 1980 انجام شد.

هدف از گسترش طبیعی این روش‌ها مدل سازی فرآیندهای مولکولی مانند اتصال پروتئین به لیگاند بود. دو روش کلی توسعه داده شد که اولین رویکرد با در نظر گرفتن سفت و سخت بودن جسم است، در این مدل، لیگاند و گیرنده به عنوان دو جسم مستقل در نظر گرفته می‌شوند که بر اساس شکل و حجم یکدیگر را تشخیص می‌دهند. روش دوم، داکینگ انعطاف پذیر است که این رویکرد یک اثر متقابل تشخیص پروتئین - لیگاند بر ترکیب هر قسمت را در نظر می‌گیرد. طی 15 سال گذشته، تعداد مقالات مرتبط با اتصال مولکولی به میزان قابل توجهی افزایش یافته است. تحقیقات داکینگ مولکولی بر شبیه سازی محاسباتی فرآیند تشخیص مولکولی متمرکز است. هدف آن دستیابی به یک ترکیب بهینه برای پروتئین و لیگاند و یافتن جهت نسبی بین پروتئین و لیگاند است تا انرژی آزاد سیستم کلی به حداقل برسد.

رویکردهای داکینگ
این شکل دو رویکرد اصلی برای داکینگ مولکولی را نشان می‌دهد. نمایش شماتیک دو رویکرد اصلی برای اتصال مولکولی: A) ساختار سفت  B) حالت انعطاف پذیر.

سخت افزار مورد نیاز داکینگ مولکولی

قبل از پرداختن به جزئیات علمی روش داکینگ، در مورد الزامات سخت افزاری عمومی برای اجرای کارآمد داکینگ توضیح خواهیم داد. معمولاً محاسبه داکینگ با توجه به CPU سیستم شما زیاد در نظر گرفته نمی‌شود زیرا لیگاندها ممکن است در عرض چند دقیقه متصل شده و ارزیابی شوند. در حال حاضر، تقریباً هر رایانه شخصی (یا لپ تاپ) به اندازه کافی شایسته است که یک رشته عملیات کوچک داکینگ (حدود 500 - 1000 ترکیب) را در یک زمان معقول اجرا کند.

با این حال، غربالگری مجازی مخازن مبتنی بر داکینگ با استفاده از پایگاه‌های داده عمومی می‌تواند به سرعت افزایش یابد (بیش از ۱ میلیون ترکیب)، که نیاز به منابع محاسباتی بیشتری دارد تا طی چند هفته به پایان برسد. در جدول زیر دستورالعمل‌های کلی توصیه شده برای تهیه سخت افزار لازم قبل از اجرای داکینگ مولکولی ارائه شده است.

مقادیر توصیه شدهحداقل قابل پذیرشمشخصات
x86_64i686Processor architecture
۳/۴ گیگاهرتز یا بالاتر۱ گیگا هرتزProcessor clock rate
82Number of threads
4 گیگابایت یا بالاتر۱ گیگا بایتRAM
10 گیگابایت یا بالاتر۱ گیگا بایتHDD

نرم افزارهای داکینگ مولکولی

چندین سرور، مجموعه و نرم افزار برای اتصال مولکولی وجود دارد. هر ابزار از میدان‌های نیرو و الگوریتم‌های متفاوتی برای ایجاد ژست، غربال گری و محاسبه فعل و انفعالات گیرنده - لیگاند استفاده می‌کند. علیرغم این واقعیت که تعداد زیادی برنامه قوی برای داکینگ وجود دارد، پژوهشگر باید در نظر داشته باشد که همه الگوریتم‌های اتصال برای هر سیستم مناسب نیست و به طور کلی توصیه می‌شود از بیش از یک برنامه اتصال استفاده کنید: مطالعات مختلف نشان داده است که به طور کلی، اجتماعی از پروتکل‌های مختلف داکینگ، ارزیابی بهتری از فعل و انفعالات لیگاند - پروتئین و رتبه بندی ژست قابل اطمینان تری را به همراه دارد. جدول زیر لیستی کوتاه از برنامه‌های اصلی داکینگ مولکولی، شامل الگوریتم‌ها و اطلاعات کلی را ارائه می‌دهد.

اسامی نرم افزارهاالگوریتم جستجونوع نرم افزار
AUTODOCK4الگوریتم ژنتیک «لامارکیان» (Lamarckian)آکادمیک
DOCK«تطبیق شکل» (Shape matching)آکادمیک
OEDOCKING«تطبیق شکل» (Shape matching)اکادمیک
FLEKSY«مبتنی بر گروه» (Ensemble-based)تجاری
SWISSDOCKبهینه سازی تکاملیآکادمیک
GOLDالگوریتم ژنتیکتجاری
VINA«بهینه سازی محلی» (Local optimization)آکادمیک
RDOCKترکیبیآکادمیک
LEDOCKانلینگ شبیه سازی شدهآکادمیک
HADDOCKترکیبیآکادمیک
MOEترکیبیتجاری
SURFLEX-DOCK«تطبیق شکل» (Shape matching)تجاری
FLEXX«تطبیق شکل» (Shape matching)تجاری
FITTEDترکیبیتجاری
LIGANDFIT«تطبیق شکل» (Shape matching)تجاری

بهترین نرم افزار برای داکینگ مولکولی کدام است؟

نرم افزارهای آکادمیک یا رایگان به دلیل سهولت دسترسی، نقطه شروع خوبی است. متأسفانه اکثر این برنامه‌ها دارای یک منحنی یادگیری کند هستند (به عنوان مثال DOCK ، rDock و PLANTS). یکی از این دلایل عدم تسلط کاربران عادی به استفاده از سیستم عامل‌های لینوکس و شبه اونیکس است. این بدان معنا نیست که نرم افزار اتصال به سیستم عامل‌های مبتنی بر UNIX منحصر به فرد است، فقط برخی برنامه‌ها برای اجرای صحیح آن‌ها به مترجمان مانند Cygwin یا Git وابسطه هستند. با این وجود، نصب و استفاده از چنین ابزارهایی ممکن است به ویژه برای کاربران مبتدی مشکل ساز باشد. به عبارت دیگر نرم افزارهای داکینگ مولکولی برای ویندوز طراحی نشده اند و بسیاری از مشکلات افراد مبتدی در صورتی که از ابتدا با لینوکس کار کنند به وجود نخواهد آمد.

با این وجود، اگر افراد نیازمند نرم افزارهای هماهنگ با ویندوز برای انجام داکینگ مولکولی هستند ابزارهایی مانند، Autodock و Vina (به همراه AutodockTools) برای این پلتفرم در دسترس هستند. گزینه دیگر برای ویندوز LeDock است که دارای GUI ساده و در عین حال موثر است (اگرچه غربالگری مجازی برای لینوکس اجرا شده است). در صورت استفاده از بیش از یک برنامه، میزان موفقیت بالاتری در فرایند داکینگ مولکولی وجود دارد. با این حال، همانطور که در ادامه مورد بحث قرار گرفته است انتخاب مجموعه‌ای از برنامه‌های مختلف باید با دقت انجام شود تا از پاسخ مثبت کاذب جلوگیری شود. توصیه‌های زیر در مورد استفاده از برخی از برنامه‌های داکینگ می‌تواند مفید باشد.

  • Vina یک نقطه شروع عالی است و ممکن است به دلیل عملکرد خوب در برابر چندین خانواده پروتئینی به عنوان نرم افزار بسیار کاربردی شناخته شود. این برنامه با توجه به مشتقات مختلفی که دارد ویژگی‌های اضافی و سهولت استفاده را به کاربر ارائه می‌دهد.
  • LeDock یک برنامه نسبتا جدید است. استفاده ساده و محاسبات سریع از نقاط قوت اصلی آن است. همچنین، ژست‌ها خوشه بندی قابل توجهی را نشان می‌دهند. این برنامه معمولا همراه LePro بوده که یک ماژول آماده سازی است.
  • MOE رابط کاربری گرافیکی خوبی دارد و بسیار بصری است. همچنین برای داکینگ، چندین الگوریتم جستجو و توابع نمره گذاری دارد. علاوه بر این، MOE از ابزارهای اضافی مانندMOPAC ، GAMESS ، Gaussian ، NAMD ، FlexX ، GOLD و OMEGA پشتیبانی می‌کند. از نقاط ضعف آن نتایج غیرمنتظره با ماژول آماده سازی پروتئین بوده زیرا در برخی موارد هزینه‌های اشتباه را به همراه دارد.
  • DOCK یکی از اولین برنامه‌های داکینگ مولکولی بوده که توسعه داده شده است. نسخه فعلی آن DOCK6، توابع امتیاز دهی جدید و روش‌های تجزیه و تحلیل را معرفی می‌کند. همانطور که قبلاً ذکر شد، این یکی از معدود برنامه‌هایی با پیاده سازی GPU برای نمره گذاری AMBER و محاسبه PBSA/GBSA برای مجتمع‌های لیگاند - پروتئین است. از آنجا که برای کار با DockPrep طراحی شده است، دانلود و استفاده از USCF Chimera مورد نیاز است، با این وجود این امر امکان معرفی یک ابزار بسیار مفید و کارآمد دیگر را می‌دهد. معایب نسبی DOCK این است که فقط در لینوکس اجرا می‌شود، در مقایسه با سایر برنامه‌ها نیاز به تجربه‌ای در تدوین نرم افزار و عملکرد ضعیف نسبی امتیازبندی پیش فرض دارد.
  • rDock یک برنامه قوی مبتنی بر لینوکس با عملکرد قابل توجه است. منحنی یادگیری کند آن ممکن است یکی از ضعف‌های اصلی آن باشد به ویژه اگر کاربر نهایی هرگز از لینوکس استفاده نکرده باشد، ممکن است مشکلاتی را ایجاد کند. علاوه بر این، rDock ماژول آماده سازی ندارد.

مکانیک داکینگ مولکولی

برای اجرای صفحه داکینگ، اولین عامل مورد نیاز ساختار پروتئین مورد نظر است. معمولاً ساختار با استفاده از تکنیک بیوفیزیکی مانند کریستالوگرافی اشعه ایکس، طیف سنجی NMR یا میکروسکوپ الکترونی کرایو (Cryo - EM) تعیین شده است، اما می‌تواند از ساختار مدل سازی همولوژی نیز ناشی شود. این ساختار پروتئینی و یک پایگاه داده از لیگاندهای بالقوه به عنوان ورودی یک برنامه داکینگ است. موفقیت یک برنامه داکینگ به دو جزء بستگی دارد: الگوریتم جستجو و عملکرد امتیازدهی. در ادامه به بررسی هر کدام می‌پردازیم.

الگوریتم جستجو

فضای جستجو از نظر تئوری شامل تمام جهت گیری‌ها و تطابق پروتئین همراه با لیگاند است. با این حال، در عمل با منابع محاسباتی فعلی، امکان جستجوی جامع فضای جستجو وجود ندارد. این جستجو شامل شمارش همه حالت‌های احتمالی هر مولکول (مولکول‌ها پویا هستند و در مجموعه‌ای از حالت‌های تطبیقی ​​وجود دارند) و همه جهت‌های چرخشی و برگشتی لیگاند نسبت به پروتئین است. بیشتر نرم افزارهای داکینگ در حال استفاده کل فضای سازنده لیگاند (لیگاند انعطاف پذیر) را در بر می‌گیرد و چندین برنامه سعی می‌کنند یک گیرنده پروتئینی انعطاف پذیر را مدل سازی کنند. به هر عکس فوری این جفت (لیگاند و پروتئین) به عنوان «ژست» (pose) قرارگیری مولکول‌ها اشاره می‌شود. انواع استراتژی‌های جستجوی سازگاری برای لیگاند و گیرنده اعمال شده است که شامل موارد زیر هستند:

  • جستجوهای پیچشی سیستماتیک یا تصادفی در مورد پیوندهای قابل چرخش.
  • شبیه سازی دینامیک مولکولی
  • الگوریتم‌های ژنتیک برای تکامل سازگاری‌های جدید با انرژی کم و در جایی که نمره هر ژست به عنوان عملکرد مناسب برای انتخاب جهت تکرار بعدی عمل می‌کند.

الگوریتم‌های جستجو بر اساس عوامل مختلفی از جمله انعطاف پذیری لیگاند و انعطاف پذیری گیرنده کار می‌کنند که در ادامه به طور مفصل‌تر درباره هر کدام صحبت کرده ایم.

مکانیک داکینگ مولکولی
در این تصویر نشان داده شده است که هر اندازه انعطاف پذیری پروتئین و لیگاند بیشتر باشد بررسی پیچیدگی ساختار نهایی سخت‌تر خواهد بود.

انعطاف پذیری لیگاند

تغییر شکل لیگاند ممکن است در غیاب گیرنده ایجاد شده و متعاقباً متصل شود یا ممکن است هنگام پرواز در حضور حفره اتصال گیرنده، یا با انعطاف پذیری کامل چرخشی در هر قلاب دوضلعی با استفاده از اتصال قطعه‌ای ایجاد شود. ارزیابی انرژی میدان نیرو اغلب برای انتخاب سازگاری منطقی از نظر انرژی مورد استفاده قرار می‌گیرد، اما روش‌های دانش بنیان نیز استفاده شده است. پپتیدها مولکول‌های بسیار انعطاف پذیر و نسبتاً بزرگ هستند، که انعطاف پذیری، مدل سازی آن‌ها را به یک کار چالش برانگیز تبدیل می‌کند. تعدادی از روش‌ها برای مدل سازی کارآمد انعطاف پذیری پپتیدها در هنگام اتصال پروتئین - پپتید توسعه داده شده است.

انعطاف پذیری گیرنده

ظرفیت محاسباتی در دهه گذشته به طرز چشمگیری افزایش یافته است و امکان استفاده از روش‌های پیچیده‌تر و محاسباتی بیشتر در طراحی داروها با رایانه را ممکن ساخته است. با این حال، برخورد با انعطاف پذیری گیرنده در روش‌های داکینگ هنوز هم یک مسئله سخت است. دلیل اصلی این دشواری تعداد زیادی از درجه‌های آزادی است که باید در این نوع محاسبات در نظر گرفته شود. با این حال، غفلت از آن، در برخی موارد ممکن است منجر به نتایج ضعیف اتصال از نظر پیش بینی ژست اتصال شود. ساختارهای استاتیک متعددی که به صورت تجربی برای پروتئین یکسان در ترکیبات مختلف تعیین می‌شوند، اغلب برای شبیه سازی انعطاف پذیری گیرنده نیز مورد استفاده قرار می‌گیرند.

عملکرد امتیاز بندی

برنامه‌های داکینگ تعداد زیادی از لیگاند‌های بالقوه را ایجاد می‌کند که برخی از آن‌ها به دلیل برخورد با پروتئین بلافاصله رد می‌شوند. بقیه با استفاده از برخی از توابع نمره گذاری ارزیابی می‌شوند، که یک حالت را به عنوان ورودی می‌گیرد و عددی را برمی‌گرداند که نشان می‌دهد این ژست بیان‌گر یک تعامل اتصالی مطلوب است و یک لیگاند را نسبت به دیگری رتبه بندی می‌کند. بیشتر توابع نمره دهی، میدان‌های مکانیکی مولکولی مبتنی بر فیزیک هستند که انرژی یک حالت قرارگیری خاص در محل اتصال را تخمین می‌زنند. مشارکت‌های مختلف در اتصال را می‌توان به عنوان یک معادله جمع نوشت:

$$ \large \Delta G_{bind} = \Delta G_{solvent}+\Delta G_{conf}+\Delta G_{int}+\Delta G_{rot}+\Delta G_{t/t}+\Delta G_{vib} $$

اجزاء این معادله شامل اثرات حلال، تغییرات سازنده در پروتئین و لیگاند، انرژی آزاد به دلیل برهم کنش پروتئین و لیگاند، چرخش‌های داخلی، انرژی پیوند لیگاند و گیرنده برای ایجاد یک انرژی واحد پیچیده و آزاد به دلیل تغییر در حالت‌های ارتعاشی هستند. انرژی کم (منفی) نشان دهنده یک سیستم پایدار و در نتیجه یک فعل و انفعال احتمالی الزامی است. رویکردهای جایگزین از توابع نمره گذاری اصلاح شده استفاده می‌کند تا محدودیت‌های بر اساس فعل و انفعالات کلیدی پروتئین - لیگاند یا پتانسیل‌های مبتنی بر دانش ناشی از فعل و انفعالات مشاهده شده در پایگاه‌های بزرگ داده مربوط به ساختارهای لیگاند پروتئین (به عنوان مثال بانک داده پروتئین) را شامل شود. تعداد زیادی از ساختارهای کریستالوگرافی اشعه ایکس برای اجتماع بین پروتئین‌ها و لیگاندهای با میل بالا اما تعداد نسبتاً کمتر برای لیگاندهای با میل کم وجود دارد، زیرا ترکیبات بعدی دارای ثبات کمتری هستند و بنابراین تبلور آن‌ها دشوارتر است.

امتیازدهی توابع آموزش داده شده با این داده‌ها می‌تواند لیگاندهای با میل بالا را به طور صحیح متصل کند، اما همچنین برای لیگاندهایی که متصل نمی‌شوند، سازگاری متقابل منطقی ایجاد می‌کند. این تعداد زیادی از ضربه‌های مثبت کاذب را ایجاد می‌کند، به عنوان مثال، لیگاندهایی که پیش بینی می‌شود به پروتئین متصل می‌شوند که در صورت قرار گرفتن در یک لوله آزمایشی در واقع متصل نمی‌شوند. یکی از راه‌های کاهش تعداد موارد مثبت کاذب محاسبه مجدد انرژی موقعیت‌های قرارگیری بهتر با استفاده از تکنیک‌های دقیق‌تر اما دارای محاسبات بیشتر مانند روش‌های Generalized Born یا پواسون - بولتزمن است.

انواع داکینگ مولکولی

همانطور که گفته شد تداخل بین پروتئین‌ها و سایر مولکول‌ها نقش مهمی در فرایندهای مختلف بیولوژیکی از جمله رونویسی و بیان ژن، تنظیم متابولیک، انتقال سیگنال و ارتباط سلولی ایفا می‌کند. آگاهی از جنبه‌های ساختاری یک پروتئین با شریک اتصال دهنده آن می‌تواند به درک مکانیسم چنین تعاملی کمک کند و بنابراین برای کشف و توسعه دارو مهم است. با این حال، بدست آوردن ساختارهای پیچیده با روش‌های آزمایشی مانند کریستالوگرافی اشعه ایکس یا NMR همچنان مشکل و گران قیمت است. بنابراین، داکینگ مولکولی یک رویکرد مهم برای پیش بینی ساختارهای سه بعدی این قطعات مکمل در نظر گرفته می‌شود. انواع اتصالات مولکول‌های مختلف با استفاده از داکینگ انجام می‌گیرند که در ادامه آن‌ها را مورد بررسی قرار داده ایم.

داکینگ پروتئین - لیگاند چیست؟

در مورد «اتصال پروتئین - لیگاند» (Protein - Ligand Docking) می‌توان گفت تعامل بین پروتئین‌ها و لیگاندهای هم رده آن‌ها نقش مهمی در بسیاری از فرایندهای بیولوژیکی ضروری و مسیرهای متابولیک از جمله هدایت سیگنال، نقل و انتقالات سلولی، تنظیم چرخه سلول، کنترل بیان ژن و مهار آنزیم دارد. بسیاری از تکنیک‌های تجربی در حال حاضر برای تشخیص و اندازه گیری این فعل و انفعالات داکینگ در دسترس هستند، اما به دست آوردن ساختارهای پیچیده با روش‌های آزمایشی مانند کریستالوگرافی اشعه ایکس یا NMR دشوار و گران قیمت است. بنابراین، داکینگ مولکولی یک رویکرد مهم برای مطالعه برهمکنش پروتئین - لیگاند و کشف و توسعه دارو در نظر گرفته می‌شود. امروزه از پیشرفته ترین ابزارهای نرم افزاری مربوط به لیگاند و پروتئین برای پیش بینی موقعیت و جهت یک لیگاند در زمان اتصال به گیرنده پروتئین با محاسبه مکان، هندسه و انرژی استفاده می‌شود.

فرایند داکینگ مولکولی یک لیگاند به جایگاه اتصال، از بر هم کنش طبیعی لیگاند و گیرنده آن از طریق کمترین مسیر انرژی تقلید می‌کند. به طور معمول روش‌های مدل سازی با یک هدف از ساختار شناخته شده مانند ساختار کریستالوگرافی یک پروتئین مورد علاقه شروع می‌شوند. سپس از داکینگ برای پیش بینی اتصال کانفورماسیون و انرژی آزاد اتصال مولکول‌های کوچک به هدف استفاده می‌شود. هر پروتکل اتصال را می‌توان ترکیبی از یک الگوریتم جستجو و یک تابع نمره گذاری توصیف کرد. الگوریتم جستجو تعداد زیادی حالت از یک مولکول کوچک را در محل اتصال در نظر می‌گیرد و اجازه می‌دهد درجه آزادی سیستم پروتئین - لیگاند به اندازه کافی نمونه برداری شود تا حالت‌های اتصال واقعی را شامل شود. تابع نمره گذاری نمره یا میل پیوندی یک ژست خاص که نشان دهنده ترمودینامیک فعل و انفعال سیستم پروتئین - لیگاند است را به منظور تشخیص حالت‌های اتصال واقعی از سایر موارد مورد بررسی و رتبه بندی آن‌ها بر این اساس محاسبه می‌کند.

آزمایش‌های داکینگ تکی برای بررسی عملکرد پروتئین، مطالعه مهارکننده‌ها و بسترهای آنزیمی و روشن شدن مسیرهای بیوشیمیایی مفید هستند. مهم‌تر از همه، داکینگ می‌تواند برای غربالگری مجازی پایگاه داده‌های بزرگ مواد شیمیایی موجود برای تشخیص و بهینه سازی مقادیر ترکیبات پیشرو دارویی استفاده شود، که فرصت‌های بی نظیری را برای طراحی و کشف دارو بر اساس ساختار ارائه می‌دهد.

فرایند داکینگ مولکولی
در این تصویر مراحل انجام داکینگ لیگاند - پروتئین نشان داده شده است.

داکینگ پروتئین - پروتئین

در رابطه با «اتصال پروتئین - پروتئین» (Protein - Protein Docking) باید گفت برهم کنش‌های پروتئین و پروتئین در جنبه‌های مختلف فرایندهای سلولی، از جمله کنترل متابولیک، انتقال سیگنال، تنظیم بیان ژن و ارتباطات سلولی، نقش اساسی دارند. مطالعات پروتئومیکس در سطح ژنوم، لیستی رو به افزایش از پروتئین‌های متقابل را ارائه می‌دهد، اما تنها بخش کوچکی از کمپلکس‌های بالقوه قابل تجزیه و تحلیل تجربی مستقیم است. دانستن جزئیات ساختاری یک برهمکنش پروتئین و پروتئین به ما کمک می‌کند تا مکانیسم تعامل‌های این‌چنین و در نتیجه عملکرد پروتئین‌های شرکت کننده را درک کنیم. با این حال، بدست آوردن ساختارهای کریستالی مجتمع‌های پروتئینی از پروتئین‌های تکی دشوارتر است. علاوه بر این، بسیاری از فعل و انفعالات پروتئینی گذرا هستند، که مطالعه آن‌ها را با کریستالوگرافی و NMR مشکل ساز می‌کند. بنابراین، نیاز به رویکردهای محاسباتی سریع و قوی برای پیش بینی قابل اعتماد ساختار مجتمع‌های پروتئین و پروتئین در حال افزایش وجود دارد.

داکینگ پروتئین - پروتئین، پیش بینی محاسباتی ساختار پیچیده پروتئین با توجه به ساختار پروتئینی جزء جداگانه حل شده است، همانطور که در یک موجود زنده رخ می‌دهد. امروزه از پیشرفته ترین ابزارهای نرم افزاری برای پیدا کردن تغییر و ترکیب نسبی دو پروتئین استفاده می‌شود که منجر به یک مجموعه پایدار (از نظر انرژی مطلوب) خواهد شد. فرآیند داکینگ از دو مرحله اصلی تشکیل شده است: 1) ایجاد مجموعه‌ای از پیکربندی‌ها که به طور قابل اعتماد حداقل یک مورد تقریباً صحیح را شامل می‌شود و 2) تشخیص قابل اطمینان پیکربندی‌های صحیح از سایر موارد با کمک عملکرد نمره گذاری. در روش‌های جدید از جستجوی جهانی ساختار سفت و سخت بر اساس رویکرد همبستگی Fast Fourier Transform (FFT) شروع می‌شود که از فضای چرخشی و ترجمه‌ای یک پروتئین در حالی که پروتئین دیگر را تثبیت می‌کند نمونه می‌گیرد.

اگر جایگاه‌های اتصال شناخته شده اند، می‌توان از این اطلاعات برای کاهش فضای جستجو استفاده کرد. کانفورماسیون‌های ایجاد شده سپس بر اساس شکل مکمل، الکترواستاتیک و امحاء درجه بندی و رتبه بندی شده و نتایج به دست آمده برای یافتن کانفورماسیون‌های بسیار کم انرژی جمع آوری می‌شوند. ساختار (های) کمپلکس نماینده را می‌توان با به حداقل رساندن انرژی غربال کرد. تکنیک‌های اتصال محاسباتی برای جستجوی همه حالت‌های اتصال احتمالی در فضای ترجمه و چرخش بین دو پروتئین استفاده می‌شود و هر ژست را با استفاده از یک تابع امتیازدهی مبتنی بر انرژی ارزیابی می‌کند. این یک وسیله مهم برای درک نیروهای فیزیک و شیمیایی است که زیربنای فعل و انفعالات ماکرومولکولی را تشکیل می‌دهند و یک ابزار ارزشمند برای مدل سازی ساختارهای پیچیده پروتئینی در سطح اتمی است. همچنین درک دقیق فعل و انفعالات پروتئین و پروتئین برای اهداف دخیل در بیماری برای طراحی منطقی داروهای مبتنی بر بیولوژی بسیار مهم‌تر است.

داکینگ پروتئین - پروتئین
در این تصویر مراحل داکینگ پروتئین - پروتئین نشان داده شده است.

داکینگ پروتئین - پپتید

در رابطه با «اتصال پروتئین - پپتید» (Protein - Peptide Docking) می‌توان گفت برهم کنش بین پروتئین‌ها و پپتیدها نقش اساسی در ارگانیسم‌های زنده ایفا می‌کند و می‌توان آن‌ها را در انواع مسیرهای سیگنالینگ که در محل سلولی، پاسخ ایمنی یا بیان و تخریب پروتئین نقش دارند، پیدا کرد. تداخلات نادرست پروتئین و پپتید با تعدادی از بیماری‌ها (مانند سرطان، بیماری‌های خود ایمنی) همراه است. درک تداخل پروتئین - پپتید برای طراحی دارویی هدفمند است و ویژگی ساختاری آن‌ها موضوع داغ تحقیقات تجربی و نظری فعلی است. امروزه از پیشرفته ترین ابزارهای نرم افزاری برای مدل سازی برهمکنش پروتئین - پپتید و پیش بینی ساختار پیچیده استفاده می‌شود. روش کلی مدل سازی به دو مرحله تقسیم شده است: اول یک جستجوی کلی برای پیش بینی محل اتصال در سطح گیرنده پروتئین انجام می‌شود و در مرحله دوم یک روش اتصال محلی انعطاف پذیر برای مناسب سازی ساختار پپتید در محل اتصال شناخته شده استفاده می‌شود.

این دو مرحله تغییرات قابل توجهی را در هنگام اتصال دو جزء در نظر می‌گیرند. فرآیند تاشو پپتید به صراحت در پروتکل اتصال شبیه سازی شده است. هنگامی که داده‌های تجربی یا پیش بینی شده در مورد بقایای محل اتصال در دسترس است، از چنین اطلاعاتی می‌توان برای محدود کردن اتصال به مناطق محلی سطح پروتئین استفاده کرد. در نهایت، سازه‌های دارای نمره برتر، خوشه بندی شده، رتبه بندی شده و نمایندگان بزرگ‌ترین خوشه‌ها قبل از ارائه برای اصلاح ساختاری با وضوح بالا انتخاب می‌شوند. امروزه از تکنیک‌های اتصال محاسباتی برای جستجوی همه حالت‌های اتصال احتمالی در فضای ترجمه و چرخشی بین گیرنده پروتئین و شریک اتصال دهنده پپتید استفاده می‌کند.

با توجه به ساختار گیرنده پروتئین و توالی پپتیدی، با استفاده از داکینگ مولکولی ساختار کمپلکس پروتئین - پپتید پیش بینی می‌شود که از ترکیبات و موقعیت‌های تصادفی پپتید شروع می‌شود. این یک وسیله مهم برای درک نیروهای فیزیک و شیمیایی است که زیربنای فعل و انفعالات ماکرومولکولی را تشکیل می‌دهند و یک ابزار ارزشمند برای مدل سازی ساختارهای پیچیده پروتئین - پپتید در سطح اتمی است. علاوه بر این، درک دقیق این تعاملات، طراحی منطقی پپتیدهای بالقوه درمانی را تسهیل می‌کند.

داکینگ پپتید - پروتئین
در این تصویر مراحل داکینگ پروتئین و پپتید نشان داده شده است.

داکینگ آنتی بادی - آنتی ژن

در مورد «اتصال آنتی بادی - آنتی ژن» (Antibody - Antigen Docking) می‌توان گفت آنتی بادی‌ها عناصر اصلی تشخیص سیستم ایمنی هستند که محکم و به طور خاص به آنتی ژن‌های مختلف متصل می‌شوند تا فعالیت آن‌ها را مسدود کرده یا آن‌ها را برای نابودی مشخص کنند. آنتی بادی‌ها به طور فزاینده‌ای به عنوان ابزارهای تشخیصی و داروهای درمانی مورد استفاده قرار می‌گیرند و یکی از اجزای مهم فرایند طراحی و مهندسی آنتی بادی، در دسترس بودن ساختار سه بعدی با کیفیت بالا از مجتمع‌های آنتی بادی و آنتی ژن است. کریستالوگرافی اشعه ایکس دقیق ترین و صحیح ترین اطلاعات را در مورد ساختار پروتئین و فعل و انفعالات آن ارائه می‌دهد، اما کریستالیزاسیون مجتمع‌های آنتی بادی و آنتی ژن یک چالش عمده است و تعداد ساختارهای آنتی بادی تعیین شده در مجتمع با آنتی ژن‌های آن‌ها هنوز نسبتاً کم است. در مقابل، مدل سازی محاسباتی یک مسیر سریع و ارزان را برای ایجاد مدل‌های ساختاری برای چنین مجموعه هایی فراهم می‌کند.

دومین‌های متغیر (Fvs) زنجیره سنگین و سبک مورد توجه ویژه‌ای در مدل سازی محاسباتی هستند، زیرا معمولاً بیشتر یا همه ویژگی یک آنتی بادی را برای هدف آنتی ژن خود نشان می‌دهند. امروزه پروتکل مدل سازی پیشرفته، برهم کنش‌های آنتی بادی و آنتی ژن و همچنین انعطاف پذیری مطلوب منطقه CDR (به ویژه حلقه H3) را در نظر می‌‌گیرد و از جدیدترین ابزارهای نرم افزاری داکینگ برای یافتن تغییر و ترکیب نسبی آنتی بادی و آنتی ژن دخیل در تشکیل کمپلکس با انرژی مطلوب استفاده می‌کند. روش‌های کلی عبارتند از: اول، یک جستجوی ساختار سفت و سخت انجام می‌شود و مدل‌های پیچیده آنتی بادی - آنتی ژنی از نظر هندسی قابل قبول تولید می‌شوند. در این فرایند محدودیت‌های تعریف شده توسط کاربر (به دست آمده از داده‌های تجربی) می‌تواند برای محدود کردن فضای جستجو اعمال شود.

مدل‌های بدست آمده با استفاده از یک تابع نمره گذاری، که بطور خاص برای سیستم‌های آنتی بادی توسعه یافته است، نمره گذاری و رتبه بندی می‌شوند. سپس سازه‌های دارای بهترین نمره دسته‌بندی می‌شوند و نمایندگان بزرگ‌ترین دسته‌ها برای بهینه سازی ساختاری با کم کردن انرژی قبل از ارائه انتخاب می‌شوند. امروزه از تکنیک‌های داکینگ محاسباتی برای جستجوی همه حالت‌های اتصال احتمالی در فضای ترجمه و چرخش بین یک آنتی بادی (Fv ، Fab یا آنتی بادی کامل) و آنتی ژن آن با مدل سازی تغییرات تطبیقی ​​حلقه‌های متغیر بر روی تشکیل کمپلکس استفاده می‌شود. این یک وسیله مهم برای درک نیروهای فیزیک و شیمیایی است که زیربنای فعل و انفعالات ماکرومولکولی را تشکیل می‌دهند و یک فرضیه کار بر اساس مجموعه کمپلکس ایجاد می‌شود و هدایت آزمایش‌های بیشتر برای طراحی منطقی درمان‌های مبتنی بر آنتی بادی را انجام دهد.

داکینگ آنتی ژن - آنتی بادی
در این تصویر مراحل انجام داکینگ آنتی بادی - آنتی ژن نشان داده شده است.

داکینگ پروتئین - اسید نوکلئیک

در مورد «اتصال پروتئین - اسید نوکلئیک» (Protein - Nucleic Acid Docking) باید گفت که فعل و انفعالات بین پروتئین و اسیدهای نوکلئیک در فرآیندهای مختلف بیولوژیکی ضروری، از جمله تکثیر DNA، رونویسی RNA، پیوند RNA، تخریب اسیدهای نوکلئیک و سنتز پروتئین، نقش اساسی دارند. نقص در برهم کنش پروتئین و اسید نوکلئیک در تعدادی از بیماری‌ها از اختلالات عصبی گرفته تا سرطان دخیل است. درک ما از این فرآیندها با حل شدن ساختارهای جدید مجتمع‌های پروتئین - اسید نوکلئیک و تجزیه و تحلیل جزئیات ساختاری فعل و انفعالات بهبود می‌یابد. با این حال، تعیین تجربی اکثر ساختارهای پیچیده پروتئین - اسید نوکلئیک با روش‌های با وضوح بالا یک فرایند خسته کننده و دشوار است. تکنیک‌های محاسباتی مکمل رویکردهای تجربی در روشن کردن برهمکنش‌های پروتئین و اسید نوکلئیک است.

در داکینگ In Silico پروتئین‌ها و اسیدهای نوکلئیک، با ایجاد مدل‌های نظری ساختارهای پیچیده در جزئیات اتمی، می‌تواند اطلاعات کافی برای ایجاد یک فرضیه و راهنمایی تجزیه و تحلیل‌های تجربی بیشتر برای شناسایی اسیدهای آمینه مهم یا بقایای نوکلئوتیدها را ارائه دهد. امروزه از پیشرفته ترین نرم افزارهای محاسباتی برای پیدا کردن تغییر و ترکیب نسبی پروتئین و اسید نوکلئیک دخیل در تشکیل کمپلکس با انرژی مطلوب استفاده می‌شود. روش‌های کلی عبارتند از: اول، یک جستجوی جامع ساختار سخت انجام می‌شود و ساختارهای پیچیده پروتئین - اسید نوکلئیک قابل قبول از نظر هندسی ایجاد می‌شوند. در این فرایند می‌توان محدودیت‌های تعریف شده توسط کاربر را برای محدود کردن فضای جستجو اعمال کرد. مدل‌های بدست آمده با استفاده از پتانسیل‌های آماری، به طور خاص برای مجموعه‌های پروتئین - RNA یا پروتئین - DNA، نمره گذاری و رتبه بندی می‌شوند.

سپس سازه‌های دارای بهترین نمره خوشه بندی می‌شوند و نمایندگان بزرگ‌ترین خوشه‌ها برای بهینه سازی ساختاری با کم کردن انرژی قبل از ارائه انتخاب می‌شوند. در روش‌های جدید داکینگ از تکنیک‌های محاسباتی برای جستجوی همه حالت‌های اتصال احتمالی در فضای ترجمه و چرخش بین پروتئین و اسیدهای نوکلئیک (DNA ، RNA یا DNA/RNA ترکیبی) استفاده می‌شود که می‌تواند بر اساس شکل گیری پیچیده تغییر شکل بسیار زیادی را متحمل شود. این یک وسیله مهم برای درک نیروهای فیزیکوشیمیایی است که زیربنای فعل و انفعالات ماکرومولکولی را تشکیل می‌دهند و یک ابزار ارزشمند برای مدل سازی ساختارهای پیچیده پروتئین - اسید نوکلئیک در سطح اتمی است. علاوه بر این، درک دقیق این فعل و انفعالات شامل اهداف دخیل در بیماری برای طراحی منطقی درمان‌های بیولوژیکی بسیار مهم‌تر است.

داکینگ پروتئین - اسید نوکلئیک
در این تصویر مراحل انجام داکینگ پروتئین و اسیدهای نوکلئیک مانند DNA و RNA نشان داده شده است.

داکینگ پروتئین - لیپید

در رابطه با «اتصال پروتئین - لیپید» (Protein - Lipid Docking) می‌توان گفت که پروتئین‌های غشایی نقش مهمی در طیف وسیعی از عملکردهای سلولی ایفا می‌کنند. ثابت شده است که اتصال پروتئین‌ها به غشاهای بیولوژیکی، سیگنال دهی سلولی و بسیاری دیگر از رویدادهای مهم سلولی را از طریق مکانیسم‌های مختلف تنظیم می‌کند. برهم کنش‌های درون بدن با لیپیدهای غشایی به تثبیت ساختار این پروتئین‌ها و ترویج ترتیب مجدد، مونتاژ، تفکیک یا تغییرات ساختاری در بسیاری از حوزه‌های ساختاری پروتئین، که منجر به فعال شدن فعالیت بیولوژیکی آن‌ها می‌شود، کمک می‌کند. برخی از پروتئین‌های سیتوزولیک از طریق حوزه‌های ساختاری خاص غشای سلولی جذب می‌شوند. علاوه بر این، چربی‌ها نیز بسترهای طبیعی بسیاری از آنزیم‌های مهم در مسیرهای متابولیکی کلیدی هستند. بنابراین، درک تعامل بین پروتئین‌ها و چربی‌ها از اهمیت بسیار بالایی برخوردار است.

تداخل پروتئین - لیپید با تشکیل پیوندهای هیدروژنی بین مولکولی، فعل و انفعالات واندروالس، برهم کنش‌های آبگریز و پل‌های یونی (به ویژه باقی مانده‌های آسپارتات یا گلوتامات) بین پروتئین و لیگاند چربی تثبیت می‌شود. از نرم افزارهای محاسباتی پیشرفته برای پیش بینی این برهمکنش‌های پروتئین و لیپید استفاده می‌شود. محل اتصال چربی یک پروتئین را می‌توان از توالی اسید آمینه آن یا از ساختار سه بعدی آن با استفاده از پروتکل‌های اتصال مولکولی پیش بینی کرد. برخی از روش‌های داکینگ اطلاعات توالی و ساختار را ترکیب کرده و از نظر انرژی مطلوب ترین مجموعه پروتئین - لیپید را پیدا می‌کنند. همچنین پایداری مجموعه‌های متصل را می‌توان از طریق شبیه سازی‌های دینامیک مولکولی بیشتر آزمایش کرد.

داکینگ پروتئین - لیپید
در این تصویر مراحل انجام داکینگ پروتئین با لیپید یا لیپیدهای مختلف مشاهده می‌شود.

داکینگ پروتئین - کربوهیدرات

در مورد «اتصال پروتئین - کربوهیدرات» (Protein - Carbohydrate Docking) باید گفت کربوهیدرات‌ها در بسیاری از مسیرهای مهم سیگنالینگ نقش دارند و تشخیص کربوهیدرات‌ها جزء کلیدی بسیاری از فرایندهای بیولوژیکی از جمله ایمنی ذاتی، متابولیسم و ​​پاسخ ایمنی است. به عنوان مثال، گلیکان‌هایی که روی سطوح سلولی یا مولکول‌های بیولوژیکی ترشح شده قرار دارند، نقش مهمی در برهمکنش سلول - سلول از جمله برهمکنش بین سلول میزبان و عوامل بیماری‌زا ایفا می‌کنند. اهمیت فیزیولوژیکی و پاتولوژیکی فعل و انفعالات گلیکان - پروتئین توجه زیادی را در زمینه طراحی دارو بر اساس ساختار جلب می‌کند. با این حال، مطالعه این تعاملات با کریستالوگرافی اشعه ایکس بسیار دشوار بوده است، زیرا بخش‌های قند معمولاً دارای ساختار و ترکیب شیمیایی ناهمگن هستند. تکنیک‌های مدل سازی مولکولی محاسباتی یک روش جایگزین جذاب برای مطالعه تشخیص و ویژگی پروتئین - کربوهیدرات ارائه می‌دهند.

در داکینگ مولکولی این فعل و انفعالات پروتئین - کربوهیدرات از طریق ترکیب یک الگوریتم جستجوی سازگار ژنتیکی همراه با یک تابع انرژی آزاد تجربی خاص برای کربوهیدرات‌ها پیش بینی می‌شوند. روش داکینگ به شما امکان می‌دهد کاوش سیستماتیک جهت‌ها و موقعیت‌های لیگاند کربوهیدرات را در حفره پروتئین (که در مقایسه با محل اتصال مولکول‌های کوچک معمولاً بازتر است و به خوبی تعریف نشده است) انجام دهید و انرژی‌های آزاد کمپلکس‌های پیچیده را ارزیابی می‌کند. محدودیت‌های مشتق شده از آزمایش نیز می‌توانند برای پروتکل اتصال به منظور محدود کردن فضای جستجو برای قند و همچنین مولکول پروتئین اعمال شوند. عملکرد انرژی به طور خاص برای کربوهیدرات‌ها طراحی شده است، که برای خوشه بندی حالت‌های اتصال و اکتشاف سازه‌های پیچیده با انرژی مناسب استفاده می‌شود. به علاوه پایداری نسبی مجتمع‌های لیگاند - پروتئینی را می‌توان با اجرای شبیه سازی دینامیک مولکولی کوتاه ارزیابی کرد.

با توجه به اهمیت روزافزون پروتئین‌های متصل کننده کربوهیدرات به عنوان اهداف دارویی احتمالی، روش مدل سازی محاسباتی که برخی از ویژگی‌های مولکولی متمایز منحصر به فرد برای مجتمع‌های پروتئین - کربوهیدرات را آشکار می‌کند برای ارائه درک سطح اتمی از تشخیص کربوهیدرات مناسب است. رویکردهای جدید داکینگ می‌تواند تعامل بین پروتئین‌ها و لیگاندهای کربوهیدرات‌های جداگانه را پیش بینی کند و همچنین توانایی پیش بینی حالت‌های اتصال و پیوندهای گلیکان را با پروتئین‌های متصل کننده به گلیکان دارد.

داکینگ کروبوهیدرات - پروتئین
در این تصویر مراحل داکینگ پروتئین - کربوهیدرات نشان داده شده است.

دقت داکینگ مولکولی چقدر است؟

دامنه و قابلیت‌های داکینگ در طول سال‌ها مورد بحث قرار گرفته است. تا به امروز، چندین مطالعه معیار در مقایسه برنامه‌های مختلف داکینگ منتشر شده است. به طور متوسط​​، نشان داده شده است که دقت روش‌های داکینگ در شناسایی موقعیت‌های صحیح در حدود 60 تا 75 درصد است. یک چالش عمده همچنان پیش بینی دقیق تعامل انرژی بین دو مولکول است. تا کنون، همبستگی‌های کمی بین فعالیت‌های آزمایشی و امتیازات داکینگ به طور کلی، به دلیل سطح تقریبی بالای اعمال شده در توابع امتیازدهی، کم است. با این حال، ارتباطات کیفی کاملاً قابل قبول هستند که با موفقیت چندین کمپین غربالگری مجازی مبتنی بر داکینگ ثابت شده است.

اغلب اتفاق می‌افتد که حالت قرارگیری با امتیاز بالاتر لزوماً بهترین حالت نیست. به مثال زیر توجه کنید: «برومو دومین‌ها» (Bromodomains) پروتئین‌های کوچکی با نقوش محافظت شده بوده که مسئول بیان یا سرکوب ژن هستند. یک مهار کننده بسیار قوی برومودومین BET مهارکننده IBET762 است، یک لیگاند «تریازولازپین» (Triazolazepine) که دارای IC50 در محدوده نانومولار است. با استفاده از Vina برای ذخیره مجدد با استفاده از PDB ID 3P5O ، بهترین ژست در جهت کاملاً متفاوتی نسبت به مرجع کریستالوگرافی قرار دارد. مسئله دیگر عملکرد در «اتصال متقاطع» (Cross-docking) است: متصل کردن لیگاندهای مرجع به ساختارهای غیر بومی همان پروتئین اغلب منجر به پیش بینی اشتباه حالت داکینگ می‌شود. استراتژی‌های مختلفی برای افزایش دقت اتصال استفاده شده است. دو رویکرد اصلی عبارتند از Ensemble docking و Consensus docking که در دو زیربخش بعدی مورد بحث قرار می‌گیرد.

دقت در داکینگ
تصویری از دقت داکینگ. ژست‌های اتصال دهنده بدست آمده از اجرای داکینگ مولکولی با استفاده از Vina با BET bromodomain (BRD4) و IBET762 (اتم‌های کربن به رنگ زرد) نشان داده شده است. A) بهترین نتیجه از امتیازدهی (اتم‌های کربن به رنگ خاکستری) بدست می‌آید. B) ژست صحیح برای اعتبار سنجی (اتم‌های کربن به رنگ صورتی).

داکینگ گروهی

یکی از کاربردهای اولیه «داکینگ گروهی» (Ensemble docking) توسط Kuntz و Oshiro منتشر شد. داکینگ گروهی با انجام شبیه سازی‌های متعدد اتصال بر روی پروتئین‌های مختلف انجام می‌شود، این روش تا حدی انعطاف پذیری پروتئین را در بر می‌گیرد. فرض اصلی این است که اگر یک لیگاند داده شده در ساختار بومی امتیاز خوبی بگیرد، این لیگاند باید همین کار را در برابر گروهی از کنفورماسیون‌ها انجام دهد که امکان روشن شدن بهتر تعاملات محافظت شده را فراهم می‌آورند. به این ترتیب، داکینگ گروهی می‌تواند به عنوان داکینگ چهار بعدی (4D) در نظر گرفته شود و میزان موفقیت آن ۷۸ درصد از صحت هندسه اتصال گزارش شده است. مجموعه‌ای از سازگاری مولکول مورد نظر ممکن است از داده‌های کریستالوگرافی، NMR یا مدل‌های محاسباتی، به عنوان مثال، دینامیک مولکولی یا مدل‌های همولوژیکی مختلف ناشی شود.

مواردی که ممکن است بر عملکرد داکینگ گروهی تاثیر بگذارند شامل نحوه امتیازدهی، ساخت گیرنده‌های گروه، انعطاف پذیری لیگاند، شباهت مولکولی و غنی سازی هستند. اتصال گروهی همچنین به عنوان تکنیکی مداخله گر برای شبیه سازی‌های پیچیده‌تر عمل می‌کند. با استفاده از داده‌های سه بعدی (3D) می‌توان تقریبی عمیق‌تر از تناسب القایی، که ممکن است با روش‌‌های دیگر مانند QSAR ادغام شود، انجام دهید. اتصال گروهی در طیف گسترده‌ای از کاربردها مانند شناسایی نقاط داغ برای تعامل پروتئین - پروتئین، مدل سازی GPCR، مدل سازی ساختارهای apo و holo، «شناسایی برخورد» (hit identification)، شناسایی تعدیل کننده‌های گیرنده هسته‌ای، متابولیسم فاز I و بررسی سمیت موفقیت آمیز بوده است.

داکینگ گروهی
در این تصویر روش QSAR با داکینگ مولکولی انجام شده که باعث دستیابی به نتایج بهتر و قابل اعتمادتری خواهد شد.

داکینگ عام

همانطور که در مقدمه توضیح داده شد، توصیه می‌شود از بیش از یک برنامه معتبر برای غربالگری مجازی استفاده کنید. با توجه به دامنه‌های مختلف توابع نمره گذاری و الگوریتم‌ها، انتظار می‌رود که آن‌ها مکمل یکدیگر باشند. با این حال، از آنجا که توابع نمره گذاری با مبانی مختلف ساخته می‌شوند، مقایسه و ترکیب آن‌ها ساده نیست. اولین تلاش توسط Charifson  Corkery انجام شد، در آن مطالعه، نویسندگان با استفاده از سه عملکرد نمره دهی مستقل (CHEMSCORE ، PLP و DOCK) بهبود مداوم را نشان دادند.

مقالات بعدی نشان داد که ترکیب سه تا چهار تابع نمره گذاری مستقل برای بهبود نتایج کافی است. یک روش جایگزین ایجاد توابع امتیازدهی جدید بود که روش‌های موجود را ترکیب می‌کرد: نمونه‌های برتر DrugScore و X-Score هستند. در حالی که این استراتژی در موارد خاص مفید بود، هنوز قدرت پیش بینی کمتر از میانگین ​​نسبت به لیگاندهای بسیار انعطاف پذیر دارد. مطمئناً امتیازدهی گروهی، انتخاب ژست را بهبود می‌بخشد اما به طور مستقیم به نمرات ترکیب شده بستگی دارد، به عنوان مثال، یک همبستگی قوی بین آن‌ها ممکن است میزان خطا را افزایش دهد.

علاوه بر این، توابع نمره دهی نسبت به ویژگی‌های خاص جایگاه‌های اتصال مناسب هستند. رویکردهای جایگزین برای داکینگ گروهی مبتنی بر رتبه و تقاطع هستند که از معیارهای آماری برای ارزیابی سهم و اهمیت موضع‌های الزام آور استفاده می‌کنند. این روش‌ها باعث غنی سازی و رتبه بندی بهتر می‌شوند و دارای مزیتی هستند که نیازی به ورودی یا محاسبه دیگر فراتر از آمار ندارند. کاربردهای موفقیت آمیز این روش شامل شناسایی آنزیم ترانسکریپتاز معکوس ویروس HIV، مهار کننده‌های توبولین و ویروس زیکا هستند.

رویکردهای داکینگ مولکولی

دو رویکرد به ویژه در انواع اتصال مولکولی رایج است. یک رویکرد از «تکنیک تطبیق» (Matching Technique) استفاده می‌کند که پروتئین و لیگاند را به عنوان سطوح مکمل توصیف می‌کند. روش دوم «فرآیند اتصال واقعی» (Actual Docking Process) را شبیه سازی می‌کند که در آن انرژی برهم کنش زوج لیگاند و پروتئین محاسبه می‌شود. هر دو رویکرد دارای مزایای قابل توجهی و همچنین برخی محدودیت‌ها هستند. این موارد در ادامه بیان شده است.

روش شکل مکمل

روش‌های تطابق هندسی یا «مکمل بودن شکل» (Shape complementarity)، پروتئین و لیگاند را به عنوان مجموعه‌ای از ویژگی‌ها توصیف می‌کند که باعث اتصال آن‌ها می‌شود. این ویژگی‌ها ممکن است شامل توصیف کننده‌های سطح مولکولی یا سطح مکمل باشد. در این مورد، سطح مولکولی گیرنده از نظر «سطح قابل دسترسی به حلال» (Solvent - Accessible Surface Area) و سطح مولکولی لیگاند از نظر توصیف سطح مطابقت آن توصیف می‌شود. «مکمل بودن» (The complementarity) بین دو سطح به توصیف انطباق آن‌ها می‌پردازد که ممکن است به یافتن حالت مکمل اتصال به هدف و مولکول‌های لیگاند کمک کند.

مکمل بودن شکل رابط پروتئین-RNA
مکمل بودن شکل رابط پروتئین - RNA در چهار کلاس مختلف در این تصویر نشان داده شده است. پروتئین و زیر واحد RNA به ترتیب پروتئین با رنگ خاکستری و RNA سبز رنگ نشان داده شده است. در سمت چپ، رابط پروتئین به صورت سطحی و آبی رنگ و در سمت راست، رابط RNA به صورت سطحی و فیروزه‌ای رنگی نشان داده شده است.

رویکرد دیگر، توصیف ویژگی‌های آبگریز پروتئین با استفاده از چرخش در اتم‌های زنجیره اصلی است. روش دیگر استفاده از تکنیک توصیف شکل «فوریر» (Fourier) است. در حالی که رویکردهای مبتنی بر مکمل بودن شکل معمولاً سریع و قوی هستند آن‌ها معمولاً نمی‌توانند حرکات یا تغییرات پویا در ترکیب لیگاند - پروتئین را به طور دقیق مدل کنند، اگرچه پیشرفت‌های اخیر به این روش‌ها اجازه می‌دهد تا انعطاف پذیری لیگاند را بررسی کنند. روش‌های مکمل بودن شکل می‌تواند چندین هزار لیگاند را در عرض چند ثانیه اسکن کرده و در واقع بفهمد که آیا می‌توانند در محل فعال پروتئین متصل شوند و معمولاً حتی برای برهمکنش پروتئین - پروتئین مقیاس پذیر است. آن‌ها همچنین بسیار بیشتر در معرض رویکردهای مبتنی بر «فارماکوفور» (داروبر) هستند، زیرا از توصیف هندسی لیگاندها برای یافتن اتصال بهینه استفاده می‌کنند.

شبیه سازی

شبیه سازیِ فرایند اتصال بسیار پیچیده‌تر است. در این رویکرد، پروتئین و لیگاند با فاصله فیزیکی از هم جدا می‌شوند و لیگاند پس از تعداد مشخصی حرکت در فضای تطبیقی​​، موقعیت خود را در محل فعال پروتئین می‌یابد. این حرکت‌ها ساختارهای سخت مانند برگردان و چرخش را یکی کرده و همچنین تغییرات داخلی در ساختار لیگاند از جمله چرخش زاویه دورانی ایجاد می‌کند. هر یک از این حرکت‌ها در فضای ترکیب لیگاند باعث ایجاد کل هزینه انرژی سیستم می‌شود، بنابراین کل انرژی سیستم پس از هر حرکت محاسبه می‌شود.

مزیت آشکار شبیه سازی اتصال این است که انعطاف پذیری لیگاند به راحتی در آن گنجانده می‌شود، در حالی که تکنیک‌های مکمل بودن شکل باید از روش‌های مبتکرانه برای انعطاف پذیری در لیگاند‌ها استفاده کنند. همچنین، واقعیت را دقیق‌تر مدل سازی می‌کند، در حالی که تکنیک‌های مکمل بودن شکل، بیشتر انتزاعی هستند. بدیهی است که شبیه سازی از نظر محاسباتی گران قیمت است و باید چشم انداز وسیعی از انرژی را کاوش کرد. تکنیک‌های مبتنی بر شبکه، روش‌های بهینه سازی و افزایش سرعت کامپیوتر، شبیه سازی داکینگ را واقعی‌تر کرده است.

شبیه سازی داکینگ
در این تصویر شبیه سازی کمپلکس اصلی سازگاری بافت (MHC) - پپتید نشان داده شده است. ساختار پپتیدی تجربی با رنگ سبز نشان داده شده و پپتید شبیه سازی شده با رنگ قرمز نشان داده شده است.

انواع حالت های داکینگ

انعطاف پذیری پروتئین و لیگاند و ارزیابی اتصال یکی از چالش‌های اصلی در داکینگ است. مسلماً یک رویکرد مناسب برای آزمایش رفتار کمپلکس پروتئین - لیگاند در یک محیط پویا قرار دارد. از زمان معرفی مدل امیل - فیشر برای اتصال، با ابزارها و روش‌های کارآمدتر مشخص شد که استفاده از دستکاری پروتئین‌ها راه بهتری است. به هر حال، مشکلات لیگاند یکی از مسائل اصلی در شیمی دارویی و داروسازی بوده است. با رشد تصاعدی مخازن مانند «بانک داده پروتئین» (PDB) الگوهای تا شونده جدید و انواع ترتیب ساختاری کشف شد. این اطلاعات به شما امکان می‌دهد الگوها و شباهت‌هایی را در محل‌های اتصال و پاکت‌های پروتئینی مشاهده کنید تا عملکرد داخلی پروتئین‌ها را روشن کند.

داکینگ گیرنده سفت و لیگاند سفت

هنگامی که لیگاند و گیرنده هر دو به عنوان اجسام سفت و سخت رفتار می‌کنند، با توجه به تنها سه درجه آزادی ترجمه و سه درجه چرخش، فضای جستجو بسیار محدود است. در این مورد، انعطاف پذیری لیگاند را می‌توان با استفاده از مجموعه‌ای از ترکیبات لیگاند از پیش محاسبه شده تا درجاتی از همپوشانی اتم - اتم بین پروتئین و لیگاند مورد استفاده قرار داد. نسخه‌های اولیه DOCK ، FLOG و برخی برنامه‌های اتصال پروتئین و پروتئین، مانند FTDOCK، از روشی استفاده کردند که لیگاند و گیرنده را در طول فرآیند سفت نگه می‌داشت. DOCK اولین روش خودکار برای اتصال یک مولکول به محل گیرنده است و به طور مداوم در حال توسعه است.

این روش، لیگاند و گیرنده را به عنوان مجموعه‌ای از کره‌ها توصیف می‌کند که می‌توانند با استفاده از روش تشخیص گروهی روی هم قرار گیرند. همچنین از الگوریتم‌های تطبیق هندسی و شیمیایی استفاده می‌شود و مجموعه‌های لیگاند - گیرنده را می‌توان با درنظر گرفتن تناسب استریک، مکمل شیمیایی یا شباهت فارماکوفور نمره گذاری کرد. در نسخه‌های بهبود یافته آن، روش ساخت افزایشی و جستجوی جامع برای در نظر گرفتن انعطاف پذیری لیگاند اضافه می‌شوند. جستجوی جامع به طور تصادفی تعدادی از موارد سازگار تعریف شده توسط کاربر را به عنوان مضرب تعداد پیوندهای قابل چرخش در لیگاند تولید می‌کند.

FLOG سازگاری لیگاند را بر اساس هندسه فاصله ایجاد می‌کند و از الگوریتم پیدا کردن گروه برای محاسبه مجموعه فاصله‌ها استفاده می‌کند و تا تعداد 25 تطابق صریح لیگاند می‌تواند برای انعطاف پذیری مورد استفاده قرار گیرد. FLOG به کاربران اجازه می‌دهد تا نقاط ضروری که باید با اتم لیگاند جفت شوند را تعریف کنند. این رویکرد در صورتی مفید است که از پیش، تعامل مهمی قبل از اتصال شناخته شده باشد. کانفورماسیون‌ها با توجه به واندروالس، الکترواستاتیک، پیوند هیدروژنی و فعل و انفعالات آب‌گریز، با یک تابع نمره گذاری می‌شوند.

داکینگ لیگاند انعطاف پذیر و گیرنده سفت

برای سیستم‌هایی که رفتار آن‌ها از الگوی تناسب القایی پیروی می‌کند اهمیت انعطاف پذیری لیگاند و گیرنده بسیار مهم است، زیرا در آن صورت هر دو لیگاند و گیرنده تغییر شکل می‌دهند تا حداقل مجموعه کاملاً مناسب انرژی را تشکیل دهند. با این حال، وقتی گیرنده نیز انعطاف پذیر است هزینه بسیار زیاد است. بنابراین رویکرد رایج، همچنین یک معامله بین دقت و زمان محاسبه، این است که با لیگاند انعطاف پذیر رفتار می‌شود در حالی که گیرنده در هنگام اتصال محکم نگه داشته می‌شود. تقریباً همه برنامه‌های داکینگ مانند AutoDock و FlexX از این روش استفاده کرده اند. AutoDock 3.0 از روش‌های الگوریتم ژنتیک لمارکی، تکاملی و انلینگ شبیه سازی شده مونت کارلو برای مدل‌سازی انعطاف پذیری لیگاند در عین سفت نگه داشتن گیرنده استفاده می‌کند.

عملکرد نمره گذاری بر اساس میدان نیروی AMBER، از جمله وان دروالس، پیوند هیدروژنی، فعل و انفعالات الکترواستاتیک، آنتروپی تطبیقی ​​و شرایط انحلال است. هر عبارت با استفاده از یک عامل مقیاس تجربی بدست آمده از داده‌های تجربی وزن می‌شود. AutoDock 4.0 با حرکت زنجیرهای جانبی می‌تواند انعطاف پذیری گیرنده را مدل کند. علاوه بر این، تعامل اتصال پروتئین - پروتئین را می‌توان در این نسخه از AutoDock ارزیابی کرد. AutoDock Vina به تازگی به عنوان آخرین نسخه برای اتصال مولکولی و غربالگری مجازی منتشر شده است. با جمع آوری مجدد 190 مجتمع گیرنده - لیگاند که به عنوان مجموعه آموزشی AutoDock 4 استفاده می‌شد، AutoDock Vina به طور همزمان تقریباً دو برابر پیشرفت نمایی در سرعت و دقت قابل توجهی در پیش بینی حالت اتصال را نشان داد.

FlexX از الگوریتم ساخت افزایشی برای نمونه برداری از لیگاند استفاده می‌کند. قطعه پایه ابتدا با تطبیق جفت‌های پیوند هیدروژنی و فعل و انفعالات حلقه آروماتیک بین لیگاند و پروتئین در محل فعال متصل می‌شود. سپس اجزای باقیمانده مطابق با مجموعه‌ای از زاویه‌های پیچشی از پیش تعیین شده برای انعطاف پذیری لیگاندها ساخته می‌شوند. عملکرد نمره گذاری FlexX بر اساس کار Bohm است. نسخه فعلی آن شامل شرایط فعل و انفعالات الکترواستاتیک، پیوندهای هیدروژنی جهت دار، آنتروپی چرخشی و برهمکنش‌های آروماتیک و چربی دوست است. تعاملات بین گروه‌های عملکردی نیز با تعیین نوع و هندسه برای گروه‌ها در نظر گرفته می‌شود.

داکینگ گیرنده انعطاف پذیر و لیگاند انعطاف پذیر

ثابت شده است که تحرک ذاتی پروتئین‌ها ارتباط تنگاتنگی با رفتار اتصال به لیگاند دارد و توسط Teague بررسی شده است. گنجاندن انعطاف پذیری گیرنده یک چالش مهم در زمینه داکینگ است. در حالت ایده آل، با استفاده از شبیه سازی دینامیک مولکولی (MD) می‌توان تمام درجات آزادی را در مجموعه گیرنده - لیگاند مدل کرد. اما شبیه سازی دینامیک مولکولی مشکل نمونه گیری ناکافی را دارد که قبلاً به آن اشاره کردیم. عامل دیگر هزینه محاسباتی بالای آن است که مانع استفاده از این روش در غربالگری پایگاه داده‌های شیمیایی بزرگ می‌شود.

علاوه بر تناسب القایی تاریخی چندین مدل نظری، انتخاب سازگار و القاء سازه‌ای، برای نشان دادن روند اتصال لیگاند - پروتئین انعطاف پذیر پیشنهاد شده است. با توجه به تعریفی که تیگ ارائه داده است، انتخاب سازگار به فرایندی اطلاق می‌شود که یک لیگاند به طور انتخابی به کانفورماسیون مطلوب از تعدادی از ترکیبات پروتئینی متصل می‌شود، القاء کانفورماسیونی فرایندی را توصیف می‌کند که در آن لیگاند پروتئین را به شکل دیگری تبدیل می‌کند که خود به خود در حالت عادی آن را انجام نمی‌دهد. در برخی موارد، این تبدیل کانفورماسیون ​​را می‌توان به تا شدن نسبی پروتئین تشبیه کرد. در ادامه انواع روش‌ها برای داکینگ گیرنده انعطاف پذیر و لیگاند انعطاف پذیر بررسی شده اند.

داکینگ نرم

در حال حاضر روش‌های مختلفی برای اعمال انعطاف پذیری گیرنده در دسترس است. ساده ترین آن به اصطلاح «داکینگ نرم» (soft-docking) است که انرژی دافعه وان در والس را در عملکرد نمره گذاری کاهش می‌دهد تا امکان همپوشانی اتم - اتم بین گیرنده و لیگاند را فراهم آورد. به عنوان مثال، پتانسیل LJ 8-4 در GOLD و پتانسیل صاف در AutoDock 3.0 متعلق به این کلاس است. این روش ممکن است شامل انعطاف پذیری کافی نباشد. با این وجود، این مزیت بهره وری محاسباتی دارد زیرا مختصات گیرنده به سادگی با تنظیم پارامترهای وان دروالس تنظیم می‌شوند.

استفاده از کتابخانه روتامر

استفاده از کتابخانه‌های روتامر روش دیگری برای مدل سازی انعطاف پذیری گیرنده است. کتابخانه‌های روتامر شامل مجموعه‌ای از کانفورماسیون‌های زنجیره جانبی هستند که معمولاً از تجزیه و تحلیل آماری داده‌های تجربی ساختاری تعیین می‌شوند. مزیت استفاده از روتامرها سرعت نسبی در نمونه برداری و پرهیز از کوچک شماری موانع است. ICM (مکانیک مختصات داخلی) برنامه‌ای است که از کتابخانه‌های روتامر با متدولوژی احتمال جانبدارانه استفاده می‌کند، همراه با Monte Carlo کانفورماسیون لیگاند را جستجو می‌کند.

انعطاف پذیری زنجیره جانبی گیرنده

AutoDock 4 از یک روش نمونه‌گیری همزمان برای مقابله با انعطاف پذیری زنجیره جانبی استفاده می‌کند. چندین زنجیره جانبی گیرنده می‌تواند توسط کاربران انتخاب شده و همزمان با یک لیگاند با استفاده از روش‌های مشابه نمونه برداری شود. سایر قسمت‌های گیرنده در طول نمونه برداری با نقشه انرژی شبکه به طور سخت تلقی می‌شوند. نقشه انرژی شبکه معرفی شده توسط Goodford برای ذخیره اطلاعات انرژی گیرنده و ساده سازی محاسبه انرژی متقابل بین لیگاند و گیرنده استفاده می‌شود.

کانفورماسیون های گروهی پروتئین

روش دیگر برای سر و کار داشتن با انعطاف پذیری پروتئین، استفاده از مجموعه‌ای از ترکیبات پروتئینی است که مطابق با نظریه انتخاب سازگار است. یک لیگاند به طور جداگانه به مجموعه‌ای از ترکیبات پروتئینی سفت و محکم متصل می‌شود و نتایج بسته به روش انتخابی ادغام می‌شوند. این روش در ابتدا در DOCK اجرا شد، که به طور متوسط ​​شبکه انرژی بالقوه گروهی را ایجاد می‌کند و در بسیاری از برنامه‌ها به روش‌های مختلف گسترش می‌یابد. به عنوان مثال، FlexE ساختارهای کریستالی متعددی از یک پروتئین خاص را جمع آوری کرده و قسمت‌های مشابه را ادغام می‌کند در حالی که مناطق متفاوت را به عنوان جایگزین‌های مختلف علامت گذاری می‌کند. در طول ساخت افزایشی یک لیگاند از پروتئین‌های گسسته به شکل ترکیبی نمونه برداری می‌شود. ساختار پروتئینی با بالاترین امتیاز بر اساس مقایسه بین لیگاند و هر جایگزین انتخاب می‌شود. این روش‌ها به طور خلاصه در جدول زیر بررسی شده اند.

روشتوضیحاتمزایامعایبنرم افزار (های) مورد استفاده
«پتانسیل نرم» (Soft potential)vdW را تغییر می‌دهد تا امکان همپوشانی بین اتم‌های گیرنده و لیگاند وجود داشته باشد.کارایی محاسباتی

پیاده سازی آسان

استفاده ترکیبی با روش‌های دیگر

انعطاف پذیری نامناسب

انعطاف‌پذیری را به صورت ضمنی، نامناسب و به روش غیر کمی شرح می‌دهد.

GOLD

AutoDock

«کتابخانه روتامر» (Rotamer library)کتابخانه زنجیره جانبی برای دست‌یابی به کانفورماسیون‌های ممکن را جستجو می‌کند.کارایی محاسباتی نسبی

پرهیز از کوچک کردن موانع

وابستگی شدید به پایگاه داده استفاده شده

عدم انعطاف‌پذیری زنجیره اصلی

ICM
انعطاف پذیری زنجیره جانبی گیرندهزنجیره جانبی و کنفورماسیو‌های لیگاند را به طور همزمان با استفاده از GA نمونه گیری می‌کند.کارایی محاسباتی نسبی

مدل‌سازی اثر لیگاند روی رزیجوهای جایگاه اتصال

تنها درگیری زنجیره‌های جانبی انتخابی

عدم انعطاف‌پذیری زنجیره اصلی

AutoDock 4
 کانفورماسیون‌های گروهی پروتئیناتصال لیگاند به یک سری از ساختارهای گیرنده که نشان دهنده حالت‌های مختلف کانفورماسیونی است.شامل انعطاف‌پذیری کامل و واضحهزینه محاسباتی گران‌قیمت

محدود به کانفورماسیون‌های پروتئینی مورد استفاده در نمونه‌گیری

DOCK

FlexE

روش هیبرید یا ترکیبی

روش ترکیبی یکی دیگر از استراتژی‌های عملی برای مدل سازی انعطاف پذیری گیرنده است. یک مثال خوب Glide است، یک برنامه بسیار محبوب در زمینه داکینگ به شمار می‌رود. Glide یک سری فیلترهای ترتیبی را طراحی می‌کند تا حالت‌ها و جهت‌های احتمالی لیگاند را در محل اتصال گیرنده جستجو کند. انعطاف پذیری لیگاند با جستجوی جامع در فضای زاویه چرخش لیگاند انجام می‌شود. کانفورماسیون‌های اولیه لیگاند بر اساس انرژی پیچشی انتخاب شده و در مکان‌های اتصال گیرنده با عوامل باالقوه نرم متصل می‌شود. سپس از یک شناسایی روتامر برای مدل سازی انعطاف پذیری گیرنده استفاده می‌شود. IFREDA از یک روش ترکیبی استفاده می‌کند که مجموعه‌ای از عوامل باالقوه نرم و ترکیب گیرنده‌های متعدد را در بر می‌گیرد و انعطاف پذیری گیرنده را محاسبه می‌کند. برنامه‌های دیگر، مانند QXP و Affinity، جستجوی مونت کارلو در زمینه کانفورماسیون لیگاندها را با کم کردن مراحل انجام کار دنبال می‌کنند.

در حین کم کردن مراحل، قسمت‌های تعریف شده از پروتئین مجاز توسط کاربر قابل حرکت هستند تا از برخورد اتم بین لیگاند و گیرنده جلوگیری شود. SLIDE به گونه‌ای طراحی شده است که انعطاف پذیری را با قابلیت حذف برخوردها (چرخش پیوند منفرد هر یک از لیگاندها یا زنجیره های جانبی پروتئین) ترکیب می‌کند. یک روش بهینه سازی بر اساس «نظریه میدان میانگین» (Mean - field theory) برای مدل سازی مکمل‌های القایی مناسب بین لیگاند و پروتئین استفاده می‌شود.

روش‌های ذکر شده در بالا فقط شامل انعطاف پذیری زنجیره جانبی یا انعطاف پذیری کامل گیرنده است. ما می‌دانیم که لوپ‌های تشکیل دهنده جایگاه‌های فعال نقش مهمی در اتصال لیگاند دارند. در برخی موارد حلقه یا لوپ ممکن است تغییر شکل چشمگیری داشته باشد در حالی که در قسمت‌های دیگر گیرنده تغییر چندانی در اتصال لیگاند ایجاد نمی‌شود. برای این وضعیت، روش‌های انعطاف پذیری زنجیره جانبی در نمونه برداری از پروتئین مناسب شکست می‌خورند و به نظر می‌رسد در نظر گرفتن انعطاف پذیری کامل هدر دادن محاسبات است. در تصویر زیر به عنوان مثال ساختارهای کریستالی روی هم قرار داده شده را نشان می‌دهد. جایگاه فعال تریوز فسفات ایزومراز دارای یک حلقه 11 اسیدآمینه‌ای است که ۷ انگستروم بالای با اتصال لیگاند حرکت می‌کند. با این حال، بقیه آنزیم‌ها در مقایسه با ساختارهای آپو (غیر وابسته به لیگاند) و هولو هیچ حرکتی ندارند.

تصویر داکینگ
ساختارهای کریستالی آپو (به رنگ زرد) و هولو (به رنگ آبی) تریوزفسفات ایزومراز روی هم قرار داده شده است. کد PDB به ترتیب 1YPI و 2YPI است. ۱۱ اسید آمینه تشکیل دهنده لوپ که جایگاه فعال را ایجاد کرده اند، تنها ناحیه‌ای است که هنگام اتصال لیگاند (در دایره) حرکت بزرگی دارد.

چندین خانواده آنزیمی نیز شامل تنظیم مجدد حلقه در جایگاه فعال مسئول اتصال لیگاندها، مانند Bromodomain یک خانواده گسترده مربوط به اتصال استیل - لیزین یا دی هیدروفولات ردوکتاز، مسئول نگهداری تجمعات سلولی تتراهیدروفولات و سایر انواع کینازها هستند. علاوه بر این‌ها روش نمونه گیری حلقه Local Move Monte Carlo (LMMC) یک رویکرد جدید است که بر نمونه برداری از ترکیب لیگاند در جایگاه‌های فعال حاوی حلقه تمرکز می‌کند.

ارزیابی داکینگ مولکولی

وابستگی متقابل بین نمونه برداری و عملکرد نمره گذاری بر قابلیت اتصال در پیش بینی حالت‌های محتمل یا نزدیکی الزامی برای ترکیبات جدید تأثیر می‌گذارد. بنابراین، ارزیابی یک پروتکل اتصال به طور کلی (هنگامی که داده‌های تجربی در دسترس است) برای تعیین قابلیت پیش بینی آن مورد نیاز است. ارزیابی اتصال می‌تواند با استفاده از استراتژی‌های مختلف انجام شود، مانند:

  • محاسبه دقت اتصال (DA)
  • ارتباط بین نمره اتصال و پاسخ تجربی یا تعیین عامل غنی سازی (EF)
  • فاصله بین بخش اتصال دهنده یون - یون در جایگاه فعال آنزیم
  • وجود مدل‌های القایی مناسب

در ادامه هر کدام از این موارد توضیح داده شده اند.

دقت اتصال

«دقت اتصال در داکینگ مولکولی» (Docking accuracy) نشان دهنده یک معیار برای تعیین کمیت تناسب برنامه اتصال با توجیه توانایی پیش بینی موقعیت مناسب لیگاند با توجه به مشاهده تجربی است.

عامل غنی سازی

صفحه‌های اتصال نیز می‌توانند با غنی سازی لیگاندهای حاشیه‌ای اتصال دهنده‌های شناخته شده از بین یک پایگاه داده بزرگ از مولکول‌های فریبنده غیرقابل اتصال فرضی ارزیابی شوند. به این ترتیب، موفقیت یک صفحه اتصال با ظرفیت آن برای غنی سازی تعداد کمی از ترکیبات فعال شناخته شده در رده‌های بالای صفحه از بین تعداد بسیار بیشتری مولکول فرضی در پایگاه داده ارزیابی می‌شود. سطح زیر منحنی ویژگی عملکرد گیرنده (ROC) به طور گسترده‌ای برای ارزیابی عملکرد آن مورد استفاده قرار می‌گیرد.

آینده نگری

ضربه‌های ناشی از صفحه‌های اتصال به اعتبار دارویی (به عنوان مثال IC50، اندازه گیری میل یا قدرت) می‌رسد. فقط مطالعات آینده نگر اثبات قطعی مناسب بودن تکنیک برای یک هدف خاص است.

معیارسازی

پتانسیل برنامه‌های اتصال را برای بازتولید حالت‌های اتصال دهنده که توسط کریستالوگرافی اشعه ایکس تعیین می‌شود می‌توان با طیف وسیعی از مجموعه‌های معیار اتصال بارگذاری کرد. برای مولکول‌های کوچک، چندین مجموعه داده معیار برای اتصال و غربالگری مجازی وجود دارد. مجموعه متنوع Astex متشکل از ساختارهای کریستالی اشعه ایکس پروتئین - لیگاند با کیفیت بالا یا فهرست «ابزارهای مفید» (Directory of Useful Decoys) یا DUD برای ارزیابی عملکرد غربالگری مجازی است. ارزیابی برنامه‌های اتصال به دلیل پتانسیل آن‌ها برای بازتولید حالت‌های اتصال پپتید را می‌توان با درس‌های ارزیابی کارآیی اتصال و امتیازدهی (LEADS - PEP) ارزیابی کرد.

کاربرد داکینگ مولکولی

تعامل اتصال بین یک لیگاند مولکول کوچک و یک پروتئین آنزیمی ممکن است منجر به فعال شدن یا مهار آنزیم شود. اگر پروتئین گیرنده باشد، اتصال لیگاند ممکن است منجر به آگونیسم (اتصال یک ماده شیمیایی به گیرنده و فعال کردن پاسخ بیولوژیک) یا آنتاگونیسم (اتصال یک ماده شیمیایی به گیرنده و جلوگیری از فعالیت آن) شود. داکینگ بیشتر در زمینه طراحی دارو مورد استفاده قرار می‌گیرد، اکثر داروها مولکول‌های ارگانیک کوچکی هستند و داکینگ مولکولی ممکن است به دلایل زیر انجام شود:

  • شناسایی برخورد، داکینگ به همراه یک تابع نمره گذاری می‌تواند برای غربالگری سریع پایگاه‌های اطلاعاتی بزرگ داروهای بالقوه در رایانه (In Silico) برای شناسایی مولکول‌هایی که احتمالاً به هدف مورد علاقه پروتئین متصل می‌شوند استفاده شود که به آن «غربالگری مجازی» (Virtual Screening) نیز گفته می‌شود.
  • بهینه سازی مقادیر ترکیبات پیشرو دارویی، اتصال یا داکینگ می‌تواند برای پیش بینی اینکه در کدام جهت و در کدام جهت نسبی یک لیگاند به پروتئین متصل می‌شود (همچنین به عنوان حالت اتصال یا ژست نامیده می‌شود) استفاده شود. این اطلاعات ممکن است به نوبه خود برای طراحی آنالوگ‌های قوی‌تر و انتخابی‌تر مورد استفاده قرار گیرد.
  • «زیست پالایی» (Bioremediation)، داکینگ لیگاند - پروتئین همچنین می‌تواند برای پیش بینی آلاینده‌هایی که توسط آنزیم‌ها تجزیه می‌شوند، مورد استفاده قرار گیرد.

داکینگ مولکولی داروها

طراحی دارو با توسعه شیمی دارویی همراه است. پس از دهه 1970، طراحی دارو شروع به استفاده گسترده از شیمی دارویی، زیست شناسی مولکولی، شیمی کوانتومی، نظریه‌های اساسی آمار، علم و فناوری مدرن، و همچنین رایانه‌های الکترونیکی و سایر وسایل، موقعیت جدیدی را در طراحی دارو ایجاد کرد. طراحی داروهای رایانه‌ای (CADD) روشی است که بر اساس شیمی رایانه‌ای طراحی و بهینه سازی ترکیبات پیشرو دارویی از طریق شبیه سازی کامپیوتری، محاسبه و برآورد رابطه بین دارو و مولکول زیستی پذیرنده انجام می‌شود.

فعل و انفعالات بین مولکول‌های زیستی برای همه فرایندهای بیولوژیکی ضروری است. با استفاده از این فعل و انفعالات، موجودات زنده شبکه‌های متقابل نظارتی و متابولیکی پیچیده‌ای را حفظ می‌کنند که با هم فرایندهای حیات را تشکیل می‌دهند. درک پیچیدگی مسیرهای بیولوژیکی و فعل و انفعالات بین ماکرومولکول‌های درگیر ضروری شده است و داکینگ مولکولی به طور جامع به این نیاز پاسخ داده است. اتصال مولکولی ممکن است به عنوان یک مفهوم شیمی محاسباتی تعریف شود که راه‌حل‌هایی را برای کشف مکانیزم تعامل بستر و لیگاند ارائه می‌دهد. این روش مولکول تعاملی را بر اساس توپوگرافی آن‌ها در کنار هم قرار می‌دهد. هدف اصلی داکینگ مولکولی تعیین بهترین ترکیب ممکن پروتئین - لیگاند، پروتئین - پروتئین یا سایر انواع فعل و انفعالات با حداقل انرژی است.

داکینگ در داروها
امروزه از داکینگ مولکولی در تولید بسیاری از داروها استفاده می‌شود.

داکینگ همچنین به عنوان یک تکنیک حیاتی در مدل سازی برهمکنش پروتئین - لیگاند و پروتئین - پروتئین در نظر گرفته می‌شود و در نتیجه در مطالعات مربوط به رمزگشایی عملکرد مولکولی مجموعه‌های مختلف شرکت می‌کند. رویکرد داکینگ مولکولی یک حالت قدرتمند برای مدل سازی برهمکنش پروتئین و مولکول‌های کوچک در سطح اتمی است. این روش بسیار در توصیف رفتار مولکول‌های کوچک در محل اتصال آن‌ها کمک می‌کند. دو مرحله اصلی که در داکینگ متصل می‌شوند عبارتند از: (1) بدست آوردن ترکیب لیگاند پایدار و (2) ارزیابی میل اتصال آن.

در اکثر موارد، محل‌های اتصال قبل از انجام داکینگ پیش بینی می‌شوند. مکان‌های اتصال معمولاً با مقایسه هدف مورد نظر با پروتئین‌های دیگر از همان خانواده با عملکرد مشابه بدست می‌آیند. کاربردهای داکینگ گسترده هستند، اطلاعات به دست آمده عمیق است و مسیر را برای استفاده از داکینگ کاملاً باز کرده است تا پژوهشگران وارد عرصه جدیدی از تحقیقات با تمرکز بر طراحی مولکولی، کشف هدف و تجزیه و تحلیل پتانسیل کاربرد ترکیبات شوند. معمولاً اولین قدم برای یافتن ترکیبات فعال از مواد شیمیایی موجود برای پروژه کشف و توسعه دارو است.

اگرچه بسیاری از شرکت‌های دارویی منابع آنلاین و کتابخانه‌های خود را دارند که ممکن است میلیون‌ها ترکیب داشته باشند، نگهداری کتابخانه و انجام غربالگری با توان بالا هزینه‌بر است. غربالگری مجازی یک روش جایگزین برای انجام غربالگری میلیون‌ها ترکیب در عرض چند روز ارائه می‌دهد. داکینگ مولکولی یکی از کاربردی ترین روش‌های غربالگری مجازی است، به ویژه هنگامی که ساختار سه بعدی پروتئین مورد نظر در دسترس باشد. در واقع، اتصال مولکولی بیش از سه دهه است که استفاده می‌شود و تعداد زیادی داروی جدید کشف شده و بر این اساس توسعه یافته است. اگرچه شکی نیست که این روش نقش مهمی را ایفا خواهد کرد، اما اتصال مولکولی از نظر میزان موفقیت هنوز با موفقیت کامل فاصله دارد.

FBDD یا طراحی دارو بر اساس قطعات به عنوان یک الگوی موفق برای توسعه داروهای جدید پدیدار شد و آمیزه‌ای از غربالگری توان بالا «مبتنی بر هدف» (‌Target - based) و رویکردهای طراحی دارو بر اساس ساختار را ترکیب کرد. داکینگ مولکولی، از برنامه ریزی و اولویت بندی ترکیب کتابخانه قطعه گرفته تا یافتن آنالوگ‌هایی با احتمال اتصال بهتر از طریق غربالگری مجازی در مقیاس بزرگ کتابخانه‌های مرکب kra مهمی در FBDD دارد. ML یا Machine Learning شاخه‌ای از هوش مصنوعی است که در زمینه‌های مختلف علم و فناوری بسیار مورد توجه قرار گرفته است و روش‌های اتصال مولکولی نیز از این منطقه پویا استفاده می‌کنند. اگرچه اخیراً، انعطاف پذیری Machine Learning در مدل سازی داده‌ها توابع امتیاز دهی متنوع‌تر و دقیق تری را به طور ضمنی برای ویژگی‌های بیشتر مجموعه پیچیده در نظر گرفته است.

محدودیت های داکینگ مولکولی

محدودیت اصلی داکینگ مولکولی به دلیل عدم اطمینان در توانایی نمره گذاری توابع برای ایجاد انرژی اتصال صحیح است. این امر ناشی از این واقعیت است که برخی از فعل و انفعالات بین مولکولی مانند اثر حلالی و تغییر آنتروپی به سختی به طور دقیق پیش بینی می‌شوند. علاوه بر این، برخی از واکنش‌های بین مولکولی که اهمیت آنها ثابت شده است به ندرت در توابع نمره دهی در نظر گرفته می‌شوند. به عنوان مثال، پیوند هالوژن تأیید می‌شود که در میل به اتصال پروتئین - لیگاند و تعاملات گوانیدین - آرژنین نیز موثر است، اما در داکینگ در نظر گرفته نمی‌شود.

کمپلکس ترانستیرتین - تیروکسین، یکی از نمونه‌های مهمی است که در آن توابع انرژی شکست می‌خورند. شبیه سازی اتصال با توابع انرژی منجر به تولید دو حالت اتصال شد یکی شبیه به حالت اتصال بومی تیروکسین و دیگری متعلق به یک حوزه اتصال متناوب با میانگین انحراف مربع ریشه (RMSD) 8/97 Å از حالت اتصال بومی. شبیه سازی انرژی انجام شد و راه حل با انرژی کمتر که توسط برنامه داکینگ انتخاب شد، همان راه حل با RMSD بالاتر بود. بنابراین، در این مورد داکینگ مولکولی نتوانست پیش بینی صحیح حالت اتصال را انجام دهد. بنابراین ممکن است پاسخ‌های منفی کاذب در طول برنامه رخ دهند.

برخورد دقیق با مولکول‌های آب در محل متصل کننده در حین داکینگ، هنوز یک مشکل حل نشده است، که کار سختی است و به دو دلیل به توجه زیادی در آینده نزدیک نیاز دارد. اولاً، ساختارهای بلوری اشعه ایکس به دلیل پراکندگی ناکارآمد توسط اتم‌های کوچک‌تر فاقد اطلاعات مختصری از هیدروژن هستند. عدم آگاهی از موقعیت دقیق هیدروژن منجر به عدم دقت در شناسایی مولکول‌های آب می‌شود که ممکن است به عنوان یک مولکول پل بین لیگاند و گیرنده عمل کنند. ثانیاً، هیچ رویکرد نظری قابل اعتمادی برای پیش بینی دقیق چگونگی تأثیر مولکول‌های آب توسط لیگاندها و میزان تأثیر آن در دسترس نیست. علاوه بر این، با دانش فعلی ما نمی‌توان پیش بینی کرد که چند مولکول آب در محل اتصال با لیگاندهای احتمالی جایگزین می‌شود و چگونه شبکه پیوند هیدروژنی با اتصال لیگاند مختل می‌شود.

یکی از چالش‌های عمده‌ دیگری که در زمینه داکینگ با آن روبرو هستیم وجود گیرنده سفت و سخت است. یک پروتئین بسته به لیگاندی که به آن متصل می‌شود، می‌تواند شکل‌های متفاوتی را به خود بگیرد. در نتیجه، اتصال با استفاده از یک گیرنده سفت و سخت با یک ترکیب گیرنده مطابقت دارد که منجر به منفی کاذب در بسیاری از موارد می‌شود که بعداً لیگاند فعال شناخته شد. این امر به این دلیل اتفاق می‌افتد که یک پروتئین می‌تواند در حال حرکت مداوم بین حالت‌های مختلف سازه‌ای با انرژی مشابه وجود داشته باشد، که معمولاً در اتصال به آن نادیده گرفته می‌شود. سرانجام، طیف فعالیت در برابر پروتئین‌های خارج از هدف چیزی است که حتی در صفحه‌های محاسباتی به ندرت دیده می‌شود و فقط توسط آزمایشات انسانی و حیوانی مورد بررسی قرار می‌گیرد.

بر اساس رای ۱۵ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
IGI-GlobalRedalycNCBINCBIFuture-ScienceWikipediaTbiomedNCBIScielo‌ProfacgenProfacgenProfacgenProfacgenProfacgenProfacgenProfacgenProfacgen
۳ دیدگاه برای «داکینگ مولکولی چیست؟ — کاربردها، روش ها و نرم افزارها — به زبان ساده ‌»

با سلام و وقت بخیر. بسیار عالی و اموزنده بود. یک راهنمایی می خواستم. لایسنس نرم افزار لیگ پلات من تمام شده و برای دریافت نسخه ی جدید، ایمیل آکادمیک مانع دریافت ایمیل حاوی لایسنس می شود. برای دانلود این نرم افزار روش دیگری وجود دارد؟ یا نرم افزار مشابهی؟ متشکرم.

دستتون درد نکنه خیلی مطلب مفیدی بود

سلام، وقت شما بخیر،

از اینکه مطلب برای شما مفید واقع شده بسیار خرسندیم.

از همراهی شما با فرادرس سپاس‌گزاریم.

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *