زیرمشتق و خواص آن — به زبان ساده
یکی از مفاهیم و اصطلاحات رایج در ریاضیات، مشتق (Derivation) و مشتقپذیری (Derivative) است. شرایط خاصی برای توابع در نظر گرفته میشود تا مشتقپذیر باشند. معمولترین آنها با توجه به تعریف حد (Limit) و همچنین تعریف مشتق براساس حد صورت میگیرد. براین اساس هر تابعی که مشتقپذیر باشد، پیوسته بوده ولی عکس آن صحیح نیست. به این معنی که ممکن است تابعی (مانند تابع قدرمطلق) پیوسته بوده ولی در یک یا بعضی از نقاطش، مشتقپذیر نباشد. چنین وضعیتی دانشمندان را به سوی تعریف دیگری سوق داد که بتوانند در چنین مواردی مفهومی مانند زیرمشتق را ارائه دهند. این کار بخصوص برای توابع محدب کارساز است زیرا رفتار زیرمشتق شبیه مشتق بوده و بخصوص برای بهینه سازی توابعی محدب مناسب است.
در این نوشتار براساس شرایط سادهتر و برای «توابع محدب» (Convex Function)، مفهوم جدیدی از مشتق ارائه میشود که به آن «زیرمشتق» (Subderviation) میگویند. تابعی را که برای همه اعضای دامنهاش زیرمشتق داشته باشد، «زیرمشتقپذیر» (Subderviative) مینامند.
برای آشنایی بیشتر با مفهوم حد و مشتق بهتر است مطالب دیگر مجله فرادرس با عنوانهای حد در ریاضی — به زبان ساده و مشتق — به زبان ساده را مطالعه کنید. همچنین خواندن پیوستگی (Continuity) و تابع پیوسته (Continues Function) — به زبان ساده و توابع محدب و مقعر — از صفر تا صد نیز خالی از لطف نیست.
زیرمشتق و خواص آن
در ریاضیات سه مفهوم «زیرمشتق» (Subderviative)، «زیرگرادیان» (Sub-gradient) و «زیردیفرانسیل» (Sub-differential) به یک موضوع اشاره دارند و تعمیمی برای مفاهیم اولیه مشتق، گردیان و دیفرانسیل هستند. در حقیقت این سه اصطلاح، مشتقپذیری برای توابع محدب بدون شرط وجود دیفرانسیل را برآورده میکنند.
زیردیفرانسیل برای یک تابع محدب اولین بار توسط «ژان ماریو» (Jean Moreau) ریاضیدان فرانسوی و «رالف راکفلر» (Ralph Tyrrell Rockafellar) ریاضیدان آمریکایی در اوایل سال 1960 معرفی شد. همچنین در دهه ۸۰ میلادی نیز «زیردیفرانسیل تعمیم یافته» (Generalize Sub-differential) برای توابع «غیرمحدب» (Non-Convex) توسط «کلارک» (Clarke) و «راکفلر» (Rockafellar) طی مقالهای، مطرح و به کار گرفته شد.
در اکثر مواقع از زیرمشتق و زیردیفرانسیل برای توابع محدب و مباحث مربوط به بهینهسازی چنین توابع در «تحلیل مسائل محدب» (Convex Analysis) استفاده میکنند. پس بهتر است ابتدا به مفهوم و معنی تابع محدب بپردازیم.
تابع را روی دامنهاش محدب (Convex) گویند اگر برای هر بازه از دامنه آن مثل ، مقدار تابع برای این فاصله از مقدار خطی که این دو نقطه را به یکدیگر متصل میکند کوچکتر یا مساوی باشد. برای روشن شدن موضوع به تصویر زیر توجه کنید.
دو مقدار و را با شرط در نظر بگیرید. مقدار تابع در تمامی مقادیری از محور افقی که در بین و قرار گرفتهاند، از مقدار عرض خطی که دو نقطه و را به یکدیگر وصل کرده، کوچکتر است. واضح است که براساس میتوان تمامی نقاط در این فاصله را ایجاد کرد. این کار در رابطه ۱ صورت گرفته است.
طبق تعریف، تابع را روی دامنهاش () محدب گویند، اگر:
رابطه ۱: تعریف تابع محدب
توابعی مانند و محدب هستند. همچنین تابع نیز محدب محسوب میشود.
برای مثال تابع را مورد بررسی قرار میدهیم. دو نقطه و و مقدار تابع در این دو نقطه را در نظر بگیرید.
معادله خطی که این دو نقطه را به یکدیگر متصل میکند به صورت زیر است:
میدانیم که برای مقادیر مثبت کوچکتر از ۱، مربع این مقادیر از خودشان کوچکتر است. در نتیجه همیشه مقدار تابع در این بازه از مقدار خطی که دو نقطه و را به یکدیگر وصل میکند کوچکتر است.
در ادامه با تابع قدر مطلق به عنوان یک تابع محدب بیشتر کار خواهیم کرد. در تصویر ۲، نمودار تابع قدر مطلق را مشاهده میکنید که در شرایط مربوط به تابع محدب صدق میکند. تعریف ریاضی تابع محدب نیز براساس مقادیر میانگین وزنی برحسب در رابطه ۱ دیده میشود.
فرض کنید تابع حقیقی مقدار وجود داشته باشد که محدب است. ممکن است چنین تابعی در همه دامنهاش، مشتقپذیر نباشد. برای مثال تابع زیر از این گونه توابع محسوب میشود.
بر اساس تصویر زیر که مربوط به تابع قدرمطلق در رابطه بالا است، محدب بودن به خوبی دیده میشود. از طرفی واضح است که این تابع در صفر مشتقپذیر نیست.
هر چند این تابع پیوسته است ولی در نقطه به علت وجود تغییر جهت و نوک در نقطه صفر، تابع مشتقپذیر نیست. زیرا طبق مفهوم مشتق باید داشته باشیم:
رابطه ۲
پس چنین تابعی مشتقپذیر در نیست در نتیجه نمیتوان آن را در کل دامنهاش، مشتقپذیر خواند.
ولی توجه داشته باشید که تابع ، طبق رابطه ۱، محدب است زیرا در این صورت برای تابع قدر مطلق، داریم:
مشخص است که رابطه بالا به لحاظ خصوصیات تابع قدرمطلق و نامساویهای مربوطه به راحتی تعیین میشود. در نتیجه تابع قدرمطلق، محدب بوده ولی مشتقپذیر نیست.
زیرمشتق و تعریف آن
به منظور رفع مشکل مشتقپذیری توابع در نقاط نوک تیز (بخصوص برای توابع محدب)، مفهوم جدیدی به نام زیرمشتق ارائه شده است. در ادامه تعریف زیر مشتق را خواهیم دید.
تعریف زیر مشتق: زیرمشتق تابع محدب مانند که دارای مقادیری از اعداد حقیقی است در نقطه از دامنه آن برابر است با اگر رابطه زیر برقرار باشد.
رابطه ۳
به این ترتیب اگر تابعی، در این تعریف برای همه مقادیر دامنهاش، دارای زیرمشتق باشد، آن را زیرمشتقپذیر مینامند. واضح است که مقدار منحصر به فرد نیست. در نتیجه ممکن است زیر مشتق یک تابع به صورت یک مجموعه از مقادیر محسوب شود که در رابطه ۳، صدق کنند.
نکته: ممکن است در یک بازه شرایط زیرمشتقپذیری تابع برقرار باشد. در این صورت براساس حدهای یک طرفه خواهیم داشت:
مجموعه را که شامل همه نقاط زیرمشتق تابع در نقطه است، زیردیفرانسیل آن تابع مینامند. از آنجایی که تابع ، محدب است، اگر زیردیفرانسیل آن در نقطه شامل دقیقا یک نقطه باشد، آنگاه تابع را مشتقپذیر در میگویند.
مثال
تابع را در نظر بگیرید. در قسمت قبل نشان دادیم که این تابع، محدب است. در این صورت زیردیفرانسیل (مجموعه نقاط زیرمشتق آن) در فاصله بسته قرار دارد. واضح است که زیردیفرانسیل برای نقطههای کوچکتر از ۰ برابر است با
و برای مجموعه نقاط داریم:
مقادیر حاصل از زیرمشتق تابع قدرمطلق، درست مانند تابع علامت ظاهر میشوند. ولی زیرمشتق در نقطه ۰، یک مقدار ثابت نشده است و شامل همه مقادیر زیرمشتقهای ممکن خواهد بود.
در تصویر زیر مجموعه دیفرانسیل تابع براساس خطوط مختلف نشان داده شده است. همانطور که دیده میشود، مجموعه نقاطی که در زیر منحنی قرار دارند، زیردیفرانسیل این تابع خواهند بود.
به عنوان یک مثال دیگر به تابعی که در تصویر 4 دیده میشود، توجه کنید. این تابع در یک یا چند نقطه از دامنهاش، دارای شکست است. فرض کنید میخواهیم زیردیفرانسیل این تابع را در نقطه مشخص کنیم. در این تصویر، تابع محدب به رنگ آبی مشخص شده و خطوط قرمز رنگ، زیرمشتقهای آن را در نقطه نشان میدهند.
واضح است که شیب همه خطوط مماس بر تابع در نقطه ، پاسخهای زیردیفرانسیل تابع در نقطه با توجه به شرط مربوط به رابطه ۳ خواهند بود.
نکته: همانطور که متوجه شدید، زیرمشتق، یک مجموعه است که توسط رابطه ۱ مشخص شده است. به این ترتیب مجموعه نقاط زیرمشتق تابع ، به نقاطی از دامنه تابع (مثل ) گفته میشوند که در رابطه ۳ صدق میکنند. اگر این مجموعه، شامل فقط یک نقطه باشد، زیرمشتقها تبدیل به مشتق شده و تابع را مشتقپذیر مینامند.
خصوصیات زیرمشتق تابع
همانطور که مشتق و مشتقپذیری توابع دارای خصوصیات بودند، برای زیرمشتق تابع نیز میتوان ویژگیهای زیر را اثبات کرد.
- تابع محدب روی اعداد حقیقی، مشتقپذیر در است، اگر و فقط اگر نقاط زیرمشتق آن فقط یک نقطه باشد. به بیان دیگر مجموعه زیرمشتقهای آن فقط شامل یک نقطه بوده که همان مشتق تابع در نقطه است.
- نقطه یک نقطه کمینه فراگیر برای تابع محدب است، اگر و فقط اگر صفر در مجموعه زیرمشتقهای تابع، وجود داشته باشد. به این معنی که بتوان خطوط افقی (به نام خط زیرمشتق) روی نمودار تابع از نقطه ترسیم کرد. همانطور که مشخص است این خاصیت، همان وجود مقدار کمینه محلی برای تابع مشتقپذیر است.
- اگر تابع و محدب بوده و زیرمشتقهای و موجود باشند، آنگاه برای مجموع این دو تابع هم داریم:
نکته: منظور از رابطه + در فرمول بالا، «جمع مینکوفسکی» (Minkowski Sum) است. زیرا که و هر دو یک مجموعه هستند. توجه داشته باشید که جمع مینکوفسکی دو مجموعه و به صورت زیر تعریف شده است.
رابطه 4
زیرگرادیان
همانطور که دیدید، مفهوم مشتق را میتوان به زیرمشتق برای یک تابع محدب گسترش داد. در این بین مفهوم گرادیان (مشتق جهت دار) به زیرگرادیان (Subgradient) قابل توسعه است. به این ترتیب براساس یک تابع چند متغیره میتوان زیرمشتق را تعریف و به کار گرفت.
فرض کنید تابع یک تابع حقیقی مقدار محدب باشد که روی یک مجموعه محدب باز (Convex open set) در فضای اقلیدسی تعریف شده است.
بردار در این فضا را یک زیرگرادیان در نقطه در برای تابع گویند اگر برای هر در رابطه 5 برقرار باشد.
رابطه ۵
نکته: در این جا منظور از ضرب داخلی (Dot Product) دو بردار و است.
مجموعه همه گرادیانهای نقطه را زیردیفرانسیل در نقطه نامیده و به صورت نشان میدهند. به این موضوع توجه داشته باشید که زیردیفرانسیل همیشه یک «مجموعه ناتهی محدب فشرده» (Nonempty Convex Compact Set) است.
همین مفهوم را به تابع محدب و «فضای محدب محلی» (Locally Convex Space) مثل توسعه میدهیم. فرض کنید که تابع یک تابع چند متغیره روی است. به این معنی که داریم:
تابعک (Functional) در فضای مضاعف (Dual Space) را یک زیرگرادیان در گویند اگر برای هر در داشته باشیم:
رابطه ۶
مجموعه همه زیرگرادیانهای که در رابطه ۶ صدق کنند، زیردیفرانسیل تابعک (Functional) در گفته و به صورت نشان میدهند.
خلاصه و جمعبندی
در این نوشتار به تعمیم موضوع مشتق پرداخته و با زیرمشتق به عنوان یک زیر مجموعه از مقادیر دامنه تابع آشنا شدیم. همچنین رابطهای که مقادیر زیرمشتق یک تابع محدب را مشخص میکند در این نوشتار معرفی شده و با استفاده از تابع قدر مطلق مفهوم زیرمشتق بیشتر روشن گردید. علاوه بر زیرمشتق، مفاهیم دیگر مانند زیرگرادیان و زیردیفرانسیل نیز از مواردی است که در این نوشتار به آن پرداخته شد.
این مفاهیم بخصوص برای حل مسائل بهینهسازی چند متغیره در مهندسی و رشتههای صنایع به کار گرفته میشود. از آنجایی که بسیاری از تبدیلات در ریاضیات براساس توابع محدب انجام میشوند، وجود زیرمشتق برای آنها در علوم و فنونی که از این گونه تبدیلات استفاده میکنند، امری مهم تلقی میشود.