زیرمشتق و خواص آن — به زبان ساده

۴۰۹ بازدید
آخرین به‌روزرسانی: ۲۱ تیر ۱۴۰۲
زمان مطالعه: ۸ دقیقه
دانلود PDF مقاله
زیرمشتق و خواص آن — به زبان ساده

یکی از مفاهیم و اصطلاحات رایج در ریاضیات، مشتق (Derivation) و مشتق‌پذیری (Derivative) است. شرایط خاصی برای توابع در نظر گرفته می‌شود تا مشتق‌پذیر باشند. معمول‌ترین آن‌ها با توجه به تعریف حد (Limit) و همچنین تعریف مشتق براساس حد صورت می‌گیرد. براین اساس هر تابعی که مشتق‌پذیر باشد، پیوسته بوده ولی عکس آن صحیح نیست. به این معنی که ممکن است تابعی (مانند تابع قدرمطلق) پیوسته بوده ولی در یک یا بعضی از نقاطش، مشتق‌پذیر نباشد. چنین وضعیتی دانشمندان را به سوی تعریف دیگری سوق داد که بتوانند در چنین مواردی مفهومی مانند زیرمشتق را ارائه دهند. این کار بخصوص برای توابع محدب کارساز است زیرا رفتار زیرمشتق شبیه مشتق بوده و بخصوص برای بهینه سازی توابعی محدب مناسب است.

997696

در این نوشتار براساس شرایط ساده‌تر و برای «توابع محدب» (Convex Function)، مفهوم جدیدی از مشتق ارائه می‌شود که به آن «زیرمشتق» (Subderviation) می‌گویند. تابعی را که برای همه اعضای دامنه‌اش زیرمشتق داشته باشد، «زیرمشتق‌پذیر» (Subderviative) می‌نامند.

برای آشنایی بیشتر با مفهوم حد و مشتق بهتر است مطالب دیگر مجله فرادرس با عنوان‌های حد در ریاضی — به زبان ساده و مشتق — به زبان ساده را مطالعه کنید. همچنین خواندن پیوستگی (Continuity) و تابع پیوسته (Continues Function) — به زبان ساده و توابع محدب و مقعر — از صفر تا صد نیز خالی از لطف نیست.

زیرمشتق و خواص آن

در ریاضیات سه مفهوم «زیرمشتق‌» (Subderviative)، «زیرگرادیان» (Sub-gradient) و «زیردیفرانسیل» (Sub-differential) به یک موضوع اشاره دارند و تعمیمی برای مفاهیم اولیه مشتق، گردیان و دیفرانسیل هستند. در حقیقت این سه اصطلاح، مشتق‌پذیری برای توابع محدب بدون شرط وجود دیفرانسیل را برآورده می‌کنند.

زیردیفرانسیل برای یک تابع محدب اولین بار توسط «ژان ماریو» (Jean Moreau) ریاضی‌دان فرانسوی و «رالف راکفلر» (Ralph Tyrrell Rockafellar) ریاضی‌دان آمریکایی در اوایل سال 1960 معرفی شد. همچنین در دهه ۸۰ میلادی نیز «زیردیفرانسیل تعمیم یافته» (Generalize Sub-differential) برای توابع «غیرمحدب» (Non-Convex) توسط «کلارک» (Clarke) و «راکفلر» (Rockafellar) طی مقاله‌ای، مطرح و به کار گرفته شد.

ژان مریو (Jean Jacques Moreau) زیاضی‌دان فرانسوی
ژان مریو (Jean Jacques Moreau)، ریاضی‌دان فرانسوی
رالف راکفلر (Ralph Rockafellar) ریاضی‌دان آمریکایی
رالف راکفلر (Ralph Rockafellar)، ریاضی‌دان آمریکایی

در اکثر مواقع از زیرمشتق و زیردیفرانسیل برای توابع محدب و مباحث مربوط به بهینه‌سازی چنین توابع در «تحلیل مسائل محدب» (Convex Analysis) استفاده می‌کنند. پس بهتر است ابتدا به مفهوم و معنی تابع محدب بپردازیم.

تابع ff را روی دامنه‌اش محدب (Convex) گویند اگر برای هر بازه از دامنه آن مثل [x1,x2][x_1,x_2]، مقدار تابع برای این فاصله از مقدار خطی که این دو نقطه را به یکدیگر متصل می‌کند کوچکتر یا مساوی باشد. برای روشن شدن موضوع به تصویر زیر توجه کنید.

convex Curve function
تصویر ۱: تابع محدب در مجموعه اعداد حقیقی

دو مقدار x1x_1 و x2x_2 را با شرط x1<x2x_1 < x_2 در نظر بگیرید. مقدار تابع f(x)f(x) در تمامی مقادیری از محور افقی که در بین x1x_1 و x2x_2 قرار گرفته‌اند، از مقدار عرض خطی که دو نقطه (x1,f(x1))(x_1 , f(x_1)) و (x2,f(x2))(x_2,f(x_2)) را به یکدیگر وصل کرده، کوچکتر است. واضح است که براساس t>0t>0 می‌توان تمامی نقاط در این فاصله را ایجاد کرد. این کار در رابطه ۱ صورت گرفته است.

طبق تعریف، تابع ff را روی دامنه‌اش (DfD_f) محدب گویند، اگر:

x1,x2Df  ,t[0,1]:f(tx1+(1t)x2)tf(x1) +(1t)f(x2) \large{ \displaystyle \forall x_{1},x_{2}\in D_f \;,\forall t \in [0,1] : \qquad f(tx_{1} + ( 1 - t) x_{2})\leq tf(x_{1})  +( 1 - t)f(x_{2})}

رابطه ۱‌: تعریف تابع محدب

توابعی مانند f(x)=x2f(x)=x^2 و f(x)=xp,    p1f(x)=|x|^p, \;\;p \geq 1 محدب هستند. همچنین تابع exe^x نیز محدب محسوب می‌شود.

برای مثال تابع f(x)=x2f(x)=x^2 را مورد بررسی قرار می‌دهیم. دو نقطه x1=0x_1=0 و x2=1x_2=1 و مقدار تابع در این دو نقطه را در نظر بگیرید.

 f(x1)=f(0)=02=0 ,      f(x2)=f(1)=12=1 \large  f(x_1) = f( 0 ) = 0^2 = 0  , \;\;\; f( x_2 ) = f(1) = 1^2 = 1

معادله خطی که این دو نقطه (0,0),(1,1)(0,0) , (1,1) را به یکدیگر متصل می‌کند به صورت زیر است:

 y0=1010(x0)y=x \large  y - 0 = \dfrac{1 - 0}{ 1 - 0} (x - 0) \rightarrow y = x

می‌دانیم که برای مقادیر مثبت کوچکتر از ۱، مربع این مقادیر از خودشان کوچکتر است. در نتیجه همیشه مقدار تابع f(x)=x2f(x)=x^2 در این بازه از مقدار خطی که دو نقطه (0,0)(0,0) و (1,1)(1,1) را به یکدیگر وصل می‌کند کوچکتر است.

X^2 Function plot

در ادامه با تابع قدر مطلق به عنوان یک تابع محدب بیشتر کار خواهیم کرد. در تصویر ۲، نمودار تابع قدر مطلق f(x)=xf(x) = |x|‌ را مشاهده می‌کنید که در شرایط مربوط به تابع محدب صدق می‌کند. تعریف ریاضی تابع محدب نیز براساس مقادیر میانگین وزنی برحسب tt در رابطه ۱ دیده می‌شود.

فرض کنید تابع حقیقی مقدار ff وجود داشته باشد که محدب است. ممکن است چنین تابعی در همه دامنه‌اش، مشتق‌پذیر نباشد. برای مثال تابع زیر از این گونه توابع محسوب می‌شود.

 x,    xR \large  | x | , \; \; x \in R

بر اساس تصویر زیر که مربوط به تابع قدرمطلق در رابطه بالا است، محدب بودن به خوبی دیده می‌شود. از طرفی واضح است که این تابع در صفر مشتق‌پذیر نیست.

Absolute_value
تصویر ۲: تابع قدر مطلق و مطابقت آن با تعریف تابع محدب

هر چند این تابع پیوسته است ولی در نقطه x=0x = 0 به علت وجود تغییر جهت و نوک در نقطه صفر، تابع مشتق‌پذیر نیست. زیرا طبق مفهوم مشتق باید داشته باشیم:

limx0xx={1x01x<0 \large \lim_{x \to 0} \dfrac{|x|}{x} = \begin{cases} 1 & x \geq 0\\ -1 & x < 0 \end{cases}

رابطه ۲

پس چنین تابعی مشتق‌پذیر در x=0x = 0‌ نیست در نتیجه نمی‌توان آ‌ن را در کل دامنه‌اش، مشتق‌پذیر خواند.

ولی توجه داشته باشید که تابع f(x)=xf(x) = |x|، طبق رابطه ۱، محدب است زیرا در این صورت برای تابع قدر مطلق، داریم:

x1,x2Df  ;  t[0,1]:tx1+(1t)x2tx1+(1t)x2 \large { \displaystyle \forall x_{1}, x_{2} \in D_f \; ;\; \forall t\in [0,1] : \quad |tx_{1} + (1 - t) x_{2}|\leq t|x_{1}| + (1-t)|x_{2}|}

مشخص است که رابطه بالا به لحاظ خصوصیات تابع قدرمطلق و نامساوی‌های مربوطه به راحتی تعیین می‌شود. در نتیجه تابع قدرمطلق، محدب بوده ولی مشتق‌پذیر نیست.

زیرمشتق و تعریف آن

به منظور رفع مشکل مشتق‌پذیری توابع در نقاط نوک تیز (بخصوص برای توابع محدب)، مفهوم جدیدی به نام زیرمشتق ارائه شده است. در ادامه تعریف زیر مشتق را خواهیم دید.

تعریف زیر مشتق: زیرمشتق‌ تابع محدب مانند ff که دارای مقادیری از اعداد حقیقی است در نقطه x0x_0 از دامنه آن برابر است با cc‌ اگر رابطه زیر برقرار باشد.

f(x)f(x0)c(xx0),      xDf \large f(x) - f(x_{0}) \geq c (x - x_{0}) ,\;\;\; \forall x \in D_f

رابطه ۳

به این ترتیب اگر تابعی، در این تعریف برای همه مقادیر دامنه‌اش، دارای زیرمشتق باشد، آن را زیرمشتق‌پذیر می‌نامند. واضح است که مقدار cc منحصر به فرد نیست. در نتیجه ممکن است زیر مشتق یک تابع به صورت یک مجموعه از مقادیر محسوب شود که در رابطه ۳، صدق کنند.

نکته: ممکن است در یک بازه [a,b][a,b] شرایط زیرمشتق‌پذیری تابع ff برقرار باشد. در این صورت براساس حد‌های یک طرفه خواهیم داشت:

a=limxx0f(x)f(x0)xx0b=limxx0+f(x)f(x0)xx0 \large { \displaystyle a = \lim _{{x \to x_{0}^{-}}}{\frac {f(x) - f (x_{0})}{x - x_{0}}}} \\ \large { \displaystyle b = \lim _{x \to x_{0}^{+}}{\frac {f (x) - f (x_{0})}{x - x_{0}}}}

مجموعه [a,b][a,b] را که شامل همه نقاط زیر‌مشتق تابع ff در نقطه x0x_0 است، زیردیفرانسیل آن تابع می‌نامند. از آنجایی که تابع ff، محدب است، اگر زیردیفرانسیل آن در نقطه x0x_0 شامل دقیقا یک نقطه باشد، آنگاه تابع ff را مشتق‌پذیر در x0x_0 می‌گویند.

مثال

تابع f(x)=xf(x)=|x| را در نظر بگیرید. در قسمت قبل نشان دادیم که این تابع، محدب است. در این صورت زیردیفرانسیل (مجموعه نقاط زیرمشتق‌ آن) در فاصله بسته [1,1][-1,1] قرار دارد. واضح است که زیردیفرانسیل برای نقطه‌های کوچکتر از ۰ برابر است با 1-1

1=limx0x0x0,    x<0 \large -1=\lim _{{x\to 0^{-}}}{\frac {|x - 0|}{x - 0}},\;\;x<0

و برای مجموعه نقاط x>0x>0 داریم:

1=limx0+x0x0,    x>0 \large 1=\lim _{{x\to 0^{+}}}{\frac {|x - 0|}{x - 0}},\;\;x>0

مقادیر حاصل از زیرمشتق تابع قدرمطلق، درست مانند تابع علامت ظاهر می‌شوند. ولی زیرمشتق در نقطه ۰، یک مقدار ثابت نشده است و شامل همه مقادیر زیرمشتق‌های ممکن خواهد بود.

در تصویر زیر مجموعه دیفرانسیل تابع f(x)=xf(x) = | x | براساس خطوط مختلف نشان داده شده است. همانطور که دیده می‌شود، مجموعه نقاطی که در زیر منحنی x|x| قرار دارند، زیردیفرانسیل این تابع خواهند بود.

subderviation example
تصویر ۳: تابع محدب قدر مطلق و زیردیفرانسیل‌های آن در نقطه x=0x=0

به عنوان یک مثال دیگر به تابعی که در تصویر 4 دیده می‌شود، توجه کنید. این تابع در یک یا چند نقطه از دامنه‌اش، دارای شکست است. فرض کنید می‌خواهیم زیردیفرانسیل این تابع را در نقطه x0x_0 مشخص کنیم. در این تصویر، تابع محدب به رنگ آبی مشخص شده و خطوط قرمز رنگ، زیرمشتق‌های آن را در نقطه x0x_0 نشان می‌دهند.

Subderivative_illustration
تصویر 4: تابع با نقاط شکست و خطوط مربوط به زیر مشتق‌ها

واضح است که شیب همه خطوط مماس بر تابع در نقطه x0x_0، پاسخ‌های زیردیفرانسیل تابع f(x)f(x) در نقطه x0x_0 با توجه به شرط مربوط به رابطه ۳ خواهند بود.

نکته: همانطور که متوجه شدید، زیرمشتق، یک مجموعه است که توسط رابطه ۱ مشخص شده است. به این ترتیب مجموعه نقاط زیرمشتق تابع ff، به نقاطی از دامنه تابع (مثل cc) گفته می‌شوند که در رابطه ۳ صدق می‌کنند. اگر این مجموعه، شامل فقط یک نقطه باشد، زیرمشتق‌ها تبدیل به مشتق شده و تابع را مشتق‌پذیر می‌نامند.

خصوصیات زیرمشتق تابع

همانطور که مشتق و مشتق‌پذیری توابع دارای خصوصیات بودند، برای زیرمشتق تابع نیز می‌توان ویژگی‌های زیر را اثبات کرد.

  • تابع محدب ff روی اعداد حقیقی، مشتق‌پذیر در x0x_0 است، اگر و فقط اگر نقاط زیرمشتق آن فقط یک نقطه باشد. به بیان دیگر مجموعه زیرمشتق‌های آن فقط شامل یک نقطه بوده که همان مشتق تابع در نقطه x0x_0 است.
  • نقطه x0x_0 یک نقطه کمینه فراگیر برای تابع محدب ff است، اگر و فقط اگر صفر در مجموعه زیرمشتق‌های تابع، وجود داشته باشد. به این معنی که بتوان خطوط افقی (به نام خط زیرمشتق) روی نمودار تابع ff از نقطه (x0,f(x0))\Big(x_0,f(x_0)\Big) ترسیم کرد. همانطور که مشخص است این خاصیت، همان وجود مقدار کمینه محلی برای تابع مشتق‌پذیر است.
  • اگر تابع ff و gg محدب بوده و زیرمشتق‌های f(x)\partial f(x) و g(x)\partial g(x) موجود باشند، آنگاه برای مجموع این دو تابع هم داریم:

(f+g)(x)=f(x)+g(x) \partial ( f + g )(x) = \partial f(x) + \partial g(x)

نکته: منظور از رابطه + در فرمول بالا، «جمع مینکوفسکی» (Minkowski Sum) است. زیرا که f(x)\partial f(x) و g(x)\partial g(x) هر دو یک مجموعه هستند. توجه داشته باشید که جمع مینکوفسکی دو مجموعه AA و BB به صورت زیر تعریف شده است.

A+B={a+baA, bB} \large A + B = \{ \mathbf {a} + \mathbf {b} \, | \, \mathbf {a} \in A ,\ \mathbf {b} \in B \}

رابطه 4

زیرگرادیان

همانطور که دیدید، مفهوم مشتق را می‌توان به زیرمشتق برای یک تابع محدب گسترش داد. در این بین مفهوم گرادیان (مشتق جهت دار) به زیرگرادیان (Subgradient) قابل توسعه است. به این ترتیب براساس یک تابع چند متغیره می‌توان زیرمشتق را تعریف و به کار گرفت.

فرض کنید تابع ff یک تابع حقیقی مقدار محدب باشد که روی یک مجموعه محدب باز (Convex open set) در فضای اقلیدسی Rn R^n تعریف شده است.

f:UR \large f : U \to R

بردار ν \overrightarrow{\nu} در این فضا را یک زیرگرادیان در نقطه x0 \overrightarrow{x_0} در UU برای تابع ff گویند اگر برای هر x \overrightarrow{x} در UU رابطه 5 برقرار باشد.

f(x)f(x0)ν(xx0) \large f(\overrightarrow{x}) - f(\overrightarrow{x_0}) \geq \overrightarrow{\nu} \cdot (\overrightarrow{x} - \overrightarrow{x_{0}})

رابطه ۵

نکته: در این جا منظور از ν(xx0) \overrightarrow{\nu} \cdot (\overrightarrow{x} -\overrightarrow{x_{0}} ) ضرب داخلی (Dot Product) دو بردار ν \overrightarrow{\nu} و x x0 \overrightarrow{x} -  \overrightarrow{x_0} است.

مجموعه همه گرادیان‌های نقطه x0x_0 را زیردیفرانسیل در نقطه x0x_0 نامیده و به صورت f(x0)\partial f(x_0) نشان می‌دهند. به این موضوع توجه داشته باشید که زیردیفرانسیل همیشه یک «مجموعه ناتهی محدب فشرده» (Nonempty Convex Compact Set) است.

همین مفهوم را به تابع محدب و «فضای محدب محلی» (Locally Convex Space) مثل VV توسعه می‌دهیم. فرض کنید که تابع f f یک تابع چند متغیره روی V V است. به این معنی که داریم:

f:UR \large f : U \to \mathbf{R}

تابعک (Functional) vv^* در فضای مضاعف VV^* (Dual Space) را یک زیرگرادیان x0x_0 در UU گویند اگر برای هر x x در U U داشته باشیم:

f(x)f(x0)v(xx0)\large f(x) - f(x_{0}) \geq v^{*}(x - x_{0})

رابطه ۶

مجموعه همه زیرگرادیان‌های x0 x_0 که در رابطه ۶ صدق کنند، زیردیفرانسیل تابعک (Functional) vv^* در x0 x_0 گفته و به صورت f(x0) \partial f ( x_0 ) نشان می‌دهند.

خلاصه و جمع‌بندی

در این نوشتار به تعمیم موضوع مشتق پرداخته و با زیرمشتق به عنوان یک زیر مجموعه از مقادیر دامنه تابع آشنا شدیم. همچنین رابطه‌ای که مقادیر زیرمشتق یک تابع محدب را مشخص می‌کند در این نوشتار معرفی شده و با استفاده از تابع قدر مطلق مفهوم زیرمشتق بیشتر روشن گردید. علاوه بر زیرمشتق، مفاهیم دیگر مانند زیرگرادیان و زیردیفرانسیل نیز از مواردی است که در این نوشتار به آن پرداخته شد.

این مفاهیم بخصوص برای حل مسائل بهینه‌سازی چند متغیره در مهندسی و رشته‌های صنایع به کار گرفته می‌شود. از آنجایی که بسیاری از تبدیلات در ریاضیات براساس توابع محدب انجام می‌شوند، وجود زیرمشتق برای آن‌ها در علوم و فنونی که از این گونه تبدیلات استفاده می‌کنند، امری مهم تلقی می‌شود.

بر اساس رای ۵ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
مجله فرادرسWikipedia
نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *