قضیه تیلور — به زبان ساده

سری تیلور علاوه بر کاربرد در زمینههای مختلف، در ریاضیات محض، به ویژه در نظریه تابع (مختلط) کاربرد فراوان دارد. چندجملهای تیلور مقدار تقریبی یک تابع را در همسایگی یک نقطه بیان میکند. در این آموزش، با قضیه تیلور آشنا میشویم.
اگر $$ f ( x ) $$ در $$ x = a $$ بینهایت بار مشتقپذیر باشد، سری تیلور $$ f (x ) $$ در $$ x = a $$ طبق تعریف به صورت زیر خواهد بود:
$$ \large \sum _ { n = 0 } ^ \infty \frac { f ^ { ( n ) } ( a ) } { n ! } ( x – a ) ^ n = f ( a ) + f’ ( a ) ( x – a ) + \frac { f ^{\prime \prime} ( a ) } { 2 } ( x – a ) ^ 2 + \frac { f ^ {\prime \prime \prime } ( a ) } { 3 ! } ( x – a ) ^ 3 + \cdots . $$
این عبارت از بهترین تقریب چندجملهای (تا هر درجه) حول نقطه $$ x = a $$ میآید. برای $$ f ( x ) = \sin (x)$$ و $$ a = 0 $$، به سادگی میتوان همه $$ f ^ { ( n ) } ( 0 ) $$ها را محاسبه و مشاهده کرد که سری تیلور برای همه $$ x \in \mathbb R $$ (با آزمون نسبت) همگرا شود، اما این بدین معنی نیست که به وضوح باید به $$ \sin x $$ همگرا شود. مشتقها در $$ x = 0 $$ تنها به مقادیر بسیار نزدیک $$ x = 0 $$ بستگی دارند. اما چرا باید انتظار داشته باشیم که سری مقادیر تابع را «بدهد»؟
اینکه سری تیلور به تابع همگرا میشود، خود باید یک حقیقت غیربدیهی باشد. اغلب کتب درسی حسابان به یک قضیه تیلور (باقیمانده لاگرانژ) استناد میکنند، و احتمالاً ذکر میکنند که این یک قضیه تعمیمی از قضیه مقدار میانگین است. اثبات قضیه تیلور در کلیت آن ممکن است کوتاه باشد، اما خیلی روشن و واضح نیست. خوشبختانه، یک استنتاج بسیار طبیعی که فقط مبتنی بر قضیه اساسی حسابان است (و اندکی دیدگاه چندمتغیره) تمام چیزی است که برای اغلب توابع نیاز داریم.
قضیه تیلور و قضیه اساسی حسابان
با قضیه اساسی حسابان (FTC) و طبیعیترین فرم آن شروع میکنیم:
$$ \large f ( x ) = f ( a ) + \int _ a ^ x { \color {#D61F06} {f’ ( x _ 1 )} } \, d x _ 1 . $$
در عبارت بالا طبیعتاً $$ f $$ باید مشتقپذیر باشد (یعنی $$f’ $$ وجود داشته باشد) و $$f’ $$ بین $$ a $$ و $$ x $$ پیوسته باشد، به عبارتی $$ f $$ به طور پیوسته مشتقپذیر باشد (یا به اختصار $$ f \in C^ 1 $$). میتوانستیم اجازه دهیم $$f’$$ تعدادی پرش ناپیوسته داشته باشد، اما به زودی خواهیم دید که مشتقپذیر بودن کارساز خواهد بود. برای قطعیت، فرض کنید $$ x $$ بزرگتر از $$ a $$ و $$ x _ 1 $$ متغیری است از $$ a $$ تا $$ x $$ تغییر میکند.
اگر علاوه بر این، $$ f’ $$ =به طور پیوسته مشتقپذیر باشد (میگوییم $$ f $$ دو بار مشتقپذیر پیوسته است یا $$ f \in C^ 1 $$)، میتوانیم قضیه اساسی حسابان را روی بازه $$ [ a , x _ 1 ] $$ بر $$ f’ $$ اعمال کنیم:
$$ \large { \color {#D61F06} {{ f’ ( x _ 1 ) } = { \color {#D61F06} f’ ( a ) }+ \color {#D61F06} { \int _ a ^ { x _ 1 } }}{ \color {#20A900} { f ^ {\prime \prime } ( x _ 2 ) }} \, \color {#D61F06}d \color {#D61F06} {x _ 2} } . $$
با قرار دادن $$ x $$ در معادله، خواهیم داشت:
$$ \large \begin {aligned} f ( x ) & = f ( a ) + \int _ a ^ x \left ( { \color {#D61F06} {f’ ( a ) + \int _ a ^ { x _ 1 } }{ \color {#20A900}{ f ^ {\prime \prime } ( x _ 2 ) }} \, \color {#D61F06} {d x _ 2 }} \right ) d x _ 1 \\ & = f ( a ) + f’ ( a ) ( x – a ) + \int _ a ^ x \int _ a ^ { x _ 1 } { \color {#20A900} { f ^ { \prime \prime } ( x _ 2 )} }\, d x _ 2 \, d x _ 1 . \end {aligned} $$
اگر $$ f ^ {\prime \prime } $$ به طور پیوسته مشتقپذیر باشد (یعنی $$ f \in C ^ 3 $$)، مینویسیم:
$$ \large { \color {#20A900} { f ^ { \prime \prime } ( x _ 2 ) } } \color {#20A900} { = } { \color {#20A900} { f ^ {\prime \prime } ( a ) + \int _ a ^ { x _ 2 } } { \color {#EC7300} { f ^ { \prime \prime \prime }(x_3)}\, \color {#20A900} { d x _ 3 } } } , $$
بنابراین، اکنون داریم:
$$ \large \begin {aligned} f ( x ) & = f ( a ) + f’ ( a ) ( x – a ) + \int _ a ^ x \int _ a ^ { x _ 1 } \left ( { \color {#20A900}{ f ^ {\prime \prime } ( a ) + \int _ a ^ { x _ 2 } } { \color {#EC7300} { f ^ {\prime \prime \prime } ( x _ 3 ) } \, d x _ 3 } } \right ) \, d x _ 2 \, d x _ 1 \\ & = f ( a ) + f’ ( a ) ( x -a ) + f ^ {\prime \prime } ( a ) \frac { ( x – a ) ^ 2 } { 2 } + \int _ a ^ x \int _ a ^ { x _ 1 } \int _ a ^ { x _ 2 } { \color {#EC7300} { f ^ { \prime \prime \prime } ( x _ 3 ) } } \, d x _ 3 \, d x _ 2 \, d x _ 1 . \end {aligned} $$
این را میتوان به صورت زیر تعمیم داد.
قضیه تیلور
اگر $$ f ( x ) $$ به تعداد $$ n + 1 $$ بار روی بازه شامل $$ a $$ مشتقپذیر به صورت پیوسته باشد ($$ f \in C ^{ n + 1 }$$)، بنابراین، خواهیم داشت:
$$ \large f ( x ) = \sum _ { k = 0 } ^ n \frac { f ^ { ( k ) } ( a ) } { k ! } ( x – a ) ^ k + R _ { n + 1 } ( x ) , $$
که در آن،
$$ \large R _ { n + 1 } ( x ) = \int _ a ^ x \int _ a ^ { x _ 1 } \ldots \int _ a ^ { x _ n } f ^ { ( n + 1 ) } ( x _ { n + 1 } ) \, d x _ { n + 1 } \ldots d x _ 2 \, d x _ 1 , $$
به عنوان «باقیمانده» (Reminder) شناخته میشود.
به تعبیری، ما در حد توان اطلاعات در مورد مقدار $$ f ( x ) $$ را به نقطه $$ a $$ منتقل کردهایم و آنچه باقی مانده است یک جمله است که پیچیده به نظر میرسد.
مثال: قضیه بالا را برای $$ f ( x ) = \sin x $$، $$ a = 0 $$ و $$ n = 3 $$ اعتبارسنجی کنید.
حل: داریم:
$$ \large \begin {aligned} R _ 4 ( x ) & = \int _ 0 ^ x \int _ 0 ^ { x _ 1 } \int _ 0 ^ { x _ 2 } \int _ 0 ^ { x _ 3 } f ^ { ( 4 ) } ( x _ 4 ) \, d x _ 4 \, d x _ 3 \, d x _ 2 \, d x _ 1 \\ & = \int _ 0 ^ x \int _ 0 ^ { x _ 1 } \int _ 0 ^ { x _ 2 } \int _ 0 ^ { x _ 3 } \sin x _ 4 \, d x _ 4 \, d x _ 3 \, d x _ 2 \, d x _ 1 \\ & = \int _ 0 ^ x \int _ 0 ^ { x _ 1 } \int _ 0 ^ { x _ 2 } ( 1 -\cos x _ 3 ) \, d x _ 3 \, d x _ 2 \, d x _ 1 \\ & = \int _ 0 ^ x \int _ 0 ^ { x _ 1 } \left ( x _ 2 – \sin x _ 2 \right ) \, d x _ 2 \, d x _ 1 \\ & = \int _ 0 ^ x \left ( \frac { x _ 1 ^ 2 } { 2 } – ( 1 – \cos x _ 1 ) \right ) \, d x _ 1 \\ & = \frac { x ^ 3 } { 3 ! } – x + \sin x .\ _ \square \end{aligned} $$
توجه کنید اگر کران $$ f ^ { ( n + 1 )} $$ در بازه $$ ( a , x ) $$ وجود داشته باشد، میتوانیم به سادگی آنچه را که به «کران خطای لاگرانژ» (Lagrange’s Error Bound) موسوم است نتیجه بگیریم که برای اغلب کاربردها (مانند همگرایی سری تیلور) کفایت میکند.
کران خطای لاگرانژ: اگر $$ f ^ { ( n + 1 )} $$ در بازه $$ ( a , x ) $$ با مقدار $$ M $$ کراندار باشد، یعنی برای همه $$ \xi \in ( a , x ) $$ نامساوی $$ \big | f ^ { ( n +1 ) } ( \xi ) \big | \leq M $$ را داشته باشیم، آنگاه:
$$ \large \big | R _ { n + 1 } ( x ) \big | \leq \frac { M } { ( n + 1 ) ! } | x – a | ^ { n + 1 } . $$
باقیمانده
باقیمانده $$ R _ { n + 1 } ( x ) $$ همانگونه که در بالا بیان شد، یک انتگرال مکرر یا یک انتگرال چندگانه است که در حسابان چندمتغیره با آن روبهرو میشویم.
برای $$ n = 1 $$، باقیمانده
$$ \large R _ 2 ( x ) = \int _ a ^ x \int _ a ^ { x _ 1 } f ^ {\prime \prime} ( x _ 2 ) \, d x _ 2 \, d x _ 1 $$
یک «انتگرال دوگانه» است که در آن، انتگرالده در حالت کلی وابسته به دو متغیر $$ x _ 1 $$ و $$ x _ 2 $$ خواهد بود. در موردی که ما بررسی میکنیم، انتگرالده فقط به $$ x _ 2 $$ بستگی دارد، بنابراین اگر ابتدا انتگرال روی $$ x _ 1 $$ را اعمال کنیم، کارمان سادهتر خواهد بود. در واقع میتوانیم بنویسیم (با کمک قضیه فوبینی):
$$ \large \begin {aligned} R _ 2 ( x ) & = \int _ a ^ x { \color {#D61F06} { \int _ { x _ 2 } ^ x } f ^ { \prime \prime } ( x _ 2 ) } \, { \color {#D61F06} { d x _ 1 } } \, d x _ 2 \\ & = \int _ a ^ x f ^ { \prime \prime } ( x _ 2 ) { \color {#D61F06} { ( x – x _ 2 ) } } \, d x _ 2 . \end {aligned} $$
توجه کنید که حدود انتگرالگیری برای نگه داشتن کرانهای دو متغیر $$a \le x _ 2 \le x _ 1 \le x $$ تغییر کردهاند. در واقع، انتگرال را باید در یک مثلث قائمالزاویه در صفحه $$ x _ 1 x _ 2 $$ در نظر گرفت که سطح (علامتدار) زیر $$ F (x_ 1 , x _ 2 ) = f ^{\prime \prime} ( x _ 2 ) $$ را محاسبه میکند. این امر مشخص میکند که تغییر مرتبه انتگرالگیری بر نتیجه نهایی تأثیر نخواهد داشت.
برای حالت عمومی $$ R _ { n + 1 } ( x ) $$، ناحیه انتگرالگیری یک «سیمپلکس» یا «سادک» $$(n+1)$$بعدی است که با $$ a \leq x _ { n + 1 } \leq x _ n \leq \cdots \leq x _ 1 \leq x $$ تعریف شده و انتگرالگیری را در $$ x _ 1 $$، … و $$ x _ n $$ (با $$ x _ { n + 1 } $$ ثابت) حجم یک «$$n$$-سادک» (n-Simplex) قائمالزاویه را نشان میدهد. به عبارتی، داریم:
$$ \large \begin {aligned} R _ { n + 1 } ( x ) & = \int _ a ^ x \int _ a ^ { x _ 1 } \cdots \int _ a ^ { x _ n } f ^ { ( n + 1 ) } ( x _ { n + 1 } ) \, d x _ { n + 1 } \ldots d x _ 2 \, d x _ 1 \\ & = \int _ a ^ x { \color {#D61F06} { \int _ { x _ { n + 1 } } ^ { x } \cdots \int _ { x _ 2 } ^ { x } } } f ^ { ( n +1 ) } ( x _ { n + 1 } ) \, { \color {#D61F06} { d x _ 1 \ldots d x _ n } } \, d x _ { n + 1 } \\ & = \int _ a ^ x f ^ { ( n + 1 ) }( x _ { n + 1 } ) { \color {#D61F06} { \frac { ( x – x _ { n + 1 } ) ^ n } { n ! } } } \, d x _ { n + 1 } , \end {aligned} $$
و به عنوان «فرم انتگرال» (Integral Form) باقیمانده شناخته میشود.
قضیه: تحت شرایط مشابهی، خواهیم داشت:
$$ \large R _ { n + 1 } ( x ) = \int _ a ^ x f ^ { ( n + 1 ) } ( \xi ) \frac { ( x – \xi ) ^ n } { n ! } \, d \xi . $$
با استفاده از قضیه مقدار میانگین «حقیقی»، این انتگرال را میتوان با «مقدار میانگین» در $$ \xi \in ( a , x ) $$ که در طول $$ x – a $$ ضرب شده است جایگزین کرد. بنابراین، باقیمانده را به فرم کوشی به دست میآوریم.
قضیه کوشی:
$$ \large R _ { n + 1 } ( x ) = \frac { f ^ { ( n + 1 ) }( { \color {#D61F06} \xi } ) } { n ! } ( x – { \color {#D61F06} \xi } ) ^ n ( x – a ) \quad \text {for some } \ { \color {#D61F06} \xi } \in ( a , x ) . $$
در نهایت، برای به دست آوردن فرم لاگرانژ، لازم است به انتگرال $$(n+1)$$تایی اصلی نگاهی بیندازیم و نسخه چندمتغیره قضیه مقدار میانگین «حقیقی» را اعمال کنیم. این مقدار، یک انتگرال چندگانه روی یک ناحیه کراندار و همبند، برابر با «مقدار میانگین» آن در نقاطی در دامنه است که به وسیله پیوستگی انتگرالده ضرب در «حجم» ناحیه انتگرالگیری به دست میآید. بنابراین، قضیه زیر را خواهیم داشت.
قضیه لاگرانژ:
$$ \large R _ { n + 1 } ( x ) = \frac { f ^ { ( n + 1 ) } ( { \color {#D61F06} \xi } ) } { ( n + 1 ) ! } ( x – a ) ^ { n + 1 } \quad \text {for some } \ { \color {#D61F06} \xi } \in ( a , x ) . $$
توجه کنید که در اینجا غالباً یک $$\xi $$ متفاوت نسبت به باقیمانده کوشی داریم و در هر دو حالت نمیتوانیم پی ببریم چه جاهایی $$ \xi $$ دقیقاً بدون اطلاعات اضافی روی تابع $$ f ( x ) $$ است. به یاد آوردن باقیمانده لاگرانژ کار سادهای است، زیرا توصیف مشابهی مانند جمله بعدی در سری تیلور دارد، با این تفاوت که $$f ^ {(n+1)}$$ به جای نقطه $$a$$ باید در $$\xi$$ به دست آید.
همچنین، میتوان سایر فرمهای باقیمانده را با انتگرالگیری چند متغیر و نه همه متغیرهای $$ x _ 1 $$، … و $$ x _ n $$ به دست آورد و قضیه مقدار میانگین را به متغیرهای باقیمانده اعمال کرد.
قضیه: برای $$ p = 0 , 1 , … , n $$، داریم:
$$ \large R _ { n + 1 } ( x ) = \frac { f ^ { ( n + 1 ) }( { \color {#D61F06} \xi } ) } { p ! ( n + 1 – p ) ! } ( x – { \color {#D61F06} \xi } ) ^ { p } ( x – a ) ^ { n + 1- p } \quad \text {for some } { \color {#D61F06} \xi } \in ( a , x ) . $$
این عبارت بسیار نزدیک، اما نه کاملاً شبیه، به فرم «روخ-اسلومیخ» (Roche-Schlömilch) باقیمانده است.
همچنین لازم است یادآوری کنیم که فرم انتگرال معمولاً با اعمال پی در پی انتگرالگیری جزء به جزء به دست میآید که از انتگرال چندگانه جلوگیری میکند. با این حال، اثبات مشابهی را میتوان در نظر گرفت، زیرا انتگرالگیری جزء به جزء، در اصل، میگوید که میتوان ناحیه (مساحت) مشخصی را با انتگرالگیری برای متغیر $$ x $$ یا متغیر $$ y $$ محاسبه کرد.
همگرایی سری تیلور
علاوه بر ارائه تخمین خطا برای تقریب یک تابع با چند جمله اول سری تیلور، قضیه تیلور (با باقیمانده لاگرانژ) بخش مهمی را برای اثبات این موضوع نشان میدهد که سری تیلور کامل دقیقاً با تابعی که قرار است نشان دهد همگرا میشود.
مثال: $$ f ( x ) = \sin x $$ بینهایت بار مشتقپذیر است ($$ f \in C ^ \infty $$) و همه مشتقات $$ f ^ {(n)} ( x ) $$ یکی از چهار حالت ممکن $$ \pm \cos x $$ و $$ \pm \sin x $$ است. بنابراین، در هریک از $$ R_ { n + 1 } $$ فرم بالا میتوانیم کران $$ \big | f ^ { ( n + 1 ) } ( \xi ) \big | $$ را با $$ 1 $$ ساده کنیم. به گونهای که با استفاده از فرم لاگرانژ، برای هر عدد ثابت $$ a $$ و $$ x \in \mathbb R $$، داریم:
$$ \large \big | R _ { n + 1 } ( x ) \big | \leq \frac { | x -a | ^ { n + 1 } } { ( n + 1 ) ! } \to 0 \quad \text {as } \ n \to \infty $$