اثر ماتریس (Trace) در جبر خطی — به زبان ساده

۹۴۸۸ بازدید
آخرین به‌روزرسانی: ۹ خرداد ۱۴۰۲
زمان مطالعه: ۵ دقیقه
دانلود PDF مقاله
اثر ماتریس (Trace) در جبر خطی — به زبان ساده

در مبحث «جبر خطی» (Linear Algebra)، اثر ماتریس مربعی AA که به شکل tr(A)\operatorname{tr}(A) نوشته می‌شود، به صورت جمع عنصرهای قرار گرفته روی «قطر اصلی» (Main Diagonal) محاسبه می‌شود. از آنجایی که بحث اثر ماتریس در «مقدارهای ویژه» (Eigenvalues) و «دترمینان» (Determinant) ماتریس نقش مهمی دارد، در این نوشتار به بررسی این موضوع می‌پردازیم.

997696

برای آشنایی با ماتریس و مقدارهای ویژه و دترمینان بهتر است مطالب ماتریس‌ها — به زبان ساده، بردار ویژه و مقدار ویژه — از صفر تا صد و دترمینان یک ماتریس — به زبان ساده را مطالعه کنید. همچنین خواندن نوشتار معکوس ماتریس یا ماتریس وارون – به زبان ساده و تانسور چیست؟ — مفاهیم اصلی نیز خالی از لطف نیست.

اثر یک ماتریس (Trace)

فرض کنید ماتریس AA یک ماتریس مربعی n×nn\times n باشد. اگر درایه‌های این ماتریس را به صورت aija_{ij} نشان دهیم، اثر ماتریس AA که به صورت tr(A)tr(A) نشان داده می‌شود، همان مجموع عناصر قطر اصلی بوده که به بیان ریاضی به صورت زیر بدست می‌آید.

tr(A)=i=1naii=a11+a22++ann\large {\displaystyle \operatorname {tr} (\mathbf {A} )=\sum _{i=1}^{n}a_{ii}=a_{11}+a_{22}+\dots +a_{nn}}

واضح است که درایه‌های aiia_{ii} عناصر قطر اصلی را نشان می‌دهند.

قبل از آنکه با خصوصیات اثر یک ماتریس آشنا شویم، در ادامه متن، نحوه محاسبه اثر یک ماتریس مربعی را مرور می‌کنیم. برای روشن شدن موضوع به مثال زیر دقت کنید. توجه کنید که قطر اصلی فقط برای یک ماتریس مربعی تعریف شده است.

مثال ۱

فرض کنید ماتریس مربعی AA به صورت زیر معرفی شده است.

A=(a11a12a13a21a22a23a31a32a33)=(10311526125)\large {\displaystyle \mathbf {A} ={\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{pmatrix}}={\begin{pmatrix}-1&0&3\\11&5&2\\6&12&-5\end{pmatrix}}}

در این صورت اثر یا tr(A)\operatorname {tr}(A) به صورت زیر بدست خواهد آمد.

tr(A)=i=13aii=a11+a22+a33=1+5+(5)=1\large {\displaystyle \operatorname {tr} (\mathbf {A} )=\sum _{i=1}^{3}a_{ii}=a_{11}+a_{22}+a_{33}=-1+5+(-5)=-1}

حال که از شیوه محاسبه اثر یک ماتریس آگاه شدید، در ادامه به بررسی بعضی از خصوصیات جالب برای اثر ماتریس و ارتباط آن با دیگر خصوصیات ماتریس‌ها می‌پردازیم.

اثر جمع دو ماتریس

فرض کنید AA و BB‌ دو ماتریس مربعی هم رتبه باشند. منظور از هم رتبه بودن دو ماتریس، یکسان بودن تعداد سطرها یا ستون‌های ماتریس است. در این صورت اثر مجموع دو ماتریس AA و BB برابر با مجموع اثرهای‌های ماتریس‌ها خواهد بود. این خاصیت به بیان ریاضی به صورت زیر نوشته می‌شود.

tr(A+B)=tr(A)+tr(B)\large \operatorname {tr} (\mathbf {A} +\mathbf {B} )=\operatorname {tr} (\mathbf {A} )+\operatorname {tr} (\mathbf {B} )

مثال ۲

فرض کنید دو ماتریس مربعی 3×33\times 3 با نام‌های AA و BB به صورت زیر مشخص شده‌اند.

A=(123456789)B=(102030405060708090)\large A =\begin{pmatrix}1&2&3\\4&5&6\\7&8&9\end{pmatrix}\\\large B =\begin{pmatrix}10&20&30\\40&50&60\\70&80&90\end{pmatrix}

اثر حاصل جمع را به صورت زیر محاسبه می‌کنیم. ابتدا اثر هر یک از ماتریس‌ها را بدست می‌آوریم.

tr(A)=1+5+9=15tr(B)=10+50+90=150\large \operatorname{tr}(A) =1+5+9=15\\ \large \operatorname{tr}(B)=10+50+90=150

حال اثر ماتریس AA را با ماتریس BB جمع می‌کنیم. در نتیجه داریم:

tr(A+B)=tr(A)+tr(B)=15+150=165\large \operatorname{tr}(A+B)=\operatorname{tr}(A)+\operatorname{tr}(B)=15+150=165

نکته: می‌توانیم برای محاسبه اثر جمع دو ماتریس، ابتدا حاصل جمع ماتریس‌ها را محاسبه کرده سپس اثر ماتریس حاصل جمع را بدست آوریم. البته مشخص است که هر دو یک نتیجه را نشان می‌دهند.

tr(A+B)=tr(1+102+203+304+405+506+607+708+809+90)=tr(112233445566778899)=11+55+99=165\operatorname{tr}(A+B) =\operatorname{tr} \begin{pmatrix}1+10&2+20&3+30\\4+40&5+50&6+60\\7+70&8+80&9+90\end{pmatrix}=\operatorname{tr}\begin{pmatrix}11&22&33\\44&55&66\\77&88&99\end{pmatrix}=11+55+99=165

همچنین اگر cc مقدار عددی ثابت و حقیقی‌ باشد، آنگاه رابطه زیر نیز برای اثر هر ماتریسی مثل AA برقرار است.

tr(cA)=ctr(A)\large \operatorname {tr} (c\mathbf {A} )=c\operatorname {tr} (\mathbf {A})

برای مثال اگر ماتریس AA‌ در مثال قبل را در c=10c=10 ضرب کنیم و حاصل را به شکل ماتریس AA\prime نشان دهیم، خواهیم داشت:

tr(A)=tr(10A)=10tr(A)=10×15=150\large \operatorname {tr} (\mathbf {A}\prime)= \operatorname {tr} (10 \mathbf {A})=10\operatorname {tr} (\mathbf {A})=10 \times 15 =150

اثر ترانهاده یک ماتریس

فرض کنید ماتریس AA در اختیار ما است و لازم است که اثر ماتریس ترانهاده آن را محاسبه کنیم. با توجه به تعریفی که برای «ترانهاده» (Transpose) یک ماتریس وجود دارد، تغییری در عنصر روی قطر اصلی ماتریس AA هنگام محاسبه ترانهاده آن بوجود نمی‌آید.

بنابراین می‌توان نشان داد که اثر ماتریس AA با اثر ماتریس ترانهاده‌اش یکسان است. این موضوع را به بیان ریاضی به صورت زیر می‌نویسیم.

tr(A)=tr(AT)\large {\displaystyle \operatorname {tr} (\mathbf {A} )=\operatorname {tr} \left(\mathbf {A} ^{\mathsf {T}}\right)}

توجه داشته باشید که نماد ATA^T برای نمایش ترانهاده ماتریس AA به کار رفته است.

مثال ۳

با توجه به ماتریس مربوط به مثال ۱ رابطه‌های زیر را داریم.

AT=(11160512325)tr(AT)=1+55=1\large A^T ={\begin{pmatrix}-1&11&6\\0&5&12\\3&2&-5\end{pmatrix}}\\ \large \operatorname{tr}(A^T)=-1+5-5=-1

در نتیجه جمع عناصر قطر اصلی آن که بیانگر اثر ماتریس ترانهاده است، با اثر ماتریس AA یکی است.

اثر ضرب دو ماتریس

فرض کنید AA و BB دو ماتریس باشند بطوری که ATBA^TB یک ماتریس مربعی است. در این صورت رابطه زیر برای اثر حاصل ضرب این دو ماتریس برقرار است.

tr(ATB)=tr(ABT)=tr(BTA)=tr(BAT)=i,jAijBij.\large{\displaystyle \operatorname {tr} \left(\mathbf {A} ^{\mathsf {T}}\mathbf {B} \right)=\operatorname {tr} \left(\mathbf {A} \mathbf {B} ^{\mathsf {T}}\right)=\operatorname {tr} \left(\mathbf {B} ^{\mathsf {T}}\mathbf {A} \right)=\operatorname {tr} \left(\mathbf {B} \mathbf {A} ^{\mathsf {T}}\right)=\sum _{i,j}A_{ij}B_{ij}.}

اثر حاصلضرب دو ماتریس شبیه ضرب مولفه‌ای ماتریس‌ها به نظر می‌رسد. به این ترتیب اگر از نماد oo برای نمایش ضرب مولفه‌ای استفاده کنیم، برای محاسبه اثر ضرب دو ماتریس  خواهیم داشت.

tr(ATB)=i,j(AB)ij\large{\displaystyle \operatorname {tr} \left(\mathbf {A} ^{\mathsf {T}}\mathbf {B} \right)=\sum _{i,j}(\mathbf {A} \circ \mathbf {B} )_{ij}}

نکته: «ضرب مولفه‌ای» (Hadamard Produnct) برای دو ماتریس هم رتبه (مثلا 3×33 \times 3) به صورت زیر تعریف می‌شود.

[a11a12a13a21a22a23a31a32a33][b11b12b13b21b22b23b31b32b33]=[a11b11a12b12a13b13a21b21a22b22a23b23a31b31a32b32a33b33]{\displaystyle {\begin{bmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{bmatrix}}\circ {\begin{bmatrix}b_{11}&b_{12}&b_{13}\\b_{21}&b_{22}&b_{23}\\b_{31}&b_{32}&b_{33}\end{bmatrix}}={\begin{bmatrix}a_{11}\,b_{11}&a_{12}\,b_{12}&a_{13}\,b_{13}\\a_{21}\,b_{21}&a_{22}\,b_{22}&a_{23}\,b_{23}\\a_{31}\,b_{31}&a_{32}\,b_{32}&a_{33}\,b_{33}\end{bmatrix}}}

به این ترتیب اگر AA یک ماتریس m×nm \times n و BB ماتریس n×m n \times m باشد، رابطه زیر برقرار است.

tr(AB)=tr(BA)\large {\displaystyle \operatorname {tr} (\mathbf {A} \mathbf {B} )=\operatorname {tr} (\mathbf {B} \mathbf {A} )}

زیرا

tr(AB)=i=1m(AB)ii=i=1mj=1naijbji=\large {\displaystyle \operatorname {tr} (\mathbf {A} \mathbf {B} )=\sum _{i=1}^{m}\left(\mathbf {A} \mathbf {B} \right)_{ii}=\sum _{i=1}^{m}\sum _{j=1}^{n}a_{ij}b_{ji}=}

j=1ni=1mbjiaij=j=1n(BA)jj=tr(BA)\large {\displaystyle \sum _{j=1}^{n}\sum _{i=1}^{m}b_{ji}a_{ij}=\sum _{j=1}^{n}\left(\mathbf {B} \mathbf {A} \right)_{jj}=\operatorname {tr} (\mathbf {B} \mathbf {A} )}

این خاصیت را برای ترتیب چرخشی از ماتریس‌ها نیز می‌توان در نظر گرفت. به این معنی که اگر A,B,C,DA, B, C, D چهار ماتریس قابل ضرب باشند، رابطه بالا برای ترتیب‌های چرخشی زیر قابل استفاده است.

tr(ABCD)=tr(BCDA)=tr(CDAB)=tr(DABC)\large {\displaystyle \operatorname {tr} (\mathbf {A} \mathbf {B} \mathbf {C} \mathbf {D} )=\operatorname {tr} (\mathbf {B} \mathbf {C} \mathbf {D} \mathbf {A} )=\operatorname {tr} (\mathbf {C} \mathbf {D} \mathbf {A} \mathbf {B} )=\operatorname {tr} (\mathbf {D} \mathbf {A} \mathbf {B} \mathbf {C} )}

نکته: توجه داشته باشید که این رابطه برای هر ترتیب دلخواه (‌به غیر از ترتیب چرخشی) قابل انجام نیست. برای مثال به رابطه زیر دقت کنید.

tr(ABC)tr(ACB)\large {\displaystyle \operatorname {tr} (\mathbf {A} \mathbf {B} \mathbf {C} )\neq \operatorname {tr} (\mathbf {A} \mathbf {C} \mathbf {B} )}

از آنجایی که تغییر ترتیب به صورت چرخشی نیست نمی‌توان انتظار داشت که رابطه برای اثر ضرب ماتریس‌ها در اینجا نیز برقرار باشد. ولی اگر براساس ضرب دو ماتریس مربعی این کار صورت بگیرد، می‌توان ترتیب را به صورت چرخشی در نظر گرفت و اثر ماتریس حاصلظرب AA در BB را از طریق ماتریس حاصلضرب BB در AA نیز بدست آورد.

ارتباط اثر ماتریس با مقدارهای ویژه

اگر λ1,,λn \lambda_1,\ldots , \lambda_n مقدارهای ویژه ماتریس مربعی An×nA_{n\times n} باشند می‌توان رابطه زیر را بین آن‌ها در نظر گرفت.

tr(A)=iλi\large {\displaystyle \operatorname {tr} (\mathbf {A} )=\sum _{i}\lambda _{i}}

نکته: می‌توان دترمینان ماتریس AA را برحسب مقدارهای ویژه آن نیز نوشته شود.

A=det(A)=iλi.\large {\displaystyle |\mathbf{A}|=\operatorname {det} (\mathbf {A} )=\prod _{i}\lambda _{i}.}

خلاصه

همانطور که خواندید، برای ماتریس‌های مربعی امکان محاسبه اثر ماتریس وجود دارد و از طریق مجموع عناصر قطر اصلی حاصل می‌شود. همچنین با استفاده از خصوصیاتی که اثر جمع و ضرب ماتریس‌ها دارد، می‌توانیم بدون محاسبه حاصل جمع یا ضرب ماتریس‌ها اثر ماتریس حاصل جمع یا ضرب را بدست آوریم. همچنین مشاهده کردید که مجموع مقدارهای ویژه ماتریس همان اثر ماتریس خواهد بود.

اگر علاقه‌مند به یادگیری مباحث مشابه مطلب بالا هستید، آموزش‌هایی که در ادامه آمده‌اند نیز به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۳۴ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
۴ دیدگاه برای «اثر ماتریس (Trace) در جبر خطی — به زبان ساده»

خیلی عالی خیلی ممنون که سایت به این خوبی دارید

با سلام، مفهوم اثر ماتریس و لزوم پیدایش آن در جبر خطی از نحوه محاسبه آن بسیار مهمتر است. من متاسفانه فلسفه این مفهوم را نیافتم. شما میدانید؟

ممنون بابت مباحث خوبی که میذارید خیلی خلاصه و مفید ارائه میدید.

ممنون دکتر

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *