اثر ماتریس (Trace) در جبر خطی — به زبان ساده

در مبحث «جبر خطی» (Linear Algebra)، اثر ماتریس مربعی $$A$$ که به شکل $$\operatorname{tr}(A)$$ نوشته میشود، به صورت جمع عنصرهای قرار گرفته روی «قطر اصلی» (Main Diagonal) محاسبه میشود. از آنجایی که بحث اثر ماتریس در «مقدارهای ویژه» (Eigenvalues) و «دترمینان» (Determinant) ماتریس نقش مهمی دارد، در این نوشتار به بررسی این موضوع میپردازیم.
برای آشنایی با ماتریس و مقدارهای ویژه و دترمینان بهتر است مطالب ماتریسها — به زبان ساده، بردار ویژه و مقدار ویژه — از صفر تا صد و دترمینان یک ماتریس — به زبان ساده را مطالعه کنید. همچنین خواندن نوشتار معکوس ماتریس یا ماتریس وارون – به زبان ساده و تانسور چیست؟ — مفاهیم اصلی نیز خالی از لطف نیست.
اثر یک ماتریس (Trace)
فرض کنید ماتریس $$A$$ یک ماتریس مربعی $$n\times n$$ باشد. اگر درایههای این ماتریس را به صورت $$a_{ij}$$ نشان دهیم، اثر ماتریس $$A$$ که به صورت $$tr(A)$$ نشان داده میشود، همان مجموع عناصر قطر اصلی بوده که به بیان ریاضی به صورت زیر بدست میآید.
$$\large {\displaystyle \operatorname {tr} (\mathbf {A} )=\sum _{i=1}^{n}a_{ii}=a_{11}+a_{22}+\dots +a_{nn}}$$
واضح است که درایههای $$a_{ii}$$ عناصر قطر اصلی را نشان میدهند.
قبل از آنکه با خصوصیات اثر یک ماتریس آشنا شویم، در ادامه متن، نحوه محاسبه اثر یک ماتریس مربعی را مرور میکنیم. برای روشن شدن موضوع به مثال زیر دقت کنید. توجه کنید که قطر اصلی فقط برای یک ماتریس مربعی تعریف شده است.
مثال ۱
فرض کنید ماتریس مربعی $$A$$ به صورت زیر معرفی شده است.
$$\large {\displaystyle \mathbf {A} ={\begin{pmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{pmatrix}}={\begin{pmatrix}-1&0&3\\11&5&2\\6&12&-5\end{pmatrix}}}$$
در این صورت اثر یا $$\operatorname {tr}(A)$$ به صورت زیر بدست خواهد آمد.
$$\large {\displaystyle \operatorname {tr} (\mathbf {A} )=\sum _{i=1}^{3}a_{ii}=a_{11}+a_{22}+a_{33}=-1+5+(-5)=-1}$$
حال که از شیوه محاسبه اثر یک ماتریس آگاه شدید، در ادامه به بررسی بعضی از خصوصیات جالب برای اثر ماتریس و ارتباط آن با دیگر خصوصیات ماتریسها میپردازیم.
اثر جمع دو ماتریس
فرض کنید $$A$$ و $$B$$ دو ماتریس مربعی هم رتبه باشند. منظور از هم رتبه بودن دو ماتریس، یکسان بودن تعداد سطرها یا ستونهای ماتریس است. در این صورت اثر مجموع دو ماتریس $$A$$ و $$B$$ برابر با مجموع اثرهایهای ماتریسها خواهد بود. این خاصیت به بیان ریاضی به صورت زیر نوشته میشود.
$$\large \operatorname {tr} (\mathbf {A} +\mathbf {B} )=\operatorname {tr} (\mathbf {A} )+\operatorname {tr} (\mathbf {B} )$$
مثال ۲
فرض کنید دو ماتریس مربعی $$3\times 3$$ با نامهای $$A$$ و $$B$$ به صورت زیر مشخص شدهاند.
$$\large A =\begin{pmatrix}1&2&3\\4&5&6\\7&8&9\end{pmatrix}\\\large B =\begin{pmatrix}10&20&30\\40&50&60\\70&80&90\end{pmatrix}$$
اثر حاصل جمع را به صورت زیر محاسبه میکنیم. ابتدا اثر هر یک از ماتریسها را بدست میآوریم.
$$\large \operatorname{tr}(A) =1+5+9=15\\
\large \operatorname{tr}(B)=10+50+90=150$$
حال اثر ماتریس $$A$$ را با ماتریس $$B$$ جمع میکنیم. در نتیجه داریم:
$$\large \operatorname{tr}(A+B)=\operatorname{tr}(A)+\operatorname{tr}(B)=15+150=165$$
نکته: میتوانیم برای محاسبه اثر جمع دو ماتریس، ابتدا حاصل جمع ماتریسها را محاسبه کرده سپس اثر ماتریس حاصل جمع را بدست آوریم. البته مشخص است که هر دو یک نتیجه را نشان میدهند.
$$\operatorname{tr}(A+B) =\operatorname{tr} \begin{pmatrix}1+10&2+20&3+30\\4+40&5+50&6+60\\7+70&8+80&9+90\end{pmatrix}=\operatorname{tr}\begin{pmatrix}11&22&33\\44&55&66\\77&88&99\end{pmatrix}=11+55+99=165$$
همچنین اگر $$c$$ مقدار عددی ثابت و حقیقی باشد، آنگاه رابطه زیر نیز برای اثر هر ماتریسی مثل $$A$$ برقرار است.
$$\large \operatorname {tr} (c\mathbf {A} )=c\operatorname {tr} (\mathbf {A})$$
برای مثال اگر ماتریس $$A$$ در مثال قبل را در $$c=10$$ ضرب کنیم و حاصل را به شکل ماتریس $$A\prime$$ نشان دهیم، خواهیم داشت:
$$\large \operatorname {tr} (\mathbf {A}\prime)= \operatorname {tr} (10 \mathbf {A})=10\operatorname {tr} (\mathbf {A})=10 \times 15 =150$$
اثر ترانهاده یک ماتریس
فرض کنید ماتریس $$A$$ در اختیار ما است و لازم است که اثر ماتریس ترانهاده آن را محاسبه کنیم. با توجه به تعریفی که برای «ترانهاده» (Transpose) یک ماتریس وجود دارد، تغییری در عنصر روی قطر اصلی ماتریس $$A$$ هنگام محاسبه ترانهاده آن بوجود نمیآید.
بنابراین میتوان نشان داد که اثر ماتریس $$A$$ با اثر ماتریس ترانهادهاش یکسان است. این موضوع را به بیان ریاضی به صورت زیر مینویسیم.
$$\large {\displaystyle \operatorname {tr} (\mathbf {A} )=\operatorname {tr} \left(\mathbf {A} ^{\mathsf {T}}\right)}$$
توجه داشته باشید که نماد $$A^T$$ برای نمایش ترانهاده ماتریس $$A$$ به کار رفته است.
مثال ۳
با توجه به ماتریس مربوط به مثال ۱ رابطههای زیر را داریم.
$$\large A^T ={\begin{pmatrix}-1&11&6\\0&5&12\\3&2&-5\end{pmatrix}}\\ \large \operatorname{tr}(A^T)=-1+5-5=-1$$
در نتیجه جمع عناصر قطر اصلی آن که بیانگر اثر ماتریس ترانهاده است، با اثر ماتریس $$A$$ یکی است.
اثر ضرب دو ماتریس
فرض کنید $$A$$ و $$B$$ دو ماتریس باشند بطوری که $$A^TB$$ یک ماتریس مربعی است. در این صورت رابطه زیر برای اثر حاصل ضرب این دو ماتریس برقرار است.
$$\large{\displaystyle \operatorname {tr} \left(\mathbf {A} ^{\mathsf {T}}\mathbf {B} \right)=\operatorname {tr} \left(\mathbf {A} \mathbf {B} ^{\mathsf {T}}\right)=\operatorname {tr} \left(\mathbf {B} ^{\mathsf {T}}\mathbf {A} \right)=\operatorname {tr} \left(\mathbf {B} \mathbf {A} ^{\mathsf {T}}\right)=\sum _{i,j}A_{ij}B_{ij}.}$$
اثر حاصلضرب دو ماتریس شبیه ضرب مولفهای ماتریسها به نظر میرسد. به این ترتیب اگر از نماد $$o$$ برای نمایش ضرب مولفهای استفاده کنیم، برای محاسبه اثر ضرب دو ماتریس خواهیم داشت.
$$\large{\displaystyle \operatorname {tr} \left(\mathbf {A} ^{\mathsf {T}}\mathbf {B} \right)=\sum _{i,j}(\mathbf {A} \circ \mathbf {B} )_{ij}}$$
نکته: «ضرب مولفهای» (Hadamard Produnct) برای دو ماتریس هم رتبه (مثلا $$3 \times 3$$) به صورت زیر تعریف میشود.
$${\displaystyle {\begin{bmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{bmatrix}}\circ {\begin{bmatrix}b_{11}&b_{12}&b_{13}\\b_{21}&b_{22}&b_{23}\\b_{31}&b_{32}&b_{33}\end{bmatrix}}={\begin{bmatrix}a_{11}\,b_{11}&a_{12}\,b_{12}&a_{13}\,b_{13}\\a_{21}\,b_{21}&a_{22}\,b_{22}&a_{23}\,b_{23}\\a_{31}\,b_{31}&a_{32}\,b_{32}&a_{33}\,b_{33}\end{bmatrix}}}$$
به این ترتیب اگر $$A$$ یک ماتریس $$m \times n$$ و $$B$$ ماتریس $$ n \times m$$ باشد، رابطه زیر برقرار است.
$$\large {\displaystyle \operatorname {tr} (\mathbf {A} \mathbf {B} )=\operatorname {tr} (\mathbf {B} \mathbf {A} )}$$
زیرا
$$\large {\displaystyle \operatorname {tr} (\mathbf {A} \mathbf {B} )=\sum _{i=1}^{m}\left(\mathbf {A} \mathbf {B} \right)_{ii}=\sum _{i=1}^{m}\sum _{j=1}^{n}a_{ij}b_{ji}=}$$
$$\large {\displaystyle \sum _{j=1}^{n}\sum _{i=1}^{m}b_{ji}a_{ij}=\sum _{j=1}^{n}\left(\mathbf {B} \mathbf {A} \right)_{jj}=\operatorname {tr} (\mathbf {B} \mathbf {A} )}$$
این خاصیت را برای ترتیب چرخشی از ماتریسها نیز میتوان در نظر گرفت. به این معنی که اگر $$A, B, C, D$$ چهار ماتریس قابل ضرب باشند، رابطه بالا برای ترتیبهای چرخشی زیر قابل استفاده است.
$$\large {\displaystyle \operatorname {tr} (\mathbf {A} \mathbf {B} \mathbf {C} \mathbf {D} )=\operatorname {tr} (\mathbf {B} \mathbf {C} \mathbf {D} \mathbf {A} )=\operatorname {tr} (\mathbf {C} \mathbf {D} \mathbf {A} \mathbf {B} )=\operatorname {tr} (\mathbf {D} \mathbf {A} \mathbf {B} \mathbf {C} )}$$
نکته: توجه داشته باشید که این رابطه برای هر ترتیب دلخواه (به غیر از ترتیب چرخشی) قابل انجام نیست. برای مثال به رابطه زیر دقت کنید.
$$\large {\displaystyle \operatorname {tr} (\mathbf {A} \mathbf {B} \mathbf {C} )\neq \operatorname {tr} (\mathbf {A} \mathbf {C} \mathbf {B} )}$$
از آنجایی که تغییر ترتیب به صورت چرخشی نیست نمیتوان انتظار داشت که رابطه برای اثر ضرب ماتریسها در اینجا نیز برقرار باشد. ولی اگر براساس ضرب دو ماتریس مربعی این کار صورت بگیرد، میتوان ترتیب را به صورت چرخشی در نظر گرفت و اثر ماتریس حاصلظرب $$A$$ در $$B$$ را از طریق ماتریس حاصلضرب $$B$$ در $$A$$ نیز بدست آورد.
ارتباط اثر ماتریس با مقدارهای ویژه
اگر $$ \lambda_1,\ldots , \lambda_n$$ مقدارهای ویژه ماتریس مربعی $$A_{n\times n}$$ باشند میتوان رابطه زیر را بین آنها در نظر گرفت.
$$\large {\displaystyle \operatorname {tr} (\mathbf {A} )=\sum _{i}\lambda _{i}}$$
نکته: میتوان دترمینان ماتریس $$A$$ را برحسب مقدارهای ویژه آن نیز نوشته شود.
$$\large {\displaystyle |\mathbf{A}|=\operatorname {det} (\mathbf {A} )=\prod _{i}\lambda _{i}.}$$
خلاصه
همانطور که خواندید، برای ماتریسهای مربعی امکان محاسبه اثر ماتریس وجود دارد و از طریق مجموع عناصر قطر اصلی حاصل میشود. همچنین با استفاده از خصوصیاتی که اثر جمع و ضرب ماتریسها دارد، میتوانیم بدون محاسبه حاصل جمع یا ضرب ماتریسها اثر ماتریس حاصل جمع یا ضرب را بدست آوریم. همچنین مشاهده کردید که مجموع مقدارهای ویژه ماتریس همان اثر ماتریس خواهد بود.
اگر علاقهمند به یادگیری مباحث مشابه مطلب بالا هستید، آموزشهایی که در ادامه آمدهاند نیز به شما پیشنهاد میشوند:
- مجموعه آموزشهای دروس ریاضیات
- آموزش ریاضیات عمومی 2
- آموزش جبر خطی
- آموزش جبر خطی با متلب
- تقلب نامه (Cheat Sheet) جبر خطی برای یادگیری ماشین — راهنمای سریع و کامل
^^
با سلام، مفهوم اثر ماتریس و لزوم پیدایش آن در جبر خطی از نحوه محاسبه آن بسیار مهمتر است. من متاسفانه فلسفه این مفهوم را نیافتم. شما میدانید؟
ممنون بابت مباحث خوبی که میذارید خیلی خلاصه و مفید ارائه میدید.
ممنون دکتر