گشتاور در آمار — به زبان ساده

۵۵۱۰ بازدید
آخرین به‌روزرسانی: ۱۶ خرداد ۱۴۰۲
زمان مطالعه: ۷ دقیقه
گشتاور در آمار — به زبان ساده

گشتاور در آمار (Moment) یک اندازه کمی یا شاخص برای مشخص کردن شکل تابع احتمال یا توزیع متغیر تصادفی است. از این شاخص در ریاضیات بخصوص آمار و همچنین در مکانیک استفاده می‌شود. اگر این تابع براساس ویژگی‌های فیزیکی یک جسم نوشته شده باشد، آنگاه گشتاور صفرم بیانگر همان جرم است. همچنین گشتاور اول تقسیم بر جرم کلی، مرکز ثقل را بیان می‌کند. از طرفی گشتاور دوم متناسب با اینرسی (Inertia) یک جسم خواهد بود.

به این ترتیب گشتاورها در فیزیک خصوصیات جسم را بازگو می‌کنند. در آمار نیز این گونه است به این معنی که به کمک گشتاورها، خصوصیات متغیر تصادفی مورد بررسی قرار می‌گیرد. مفهوم و استفاده از گشتاور در آمار نیز به این ترتیب مشخص خواهد شد. گشتاور صفرم برای یک متغیر تصادفی، برابر با کل احتمال یا مقدار ۱ است. گشتاور اول بیانگر میانگین و گشتاور مرکزی دوم نیز واریانس (Variance) را مشخص می‌کند. گشتاورهای سوم و چهارم نیز متناسب با چولگی و کشیدگی توزیع احتمال متغیر تصادفی خواهند بود.

در این نوشتار با مفهوم گشتاور در آمار و خصوصیات آن آشنا می‌شویم. برای آشنایی بیشتر با مفهوم گشتاور در فیزیک و مکانیک، بهتر است نوشتار گشتاور چیست؟ – به زبان ساده را مطالعه کنید. همچنین برای آگاهی با متغیر تصادفی و تابع توزیع احتمال که در این نوشتار بسیار به آن اشاره خواهیم کرد، مطالعه متغیر تصادفی، تابع احتمال و تابع توزیع احتمال و توزیع تجمعی — به زبان ساده خالی از لطف نیست.

گشتاور در آمار

مفهوم گشتاور در آمار بسیار به فیزیک نزدیک است. به این معنی که برای شناخت یک متغیر تصادفی (یا در فیزیک برای شناخت یک جسم) باید گشتاورهای آن شناسایی شوند. گشتاورهای یک توزیع احتمال روی بازه تکیه‌گاه متغیر تصادفی، می‌تواند به شکل منحصر به فردی، ویژگی‌های آن توزیع احتمالی را بازگو کند. هر چه توزیع پیچیده‌تر باشد، برای شناخت و بازیابی یک توزیع نسبت به توزیع‌های دیگر احتیاج به گشتاورهای بیشتری داریم. این امر درست به مانند فیزیک است که هر چه رفتار جسم پیچیده‌تر باشد، گشتاورهای بیشتری از آن برای توصیف رفتار جسم مورد احتیاج است.

در صورت وجود، گشتاورها می‌توانند از گشتاور صفرم تا بی‌نهایت تغییر یابند که هر یک به منظور نمایش خاصیت یا ویژگی متغیر تصادفی به کار گرفته می‌شوند.

تعریف گشتاور در ریاضی

گشتاور $$n$$ام یک تابع حقیقی مثل $$f(x)$$ برحسب متغیر $$x$$ حول مرکز $$c$$ به صورت زیر تعریف می‌شود.

$$\large {\displaystyle \mu _{n}=\int _{-\infty }^{\infty }(x-c)^{n}\,f(x)\,\mathrm {d} x.}$$

رابطه ۱

توجه داشته باشید که اغلب در محاسبات، گشتاور یک تابع را در زمانی که $$c$$ برابر با صفر باشند در نظر می‌گیرند و به آن گشتاور حول صفر گفته (Raw Moment) و با $$\mu'$$ نشان می‌دهند. اگر مقدار $$c$$، میانگین مقادیر $$x$$ باشد، آن را گشتاور مرکزی (Central Moment) می‌نامند.

گشتاورها می‌توانند مقادیری غیر از اعداد طبیعی نیز داشته باشند. برای مثال گشتاور معکوس مرتبه اول به صورت زیر نوشته می‌شود.

$$\large {\displaystyle \mu _{(-n)}=\int _{-\infty }^{\infty }(x-c)^{-n}\,f(x)\,\mathrm {d} x.}$$

اغلب از گشتاورهای مرکزی (گشتاور حول میانگین) به جای گشتاورهای حول صفر استفاده می‌کنند، زیرا قادر به کسب اطلاعات بیشتری توسط این گونه گشتاورها هستیم.

تعریف گشتاور در آمار برای متغیرهای تصادفی

همانطور که برای یک تابع برحسب متغیرش، گشتاورها را تعریف کردیم، برای تابع توزیع و متغیر تصادفی آن مثل $$X$$ نیز می‌توان گشتاور را تعریف کرد. اگر $$X$$ متغیر تصادفی با تابع توزیع $$F(x)$$ باشد آنگاه گشتاور مرتبه $$n$$ام برای متغیر تصادفی $$X$$ را به صورت زیر نمایش می‌دهند و محاسبه می‌کنند.

$$\large {\displaystyle \mu'_{n}=\operatorname {E} \left[X^{n}\right]=\int _{-\infty }^{\infty }x^{n}\,\mathrm {d} F(x)\,}$$

رابطه ۲

توجه داشته باشید که متغیر تصادفی $$X$$ در این تعریف ممکن است دارای تابع چگالی احتمال نبوده و براساس تابع توزیع تجمعی و انتگرال ریمان استیلتیس محاسبه صورت گیرد. اینطور که در رابطه ۲ مشخص شده است، امید ریاضی (Expected Value) توان‌هایی از متغیر تصادفی به عنوان گشتاورهای مرکزی صفر معرفی شده‌اند.

اگر برای یک متغیر تصادفی مثل $$X$$ انتگرال زیر وجود نداشته باشد (نامتناهی باشد) آنگاه می‌گوییم گشتاور مرتبه $$n$$ آن موجود نیست.

$$\large {\displaystyle \operatorname {E} \left[\left|X^{n}\right|\right]=\int _{-\infty }^{\infty }\left|x^{n}\right|\,\mathrm {d} F(x)=\infty ,}$$

از طرفی اگر گشتاور $$n$$ام یک متغیر تصادفی موجود باشد، لزوما گشتاورهای قبلی آن یعنی گشتاورهای $$n-1$$‌ و گشتاور $$n-2$$‌ تا گشتاور صفرم آن نیز موجود خواهد بود.

نکته: گشتاور صفرم متغیر تصادفی $$X$$ برابر است با ۱ زیرا:

$$\large{\displaystyle \mu '_{n}=\operatorname {E} \left[X^{0}\right]=\int _{-\infty }^{\infty }x^{0}\,\mathrm {d} F(x)\,}=\int _{-\infty }^{\infty }\mathrm {d} F(x)=1$$

تابع مولد گشتاور در آمار

همانطور که از نام تابع مولد گشتاور برمی‌آید، برای تولید گشتاورها از آن می‌توان استفاده کرد. تابع مولد گشتاور برای متغیر تصادفی $$X$$ به صورت زیر نوشته خواهد شد.

$$\large {\displaystyle M_{X}(t):=\operatorname {E} \left[e^{tX}\right],\quad t\in \mathbb {R} ,}= {\displaystyle M_{X}(t)=\int _{-\infty }^{\infty }e^{tx}\,dF(x)}$$

رابطه ۳

به شرطی که این امید ریاضی متناهی باشد، می‌توان از تابع مولد گشتاور برای تولید گشتاورهای توزیع یک متغیر تصادفی استفاده کرد.

نکته: مشخص است که اگر متغیر تصادفی $$X$$ دارای توزیع گسسته باشد، برای محاسبه امید ریاضی در رابطه ۳ از جمع و در صورتی که پیوسته باشد از انتگرال استفاده خواهد شد.

$$\large {\displaystyle M_{X}(t)=\sum _{i=1}^{\infty }e^{tx_{i}}\,p_{i}}$$

$$\large {\displaystyle M_{X}(t)=\int _{-\infty }^{\infty }e^{tx}f(x)\,dx}$$

البته به شرطی که تابع چگالی احتمال در حالت پیوسته موجود باشد.

تابع مولد گشتاور، نوع خاصی از تابع مولد (Generating Function) است. برای آشنایی بیشتر در زمینه تابع مولد بهتر است نوشتار تابع مولد — از صفر تا صد را مطالعه فرمایید.

با توجه به سری مک‌لورن تابع نمایی می‌توان نوشت:

$$\large e^{t\,X}=1+t\,X+{\frac {t^{2}\,X^{2}}{2!}}+{\frac {t^{3}\,X^{3}}{3!}}+\cdots +{\frac {t^{n}\,X^{n}}{n!}}+\cdots .$$

در نتیجه تابع مولد گشتاور برای متغیر تصادفی $$X$$ به صورت یک چند جمله‌ای برحسب $$t$$ به شکل زیر خواهد بود.

$$\large {\displaystyle {\begin{aligned}M_{X}(t)=\operatorname {E} (e^{t\,X})&=1+t\operatorname {E} (X)+{\frac {t^{2}\operatorname {E} (X^{2})}{2!}}+{\frac {t^{3}\operatorname {E} (X^{3})}{3!}}+\cdots +{\frac {t^{n}\operatorname {E} (X^{n})}{n!}}+\cdots \\ \large &=1+tm_{1}+{\frac {t^{2}m_{2}}{2!}}+{\frac {t^{3}m_{3}}{3!}}+\cdots +{\frac {t^{n}m_{n}}{n!}}+\cdots \end{aligned}}}$$

رابطه ۴

در رابطه ۴، $$m_i$$ نشانگر گشتاور $$i$$ام حول صفر است.

انباشتک و گشتاور در آمار

انباشتک (Cumulant) برای متغیر تصادفی $$X$$ براساس تابع مولد انباشتک، مشخص می‌شود. اگر $$K(t)$$ تابع انباشتک برای متغیر تصادفی $$X$$‌ در نقطه $$t$$‌ باشد آنگاه داریم:

$$\large {\displaystyle K(t)=\log \operatorname {E} \left[e^{tX}\right]}$$

به این ترتیب مشخص است که لگاریتم طبیعی (بر مبنای $$e$$) از تابع مولد گشتاور، تابع مولد انباشتک را نتیجه خواهد داد. اگر بسط مکلورن را برای تابع مولد انباشتک بنویسیم، خواهیم داشت:

$$\large {\displaystyle K(t)=\sum _{n=1}^{\infty }\kappa _{n}{\frac {t^{n}}{n!}}=\mu t+\sigma ^{2}{\frac {t^{2}}{2}}+\cdots}$$

که در آن $$\kappa_n$$ انباشتک مرتبه $$n$$ام خواهد بود. همچنین $$\sigma$$، انحراف معیار و $$\mu$$ نیز میانگین یا همان امید ریاضی متغیر تصادفی هستند. بین تابع مولد انباشتک و انباشتک $$n$$ام رابطه زیر برقرار است.

$$\large \kappa _{n}=K^{(n)}(0)$$

به این معنی که مشتق $$n$$ ام تابع انباشتک در نقطه صفر همان مقدار انباشتک $$n$$ام متغیر تصادفی $$X$$ خواهد بود.

از خصوصیات جالب برای انباشتک‌ها رابطه این تابع برای جمع دو متغیر تصادفی است که در تعیین تابع توزیع مجموع دو متغیر تصادفی نقش دارد. همچنین برای اثبات قضیه حد مرکزی (Central Limit Theorem) یا CLT از انباشتک‌ نیز می‌توان استفاده کرد.

اگر $$X$$ و $$Y$$ دو متغیر تصادفی مستقل باشند، آنگاه تابع انباشتک جمع آن دو، برابر با مجموع تابع انباشتک آن‌ها خواهد بود. به بیان دیگر رابطه زیر بین توابع انباشتک آن‌ها برقرار است:

$$\large {\displaystyle {\begin{aligned}K_{X+Y}(t)&=\log \operatorname {E} \left[e^{t(X+Y)}\right]\\[5pt]&=\log \left(\operatorname {E} \left[e^{tX}\right]\operatorname {E} \left[e^{tY}\right]\right)\\[5pt]&=\log \operatorname {E} \left[e^{tX}\right]+\log \operatorname {E} \left[e^{tY}\right]\\[5pt]&=K_{X}(t)+K_{Y}(t),\end{aligned}}}$$

به این ترتیب می‌توان نتیجه گرفت که امید ریاضی مجموع دو متغیر تصادفی، برابر است با مجموع امید ریاضی آن‌ها. همچنین اگر دو متغیر تصادفی مستقل باشند، واریانس مجموع این دو متغیر تصادفی برابر است با مجموع واریانس‌ آن‌ها.

خصوصیات گشتاور در آمار

گشتاور اول متغیر تصادفی $$X$$ نشانگر امید ریاضی متغیر تصادفی است. به این ترتیب داریم:

$$\large{\displaystyle \mu \equiv \operatorname {E} [X]}$$

همچنین واریانس نیز به عنوان گشتاور مرکزی دوم حول میانگین نوشته خواهد شد.

$$\large {\displaystyle \sigma \equiv \left(\operatorname {E} \left[(x-\mu )^{2}\right]\right)^{\frac {1}{2}}}$$

با استفاده از قواعد موجود در مورد گشتاورها، موجود بودن واریانس برای یک متغیر تصادفی، وجود میانگین را تضمین می‌کند.

همچنین محاسبه گشتاورهای مرکزی نرمال شده (Normalized Moments) در محاسبه چولگی (Skewness) و کشیدگی (Kurtosis) موثر هستند.

گشتاور نرمال شده مرتبه $$n$$ام به صورت زیر محاسبه می‌شود:

$$\large {\displaystyle {\frac {\mu _{n}}{\sigma ^{n}}}={\frac {\operatorname {E} \left[(X-\mu )^{n}\right]}{\sigma ^{n}}}.}$$

بر این اساس می‌توان سومین گشتاور مرکزی استاندارد یا نرمال شده را مبنایی برای مقدار چولگی دانست. همانطور که می‌دانید گشتاورهای مرکزی با مرتبه یا درجه فرد از توزیع نرمال، همگی صفر هستند. بنابراین در توزیع نرمال، میزان چولگی صفر خواهد بود. در حالت کلی چولگی برحسب گشتاور مرکزی استاندارد یا نرمال شده به صورت زیر نوشته خواهد شد.

$$\large {\displaystyle \operatorname{Skew}[X] {\tilde {\mu }}_{3}=\operatorname {E} \left[\left({\frac {X-\mu }{\sigma }}\right)^{3}\right]={\frac {\mu _{3}}{\sigma ^{3}}}={\frac {\operatorname {E} \left[(X-\mu )^{3}\right]}{(\operatorname {E} \left[(X-\mu )^{2}\right])^{3/2}}}={\frac {\kappa _{3}}{\kappa _{2}^{3/2}}}}$$

که در آن $$\kappa_3$$ انباشتک مرتبه ۳ است.

همچنین در مورد کشیدگی توزیع نیز از گشتاورهای مرکزی نرمال یا استاندارد شده برای محاسبات استفاده می‌شود. فرم محاسباتی برای کشیدگی در این حالت به صورت زیر خواهد بود.

$$\large{\displaystyle \operatorname {Kurt} [X]=\operatorname {E} \left[\left({\frac {X-\mu }{\sigma }}\right)^{4}\right]={\frac {\operatorname {E} [(X-\mu )^{4}]}{(\operatorname {E} [(X-\mu )^{2}])^{2}}}={\frac {\mu _{4}}{\sigma ^{4}}}}$$

محاسبه گشتاور به کمک تابع مولد گشتاور

برای محاسبه گشتاورهای یک متغیر تصادفی می‌توان از تابع مولد گشتاور آن متغیر تصادفی نیز استفاده کرد. اگر از رابطه ۴ برحسب $$t$$‌ یکبار مشتق گرفته و مقدار حاصل را به ازاء $$t=0$$ محاسبه کنیم، گشتاور مرکزی اول حول صفر برای متغیر تصادفی $$X$$ حاصل خواهد شد. همین عمل را برای محاسبه گشتاور $$i$$ام نیز می‌توان انجام داد و کافی است که $$i$$ بار از رابطه ۴ مشتق گرفته و حاصل را به ازاء $$t=0$$ بدست آورد.

مثال: برای پیدا کردن گشتاور مرتبه ۲، دوبار از رابطه ۴ مشتق بر حسب $$t$$ می‌گیریم. در نتیجه خواهیم داشت:

$$\large {\displaystyle {\begin{aligned}M^{''}_{X}(t)&=\\ \large \dfrac{d^2\operatorname {E} (e^{t\,X})}{dt^2}&= {\operatorname {E} (X^{2})}+\cdots +{\frac {n(n-1)t^{n-2}\operatorname {E} (X^{n})}{n!}}+\cdots \\ \large &=m_{2}+\cdots +{\frac {t^{n-2}m_{n}}{(n-2)!}}+\cdots \end{aligned}}}$$

حال اگر $$t=0$$ قرار دهیم، گشتاور مرتبه دوم محاسبه خواهد شد.

رابطه بین انباشتک و گشتاورهای متغیرهای تصادفی

اگر $$\mu'_i$$ گشتاور و $$\kappa_i$$ نیز انباشتک $$i$$ام باشند، رابطه‌های زیر بینشان برقرار خواهد بود.

$$\large {\displaystyle {\begin{aligned}\mu '_{1}={}&\kappa _{1}\\[5pt]\mu '_{2}={}&\kappa _{2}+\kappa _{1}^{2}\\[5pt]\mu '_{3}={}&\kappa _{3}+3\kappa _{2}\kappa _{1}+\kappa _{1}^{3}\\[5pt]\mu '_{4}={}&\kappa _{4}+4\kappa _{3}\kappa _{1}+3\kappa _{2}^{2}+6\kappa _{2}\kappa _{1}^{2}+\kappa _{1}^{4}\\[5pt]\mu '_{5}={}&\kappa _{5}+5\kappa _{4}\kappa _{1}+10\kappa _{3}\kappa _{2}+10\kappa _{3}\kappa _{1}^{2}+15\kappa _{2}^{2}\kappa _{1}+10\kappa _{2}\kappa _{1}^{3}+\kappa _{1}^{5}\\[5pt]\mu '_{6}={}&\kappa _{6}+6\kappa _{5}\kappa _{1}+15\kappa _{4}\kappa _{2}+15\kappa _{4}\kappa _{1}^{2}+10\kappa _{3}^{2}+60\kappa _{3}\kappa _{2}\kappa _{1}+20\kappa _{3}\kappa _{1}^{3}\\&{}+15\kappa _{2}^{3}+45\kappa _{2}^{2}\kappa _{1}^{2}+15\kappa _{2}\kappa _{1}^{4}+\kappa _{1}^{6}\end{aligned}}}$$

همچنین بین گشتاور مرکزی $$\mu_i$$ و انباشتک‌ها نیز رابطه‌های زیر وجود دارد.

$$\large {\displaystyle {\begin{aligned}\mu _{1}&=0\\[4pt]\mu _{2}&=\kappa _{2}\\[4pt]\mu _{3}&=\kappa _{3}\\[4pt]\mu _{4}&=\kappa _{4}+3\kappa _{2}^{2}\\[4pt]\mu _{5}&=\kappa _{5}+10\kappa _{3}\kappa _{2}\\[4pt]\mu _{6}&=\kappa _{6}+15\kappa _{4}\kappa _{2}+10\kappa _{3}^{2}+15\kappa _{2}^{3}\end{aligned}}}$$

از طرفی، رابطه بین انباشتک‌ها و گشتاورها نیز به صورت زیر نوشته خواهد شد.

$$\large {\displaystyle {\begin{aligned}\kappa _{1}={}&\mu '_{1}\\[4pt]\kappa _{2}={}&\mu '_{2}-{\mu '_{1}}^{2}\\[4pt]\kappa _{3}={}&\mu '_{3}-3\mu '_{2}\mu '_{1}+2{\mu '_{1}}^{3}\\[4pt]\kappa _{4}={}&\mu '_{4}-4\mu '_{3}\mu '_{1}-3{\mu '_{2}}^{2}+12\mu '_{2}{\mu '_{1}}^{2}-6{\mu '_{1}}^{4}\\[4pt]\kappa _{5}={}&\mu '_{5}-5\mu '_{4}\mu '_{1}-10\mu '_{3}\mu '_{2}+20\mu '_{3}{\mu '_{1}}^{2}+30{\mu '_{2}}^{2}\mu '_{1}-60\mu '_{2}{\mu '_{1}}^{3}+24{\mu '_{1}}^{5}\\[4pt]\kappa _{6}={}&\mu '_{6}-6\mu '_{5}\mu '_{1}-15\mu '_{4}\mu '_{2}+30\mu '_{4}{\mu '_{1}}^{2}-10{\mu '_{3}}^{2}+120\mu '_{3}\mu '_{2}\mu '_{1}\\&{}-120\mu '_{3}{\mu '_{1}}^{3}+30{\mu '_{2}}^{3}-270{\mu '_{2}}^{2}{\mu '_{1}}^{2}+360\mu '_{2}{\mu '_{1}}^{4}-120{\mu '_{1}}^{6}\end{aligned}}}$$

و همینطور بین انباشتک‌ها و گشتاورهای مرکزی نیز ارتباط‌های زیر برقرار است.

$$\large \begin{aligned} &\kappa _{2}=\mu _{2}\,\\& \kappa _{3}=\mu _{3}\, \\& \kappa _{4}=\mu _{4}-3{\mu _{2}}^{2}\\& \kappa _{5}=\mu _{5}-10\mu _{3}\mu _{2}\\ & \kappa _{6}=\mu _{6}-15\mu _{4}\mu _{2}-10{\mu _{3}}^{2}+30{\mu _{2}}^{3}\end{aligned}$$

خلاصه و جمع‌بندی

در این نوشتار با مفهوم گشتاور در آمار و انباشتک برای متغیر تصادفی آشنا شدید و نقش آن را در شناسایی تابع چگالی یا توزیع احتمال درک کردید. کاربردهای تابع مولد گشتاور در تولید شاخص‌های آماری نیز در این مطلب مورد بررسی قرار گرفت. همچنین ارتباط بین گشتاورها و انباشتک‌ها نیز مرور شد.

از آنجایی که تابع مولد گشتاور در آمار یا تابع مولد انباشتک، برای هر توزیع یا متغیر تصادفی منحصر به فرد هستند، شناخت آن‌ها به منظور ایجاد رابطه‌های هم‌توزیعی بین متغیرهای تصادفی ضروری است. البته ممکن است برای یک متغیر تصادفی، تابع مولد گشتاور یا انباشتک موجود نباشد. در این صورت برای شناسایی و مشخص کردن توزیع یک متغیر تصادفی از «تابع مشخصه احتمال» (Characteristic Function) استفاده می‌شود.

در صورت علاقه‌مندی به مباحث مرتبط در زمینه ریاضی و آمار، آموزش‌های زیر نیز به شما پیشنهاد می‌شوند:

^^

بر اساس رای ۳۱ نفر
آیا این مطلب برای شما مفید بود؟
اگر بازخوردی درباره این مطلب دارید یا پرسشی دارید که بدون پاسخ مانده است، آن را از طریق بخش نظرات مطرح کنید.
منابع:
مجله فرادرسWikipedia
۵ دیدگاه برای «گشتاور در آمار — به زبان ساده»

عالی
تشکر وافر از شما

بسیار عالی
تشکر وافر از شما

سلام کجا میتونم درمورد توابع مولد احتمال بیشتر بدونم ؟مرجعی رو معرفی میکنید؟

سلام و درود،
برای اطلاع در مورد توابع مولد احتمال بهتر است به کتاب‌های احتمال یا جستجو در گوگل بپردازید. معمولا تابع مولد احتمال برای هر یک از توزیع‌ها، منحصر به فرد بوده و امکان محاسبه احتمال برای هر نقطه را بوسیله مشتق‌گیری از آن (در حالتی که توزیع گسسته باشد) فراهم می‌آورد.

پیروز و تندرست باشید.

نظر شما چیست؟

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *