گشتاور در آمار

گشتاور در آمار (Moment) یک اندازه کمی یا شاخص برای مشخص کردن شکل تابع احتمال یا توزیع متغیر تصادفی است. از این شاخص در یاضیات بخصوص آمار و همچنین در مکانیک استفاده می‌شود. اگر این تابع براساس ویژگی‌های فیزیکی یک جسم نوشته شده باشد، آنگاه گشتاور صفرم بیانگر همان جرم است. همچنین گشتاور اول تقسیم بر جرم کلی، مرکز ثقل را بیان می‌کند. از طرفی گشتاور دوم متناسب با اینرسی (Inertia) یک جسم خواهد بود.

به این ترتیب گشتاورها در فیزیک خصوصیات جسم را بازگو می‌کنند. در آمار نیز این گونه است به این معنی که به کمک گشتاورها، خصوصیات متغیر تصادفی مورد بررسی قرار می‌گیرد. مفهوم و استفاده از گشتاور در آمار نیز به این ترتیب مشخص خواهد شد. گشتاور صفرم برای یک متغیر تصادفی، برابر با کل احتمال یا مقدار ۱ است. گشتاور اول بیانگر میانگین و گشتاور مرکزی دوم نیز واریانس (Variance) را مشخص می‌کند. گشتاورهای سوم و چهارم نیز متناسب با چولگی و کشیدگی توزیع احتمال متغیر تصادفی خواهند بود.

در این نوشتار با مفهوم گشتاور در آمار و خصوصیات آن آشنا می‌شویم. برای آشنایی بیشتر با مفهوم گشتاور در فیزیک و مکانیک، بهتر است نوشتار گشتاور چیست؟ – به زبان ساده را مطالعه کنید. همچنین برای آگاهی با متغیر تصادفی و تابع توزیع احتمال که در این نوشتار بسیار به آن اشاره خواهیم کرد، مطالعه متغیر تصادفی، تابع احتمال و تابع توزیع احتمال و توزیع تجمعی — به زبان ساده خالی از لطف نیست.

گشتاور در آمار

مفهوم گشتاور در آمار بسیار به فیزیک نزدیک است. به این معنی که برای شناخت یک متغیر تصادفی (یا در فیزیک برای شناخت یک جسم) باید گشتاورهای آن شناسایی شوند. گشتاورهای یک توزیع احتمال روی بازه تکیه‌گاه متغیر تصادفی، می‌تواند به شکل منحصر به فرد، ویژگی‌های آن توزیع احتمالی را بازگو کند. هر چه توزیع پیچیده‌تر باشد، برای شناخت و بازیابی یک توزیع نسبت به توزیع‌های دیگر احتیاج به گشتاورهای بیشتری داریم. این امر درست به مانند فیزیک است که هر چه رفتار جسم پیچیده‌تر باشد، گشتاورهای بیشتری از آن برای توصیف رفتار جسم مورد احتیاج است.

در صورت وجود، گشتاورها می‌توانند از گشتاور صفرم تا بی‌نهایت تغییر یابند که هر یک به منظور نمایش خاصیت یا ویژگی متغیر تصادفی به کار گرفته می‌شوند.

تعریف گشتاور در ریاضی

گشتاور nام یک تابع حقیقی مثل f(x) برحسب متغیر x حول مرکز c به صورت زیر تعریف می‌شود.

\large {\displaystyle \mu _{n}=\int _{-\infty }^{\infty }(x-c)^{n}\,f(x)\,\mathrm {d} x.}

رابطه ۱

توجه داشته باشید که اغلب در محاسبات، گشتاور یک تابع را در زمانی که c برابر با صفر باشند در نظر می‌گیرند و به آن گشتاور حول صفر گفته (Raw Moment) و با \mu^\prime نشان می‌دهند. اگر مقدار c، میانگین مقادیر x باشد، آن را گشتاور مرکزی (Central Moment) می‌نامند.

گشتاورها می‌توانند مقادیری غیر از اعداد طبیعی نیز داشته باشند. برای مثال گشتاور معکوس مرتبه اول به صورت زیر نوشته می‌شود.

\large {\displaystyle \mu _{(-n)}=\int _{-\infty }^{\infty }(x-c)^{-n}\,f(x)\,\mathrm {d} x.}

اغلب از گشتاورهای مرکزی (گشتاور حول میانگین) به جای گشتاورهای حول صفر استفاده می‌کنند، زیرا قادر به کسب اطلاعات بیشتری توسط این گونه گشتاورها هستیم.

تعریف گشتاور در آمار برای متغیرهای تصادفی

همانطور که برای یک تابع برحسب متغیرش، گشتاورها را تعریف کردیم، برای تابع توزیع و متغیر تصادفی آن مثل  X نیز می‌توان گشتاور را تعریف کرد. اگر  X متغیر تصادفی با تابع توزیع  F(x) باشد آنگاه گشتاور مرتبه  nام برای متغیر تصادفی  X را به صورت زیر نمایش می‌دهند و محاسبه می‌کنند.

\large {\displaystyle \mu^{\prime}_{n}=\operatorname {E} \left[X^{n}\right]=\int _{-\infty }^{\infty }x^{n}\,\mathrm {d} F(x)\,}

رابطه ۲

توجه داشته باشید که متغیر تصادفی X در این تعریف ممکن است دارای تابع چگالی احتمال نبوده و براساس تابع توزیع تجمعی و انتگرال ریمان استیلتیس محاسبه صورت گیرد. اینطور که در رابطه ۲ مشخص شده است، امید ریاضی (Expected Value) توان‌هایی از متغیر تصادفی به عنوان گشتاورهای مرکزی صفر معرفی شده‌اند.

اگر برای یک متغیر تصادفی مثل  X انتگرال زیر وجود نداشته باشد (نامتناهی باشد) آنگاه می‌گوییم گشتاور مرتبه  n آن موجود نیست.

\large {\displaystyle \operatorname {E} \left[\left|X^{n}\right|\right]=\int _{-\infty }^{\infty }\left|x^{n}\right|\,\mathrm {d} F(x)=\infty ,}

از طرفی اگر گشتاور  ام یک متغیر تصادفی موجود باشد، لزوما گشتاورهای قبلی آن یعنی گشتاورهای ‌ و گشتاور  تا گشتاور صفرم آن نیز موجود خواهد بود.

نکته: گشتاور صفرم متغیر تصادفی  برابر است با ۱ زیرا:

\large{\displaystyle \mu ‘_{n}=\operatorname {E} \left[X^{0}\right]=\int _{-\infty }^{\infty }x^{0}\,\mathrm {d} F(x)\,}=\int _{-\infty }^{\infty }\mathrm {d} F(x)=1

تابع مولد گشتاور

همانطور که از نام تابع مولد گشتاور برمی‌آید، برای تولید گشتاورها از آن می‌توان استفاده کرد. تابع مولد گشتاور برای متغیر تصادفی  به صورت زیر نوشته خواهد شد.

\large {\displaystyle M_{X}(t):=\operatorname {E} \left[e^{tX}\right],\quad t\in \mathbb {R} ,}= {\displaystyle M_{X}(t)=\int _{-\infty }^{\infty }e^{tx}\,dF(x)}

رابطه3

به شرطی که این امید ریاضی متناهی باشد، می‌توان از تابع مولد گشتاور برای تولید گشتاورهای توزیع یک متغیر تصادفی استفاده کرد.

نکته: مشخص است که اگر متغیر تصادفی  دارای توزیع گسسته باشد، برای محاسبه امید ریاضی در رابطه ۳ از جمع و در صورتی که پیوسته باشد از انتگرال استفاده خواهد شد.

\large {\displaystyle M_{X}(t)=\sum _{i=1}^{\infty }e^{tx_{i}}\,p_{i}}

\large {\displaystyle M_{X}(t)=\int _{-\infty }^{\infty }e^{tx}f(x)\,dx}

البته به شرطی که تابع چگالی احتمال در حالت پیوسته موجود باشد.

با توجه به سری مک‌لورن تابع نمایی می‌توان نوشت:

\large e^{t\,X}=1+t\,X+{\frac {t^{2}\,X^{2}}{2!}}+{\frac {t^{3}\,X^{3}}{3!}}+\cdots +{\frac {t^{n}\,X^{n}}{n!}}+\cdots .

در نتیجه تابع مولد گشتاور برای متغیر تصادفی  به صورت یک چند جمله‌ای برحسب  به شکل زیر خواهد بود.

\large {\displaystyle {\begin{aligned}M_{X}(t)=\operatorname {E} (e^{t\,X})&=1+t\operatorname {E} (X)+{\frac {t^{2}\operatorname {E} (X^{2})}{2!}}+{\frac {t^{3}\operatorname {E} (X^{3})}{3!}}+\cdots +{\frac {t^{n}\operatorname {E} (X^{n})}{n!}}+\cdots \\ \large &=1+tm_{1}+{\frac {t^{2}m_{2}}{2!}}+{\frac {t^{3}m_{3}}{3!}}+\cdots +{\frac {t^{n}m_{n}}{n!}}+\cdots \end{aligned}}}

رابطه ۴

در رابطه ۴،m_iنشانگر گشتاور iام حول صفر است.

انباشتک

انباشتک (Cumulant) برای متغیر تصادفی  X براساس تابع مولد انباشتک، شخص می‌شود. اگر  K(t) تابع انباشتک برای متغیر تصادفی  X‌ در نقطه t‌ باشد آنگاه داریم:

\large {\displaystyle K(t)=\log \operatorname {E} \left[e^{tX}\right]}

به این ترتیب مشخص است که لگاریتم طبیعی (بر مبنای ) از تابع مولد گشتاور، تابع مولد انباشتک را نتیجه خواهد داد. اگر بسط مکلورن را برای تابع مولد انباشتک بنویسیم، خواهیم داشت:

\large {\displaystyle K(t)=\sum _{n=1}^{\infty }\kappa _{n}{\frac {t^{n}}{n!}}=\mu t+\sigma ^{2}{\frac {t^{2}}{2}}+\cdots}

که در آن k_n انباشتک مرتبه nام خواهد بود. همچنین \sigma، انحراف معیار و \mu نیز میانگین یا همان امید ریاضی متغیر تصادفی هستند. بین تابع مولد انباشتک و انباشتک nام رابطه زیر برقرار است. 

\large \kappa _{n}=K^{(n)}(0)

ه این معنی که مشتق  ام تابع انباشتک در نقطه صفر همان مقدار انباشتک nام متغیر تصادفی  خواهد بود.

از خصوصیات جالب برای انباشتک‌ها رابطه این تابع برای جمع دو متغیر تصادفی است که در تعیین تابع توزیع مجموع دو متغیر تصادفی نقش دارد. همچنین برای اثبات قضیه حد مرکزی (Central Limit Theorem) یا CLT از انباشتک‌ نیز می‌توان استفاده کرد.

اگر  و Y دو متغیر تصادفی مستقل باشند، آنگاه تابع انباشتک جمع آن دو، برابر با مجموع تابع انباشتک آن‌ها خواهد بود. به بیان دیگر رابطه زیر بین توابع انباشتک آن‌ها برقرار است:

\large {\displaystyle {\begin{aligned}K_{X+Y}(t)&=\log \operatorname {E} \left[e^{t(X+Y)}\right]\\[5pt]&=\log \left(\operatorname {E} \left[e^{tX}\right]\operatorname {E} \left[e^{tY}\right]\right)\\[5pt]&=\log \operatorname {E} \left[e^{tX}\right]+\log \operatorname {E} \left[e^{tY}\right]\\[5pt]&=K_{X}(t)+K_{Y}(t),\end{aligned}}}

به این ترتیب می‌توان نتیجه گرفت که امید ریاضی مجموع دو متغیر تصادفی، برابر است با مجموع امید ریاضی آن‌ها. همچنین اگر دو متغیر تصادفی مستقل باشند، واریانس مجموع این دو متغیر تصادفی برابر است با مجموع واریانس‌ آن‌ها.

خصوصیات گشتاورها

گشتاور اول متغیر تصادفی  نشانگر امید ریاضی متغیر تصادفی است. به این ترتیب داریم:

\large{\displaystyle \mu \equiv \operatorname {E} [X]}

همچنین واریانس نیز به عنوان گشتاور مرکزی دوم حول میانگین نوشته خواهد شد.

\large {\displaystyle \sigma \equiv \left(\operatorname {E} \left[(x-\mu )^{2}\right]\right)^{\frac {1}{2}}}

با استفاده از قواعد موجود در مورد گشتاورها، موجود بودن واریانس برای یک متغیر تصادفی، وجود میانگین را تضمین می‌کند.

همچنین محاسبه گشتاورهای مرکزی نرمال شده (Normalized Moments) در محاسبه چولگی (Skewness) و کشیدگی (Kurtosis) موثر هستند.

گشتاور نرمال شده مرتبه ام به صورت زیر محاسبه می‌شود:

\large {\displaystyle {\frac {\mu _{n}}{\sigma ^{n}}}={\frac {\operatorname {E} \left[(X-\mu )^{n}\right]}{\sigma ^{n}}}.}

بر این اساس می‌توان سومین گشتاور مرکزی استاندارد یا نرمال شده را مبنایی برای مقدار چولگی دانست. همانطور که می‌دانید گشتاورهای مرکزی فرد از توزیع نرمال، همگی صفر هستند. بنابراین در توزیع نرمال، میزان چولگی صفر خواهد بود. در حالت کلی چولگی برحسب گشتاور مرکزی استاندارد یا نرمال شده به صورت زیر نوشته خواهد شد.

\large {\displaystyle \operatorname{Skew}[X] {\tilde {\mu }}_{3}=\operatorname {E} \left[\left({\frac {X-\mu }{\sigma }}\right)^{3}\right]={\frac {\mu _{3}}{\sigma ^{3}}}={\frac {\operatorname {E} \left[(X-\mu )^{3}\right]}{(\operatorname {E} \left[(X-\mu )^{2}\right])^{3/2}}}={\frac {\kappa _{3}}{\kappa _{2}^{3/2}}}}

که در آن k_3  انباشتک مرتبه ۳ است.

همچنین در مورد کشیدگی توزیع نیز از گشتاورهای مرکزی نرمال یا استاندارد شده برای محاسبات استفاده می‌شود. فرم محاسباتی برای کشیدگی در این حالت به صورت زیر خواهد بود.

\large{\displaystyle \operatorname {Kurt} [X]=\operatorname {E} \left[\left({\frac {X-\mu }{\sigma }}\right)^{4}\right]={\frac {\operatorname {E} [(X-\mu )^{4}]}{(\operatorname {E} [(X-\mu )^{2}])^{2}}}={\frac {\mu _{4}}{\sigma ^{4}}}}

محاسبه گشتاور به کمک تابع مولد گشتاور

برای محاسبه گشتاورهای یک متغیر تصادفی می‌توان از تابع مولد گشتاور آن متغیر تصادفی نیز استفاده کرد. اگر از رابطه ۴ برحسب ‌ یکبار مشتق گرفته و مقدار حاصل را به ازاء  محاسبه کنیم، گشتاور مرکزی اول حول صفر برای متغیر تصادفی  حاصل خواهد شد. همین عمل را برای محاسبه گشتاور ام نیز می‌توان انجام داد و کافی است که  بار از رابطه ۴ مشتق گرفته و حاصل را به ازاء  بدست آورد.

مثال: برای پیدا کردن گشتاور مرتبه ۲، دوبار از رابطه ۴ مشتق بر حسب t می‌گیریم. در نتیجه خواهیم داشت:

\large {\displaystyle {\begin{aligned}M^{”}_{X}(t)&=\\ \large \dfrac{d^2\operatorname {E} (e^{t\,X})}{dt^2}&= {\operatorname {E} (X^{2})}+\cdots +{\frac {n(n-1)t^{n-2}\operatorname {E} (X^{n})}{n!}}+\cdots \\ \large &=m_{2}+\cdots +{\frac {t^{n-2}m_{n}}{(n-2)!}}+\cdots \end{aligned}}}

حال اگر  قرار دهیم، گشتاور مرتبه دوم محاسبه خواهد شد.

رابطه بین انباشتک و گشتاورهای متغیرهای تصادفی

اگر  گشتاور و  نیز انباشتک ام باشند، رابطه‌های زیر بینشان برقرار خواهد بود.

\large {\displaystyle {\begin{aligned}\mu ‘_{1}={}&\kappa _{1}\\[5pt]\mu ‘_{2}={}&\kappa _{2}+\kappa _{1}^{2}\\[5pt]\mu ‘_{3}={}&\kappa _{3}+3\kappa _{2}\kappa _{1}+\kappa _{1}^{3}\\[5pt]\mu ‘_{4}={}&\kappa _{4}+4\kappa _{3}\kappa _{1}+3\kappa _{2}^{2}+6\kappa _{2}\kappa _{1}^{2}+\kappa _{1}^{4}\\[5pt]\mu ‘_{5}={}&\kappa _{5}+5\kappa _{4}\kappa _{1}+10\kappa _{3}\kappa _{2}+10\kappa _{3}\kappa _{1}^{2}+15\kappa _{2}^{2}\kappa _{1}+10\kappa _{2}\kappa _{1}^{3}+\kappa _{1}^{5}\\[5pt]\mu ‘_{6}={}&\kappa _{6}+6\kappa _{5}\kappa _{1}+15\kappa _{4}\kappa _{2}+15\kappa _{4}\kappa _{1}^{2}+10\kappa _{3}^{2}+60\kappa _{3}\kappa _{2}\kappa _{1}+20\kappa _{3}\kappa _{1}^{3}\\&{}+15\kappa _{2}^{3}+45\kappa _{2}^{2}\kappa _{1}^{2}+15\kappa _{2}\kappa _{1}^{4}+\kappa _{1}^{6}\end{aligned}}}

همچنین بین گشتاور مرکزی μi و انباشتک‌ها نیز رابطه‌های زیر وجود دارد.

\large {\displaystyle {\begin{aligned}\mu _{1}&=0\\[4pt]\mu _{2}&=\kappa _{2}\\[4pt]\mu _{3}&=\kappa _{3}\\[4pt]\mu _{4}&=\kappa _{4}+3\kappa _{2}^{2}\\[4pt]\mu _{5}&=\kappa _{5}+10\kappa _{3}\kappa _{2}\\[4pt]\mu _{6}&=\kappa _{6}+15\kappa _{4}\kappa _{2}+10\kappa _{3}^{2}+15\kappa _{2}^{3}\end{aligned}}}

از طرفی، رابطه بین انباشتک‌ها و گشتاورها نیز به صورت زیر نوشته خواهد شد.

\large {\displaystyle {\begin{aligned}\kappa _{1}={}&\mu ‘_{1}\\[4pt]\kappa _{2}={}&\mu ‘_{2}-{\mu ‘_{1}}^{2}\\[4pt]\kappa _{3}={}&\mu ‘_{3}-3\mu ‘_{2}\mu ‘_{1}+2{\mu ‘_{1}}^{3}\\[4pt]\kappa _{4}={}&\mu ‘_{4}-4\mu ‘_{3}\mu ‘_{1}-3{\mu ‘_{2}}^{2}+12\mu ‘_{2}{\mu ‘_{1}}^{2}-6{\mu ‘_{1}}^{4}\\[4pt]\kappa _{5}={}&\mu ‘_{5}-5\mu ‘_{4}\mu ‘_{1}-10\mu ‘_{3}\mu ‘_{2}+20\mu ‘_{3}{\mu ‘_{1}}^{2}+30{\mu ‘_{2}}^{2}\mu ‘_{1}-60\mu ‘_{2}{\mu ‘_{1}}^{3}+24{\mu ‘_{1}}^{5}\\[4pt]\kappa _{6}={}&\mu ‘_{6}-6\mu ‘_{5}\mu ‘_{1}-15\mu ‘_{4}\mu ‘_{2}+30\mu ‘_{4}{\mu ‘_{1}}^{2}-10{\mu ‘_{3}}^{2}+120\mu ‘_{3}\mu ‘_{2}\mu ‘_{1}\\&{}-120\mu ‘_{3}{\mu ‘_{1}}^{3}+30{\mu ‘_{2}}^{3}-270{\mu ‘_{2}}^{2}{\mu ‘_{1}}^{2}+360\mu ‘_{2}{\mu ‘_{1}}^{4}-120{\mu ‘_{1}}^{6}\end{aligned}}}

و همینطور بین انباشتک‌ها و گشتاورهای مرکزی نیز ارتباط‌های زیر برقرار است.

\large \begin{aligned} &\kappa _{2}=\mu _{2}\,\\& \kappa _{3}=\mu _{3}\, \\& \kappa _{4}=\mu _{4}-3{\mu _{2}}^{2}\\& \kappa _{5}=\mu _{5}-10\mu _{3}\mu _{2}\\ & \kappa _{6}=\mu _{6}-15\mu _{4}\mu _{2}-10{\mu _{3}}^{2}+30{\mu _{2}}^{3}\end{aligned}

خلاصه و جمع‌بندی

در این نوشتار با مفهوم گشتاور و انباشتک در آمار برای متغیر تصادفی آشنا شدید و نقش آن را در شناسایی تابع چگالی یا توزیع احتمال درک کردید. کاربردهای تابع مولد گشتاور در تولید شاخص‌های آماری نیز در این مطلب مورد بررسی قرار گرفت. همچنین ارتباط بین گشتاورها و انباشتک‌ها نیز مرور شد.

از آنجایی که تابع مولد گشتاور یا تابع مولد انباشتک، برای هر توزیع یا متغیر تصادفی منحصر به فرد هستند، شناخت آن‌ها به منظور ایجاد رابطه‌های هم‌توزیعی بین متغیرهای تصادفی ضروری است. البته ممکن است برای یک متغیر تصادفی، تابع مولد گشتاور یا انباشتک موجود نباشد. در این صورت برای شناسایی و مشخص کردن توزیع یک متغیر تصادفی از «تابع مشخصه احتمال» (Characteristic Function) استفاده می‌شود.