گشتاور در آمار
گشتاور در آمار (Moment) یک اندازه کمی یا شاخص برای مشخص کردن شکل تابع احتمال یا توزیع متغیر تصادفی است. از این شاخص در یاضیات بخصوص آمار و همچنین در مکانیک استفاده میشود. اگر این تابع براساس ویژگیهای فیزیکی یک جسم نوشته شده باشد، آنگاه گشتاور صفرم بیانگر همان جرم است. همچنین گشتاور اول تقسیم بر جرم کلی، مرکز ثقل را بیان میکند. از طرفی گشتاور دوم متناسب با اینرسی (Inertia) یک جسم خواهد بود.
به این ترتیب گشتاورها در فیزیک خصوصیات جسم را بازگو میکنند. در آمار نیز این گونه است به این معنی که به کمک گشتاورها، خصوصیات متغیر تصادفی مورد بررسی قرار میگیرد. مفهوم و استفاده از گشتاور در آمار نیز به این ترتیب مشخص خواهد شد. گشتاور صفرم برای یک متغیر تصادفی، برابر با کل احتمال یا مقدار ۱ است. گشتاور اول بیانگر میانگین و گشتاور مرکزی دوم نیز واریانس (Variance) را مشخص میکند. گشتاورهای سوم و چهارم نیز متناسب با چولگی و کشیدگی توزیع احتمال متغیر تصادفی خواهند بود.
در این نوشتار با مفهوم گشتاور در آمار و خصوصیات آن آشنا میشویم. برای آشنایی بیشتر با مفهوم گشتاور در فیزیک و مکانیک، بهتر است نوشتار گشتاور چیست؟ – به زبان ساده را مطالعه کنید. همچنین برای آگاهی با متغیر تصادفی و تابع توزیع احتمال که در این نوشتار بسیار به آن اشاره خواهیم کرد، مطالعه متغیر تصادفی، تابع احتمال و تابع توزیع احتمال و توزیع تجمعی — به زبان ساده خالی از لطف نیست.
گشتاور در آمار
مفهوم گشتاور در آمار بسیار به فیزیک نزدیک است. به این معنی که برای شناخت یک متغیر تصادفی (یا در فیزیک برای شناخت یک جسم) باید گشتاورهای آن شناسایی شوند. گشتاورهای یک توزیع احتمال روی بازه تکیهگاه متغیر تصادفی، میتواند به شکل منحصر به فرد، ویژگیهای آن توزیع احتمالی را بازگو کند. هر چه توزیع پیچیدهتر باشد، برای شناخت و بازیابی یک توزیع نسبت به توزیعهای دیگر احتیاج به گشتاورهای بیشتری داریم. این امر درست به مانند فیزیک است که هر چه رفتار جسم پیچیدهتر باشد، گشتاورهای بیشتری از آن برای توصیف رفتار جسم مورد احتیاج است.
در صورت وجود، گشتاورها میتوانند از گشتاور صفرم تا بینهایت تغییر یابند که هر یک به منظور نمایش خاصیت یا ویژگی متغیر تصادفی به کار گرفته میشوند.
تعریف گشتاور در ریاضی
گشتاور nام یک تابع حقیقی مثل f(x) برحسب متغیر x حول مرکز c به صورت زیر تعریف میشود.
\large {\displaystyle \mu _{n}=\int _{-\infty }^{\infty }(x-c)^{n}\,f(x)\,\mathrm {d} x.}
رابطه ۱
توجه داشته باشید که اغلب در محاسبات، گشتاور یک تابع را در زمانی که c برابر با صفر باشند در نظر میگیرند و به آن گشتاور حول صفر گفته (Raw Moment) و با \mu^\prime نشان میدهند. اگر مقدار c، میانگین مقادیر x باشد، آن را گشتاور مرکزی (Central Moment) مینامند.
گشتاورها میتوانند مقادیری غیر از اعداد طبیعی نیز داشته باشند. برای مثال گشتاور معکوس مرتبه اول به صورت زیر نوشته میشود.
\large {\displaystyle \mu _{(-n)}=\int _{-\infty }^{\infty }(x-c)^{-n}\,f(x)\,\mathrm {d} x.}
اغلب از گشتاورهای مرکزی (گشتاور حول میانگین) به جای گشتاورهای حول صفر استفاده میکنند، زیرا قادر به کسب اطلاعات بیشتری توسط این گونه گشتاورها هستیم.
تعریف گشتاور در آمار برای متغیرهای تصادفی
همانطور که برای یک تابع برحسب متغیرش، گشتاورها را تعریف کردیم، برای تابع توزیع و متغیر تصادفی آن مثل X نیز میتوان گشتاور را تعریف کرد. اگر X متغیر تصادفی با تابع توزیع F(x) باشد آنگاه گشتاور مرتبه nام برای متغیر تصادفی X را به صورت زیر نمایش میدهند و محاسبه میکنند.
\large {\displaystyle \mu^{\prime}_{n}=\operatorname {E} \left[X^{n}\right]=\int _{-\infty }^{\infty }x^{n}\,\mathrm {d} F(x)\,}
رابطه ۲
توجه داشته باشید که متغیر تصادفی X در این تعریف ممکن است دارای تابع چگالی احتمال نبوده و براساس تابع توزیع تجمعی و انتگرال ریمان استیلتیس محاسبه صورت گیرد. اینطور که در رابطه ۲ مشخص شده است، امید ریاضی (Expected Value) توانهایی از متغیر تصادفی به عنوان گشتاورهای مرکزی صفر معرفی شدهاند.
اگر برای یک متغیر تصادفی مثل X انتگرال زیر وجود نداشته باشد (نامتناهی باشد) آنگاه میگوییم گشتاور مرتبه n آن موجود نیست.
\large {\displaystyle \operatorname {E} \left[\left|X^{n}\right|\right]=\int _{-\infty }^{\infty }\left|x^{n}\right|\,\mathrm {d} F(x)=\infty ,}
از طرفی اگر گشتاور nام یک متغیر تصادفی موجود باشد، لزوما گشتاورهای قبلی آن یعنی گشتاورهای n−1 و گشتاور n−2 تا گشتاور صفرم آن نیز موجود خواهد بود.
نکته: گشتاور صفرم متغیر تصادفی X برابر است با ۱ زیرا:
\large{\displaystyle \mu ‘_{n}=\operatorname {E} \left[X^{0}\right]=\int _{-\infty }^{\infty }x^{0}\,\mathrm {d} F(x)\,}=\int _{-\infty }^{\infty }\mathrm {d} F(x)=1
تابع مولد گشتاور
همانطور که از نام تابع مولد گشتاور برمیآید، برای تولید گشتاورها از آن میتوان استفاده کرد. تابع مولد گشتاور برای متغیر تصادفی X به صورت زیر نوشته خواهد شد.
\large {\displaystyle M_{X}(t):=\operatorname {E} \left[e^{tX}\right],\quad t\in \mathbb {R} ,}= {\displaystyle M_{X}(t)=\int _{-\infty }^{\infty }e^{tx}\,dF(x)}
رابطه3
به شرطی که این امید ریاضی متناهی باشد، میتوان از تابع مولد گشتاور برای تولید گشتاورهای توزیع یک متغیر تصادفی استفاده کرد.
نکته: مشخص است که اگر متغیر تصادفی X دارای توزیع گسسته باشد، برای محاسبه امید ریاضی در رابطه ۳ از جمع و در صورتی که پیوسته باشد از انتگرال استفاده خواهد شد.
\large {\displaystyle M_{X}(t)=\sum _{i=1}^{\infty }e^{tx_{i}}\,p_{i}}
\large {\displaystyle M_{X}(t)=\int _{-\infty }^{\infty }e^{tx}f(x)\,dx}
البته به شرطی که تابع چگالی احتمال در حالت پیوسته موجود باشد.
با توجه به سری مکلورن تابع نمایی میتوان نوشت:
\large e^{t\,X}=1+t\,X+{\frac {t^{2}\,X^{2}}{2!}}+{\frac {t^{3}\,X^{3}}{3!}}+\cdots +{\frac {t^{n}\,X^{n}}{n!}}+\cdots .
در نتیجه تابع مولد گشتاور برای متغیر تصادفی X به صورت یک چند جملهای برحسب t به شکل زیر خواهد بود.
\large {\displaystyle {\begin{aligned}M_{X}(t)=\operatorname {E} (e^{t\,X})&=1+t\operatorname {E} (X)+{\frac {t^{2}\operatorname {E} (X^{2})}{2!}}+{\frac {t^{3}\operatorname {E} (X^{3})}{3!}}+\cdots +{\frac {t^{n}\operatorname {E} (X^{n})}{n!}}+\cdots \\ \large &=1+tm_{1}+{\frac {t^{2}m_{2}}{2!}}+{\frac {t^{3}m_{3}}{3!}}+\cdots +{\frac {t^{n}m_{n}}{n!}}+\cdots \end{aligned}}}
رابطه ۴
در رابطه ۴،m_iنشانگر گشتاور iام حول صفر است.
انباشتک
انباشتک (Cumulant) برای متغیر تصادفی X براساس تابع مولد انباشتک، شخص میشود. اگر K(t) تابع انباشتک برای متغیر تصادفی X در نقطه t باشد آنگاه داریم:
\large {\displaystyle K(t)=\log \operatorname {E} \left[e^{tX}\right]}
به این ترتیب مشخص است که لگاریتم طبیعی (بر مبنای e) از تابع مولد گشتاور، تابع مولد انباشتک را نتیجه خواهد داد. اگر بسط مکلورن را برای تابع مولد انباشتک بنویسیم، خواهیم داشت:
\large {\displaystyle K(t)=\sum _{n=1}^{\infty }\kappa _{n}{\frac {t^{n}}{n!}}=\mu t+\sigma ^{2}{\frac {t^{2}}{2}}+\cdots}
که در آن k_n انباشتک مرتبه nام خواهد بود. همچنین \sigma، انحراف معیار و \mu نیز میانگین یا همان امید ریاضی متغیر تصادفی هستند. بین تابع مولد انباشتک و انباشتک nام رابطه زیر برقرار است.
\large \kappa _{n}=K^{(n)}(0)
ه این معنی که مشتق n ام تابع انباشتک در نقطه صفر همان مقدار انباشتک nام متغیر تصادفی X خواهد بود.
از خصوصیات جالب برای انباشتکها رابطه این تابع برای جمع دو متغیر تصادفی است که در تعیین تابع توزیع مجموع دو متغیر تصادفی نقش دارد. همچنین برای اثبات قضیه حد مرکزی (Central Limit Theorem) یا CLT از انباشتک نیز میتوان استفاده کرد.
اگر X و Y دو متغیر تصادفی مستقل باشند، آنگاه تابع انباشتک جمع آن دو، برابر با مجموع تابع انباشتک آنها خواهد بود. به بیان دیگر رابطه زیر بین توابع انباشتک آنها برقرار است:
\large {\displaystyle {\begin{aligned}K_{X+Y}(t)&=\log \operatorname {E} \left[e^{t(X+Y)}\right]\\[5pt]&=\log \left(\operatorname {E} \left[e^{tX}\right]\operatorname {E} \left[e^{tY}\right]\right)\\[5pt]&=\log \operatorname {E} \left[e^{tX}\right]+\log \operatorname {E} \left[e^{tY}\right]\\[5pt]&=K_{X}(t)+K_{Y}(t),\end{aligned}}}
به این ترتیب میتوان نتیجه گرفت که امید ریاضی مجموع دو متغیر تصادفی، برابر است با مجموع امید ریاضی آنها. همچنین اگر دو متغیر تصادفی مستقل باشند، واریانس مجموع این دو متغیر تصادفی برابر است با مجموع واریانس آنها.
خصوصیات گشتاورها
گشتاور اول متغیر تصادفی X نشانگر امید ریاضی متغیر تصادفی است. به این ترتیب داریم:
\large{\displaystyle \mu \equiv \operatorname {E} [X]}
همچنین واریانس نیز به عنوان گشتاور مرکزی دوم حول میانگین نوشته خواهد شد.
\large {\displaystyle \sigma \equiv \left(\operatorname {E} \left[(x-\mu )^{2}\right]\right)^{\frac {1}{2}}}
با استفاده از قواعد موجود در مورد گشتاورها، موجود بودن واریانس برای یک متغیر تصادفی، وجود میانگین را تضمین میکند.
همچنین محاسبه گشتاورهای مرکزی نرمال شده (Normalized Moments) در محاسبه چولگی (Skewness) و کشیدگی (Kurtosis) موثر هستند.
گشتاور نرمال شده مرتبه nام به صورت زیر محاسبه میشود:
\large {\displaystyle {\frac {\mu _{n}}{\sigma ^{n}}}={\frac {\operatorname {E} \left[(X-\mu )^{n}\right]}{\sigma ^{n}}}.}
بر این اساس میتوان سومین گشتاور مرکزی استاندارد یا نرمال شده را مبنایی برای مقدار چولگی دانست. همانطور که میدانید گشتاورهای مرکزی فرد از توزیع نرمال، همگی صفر هستند. بنابراین در توزیع نرمال، میزان چولگی صفر خواهد بود. در حالت کلی چولگی برحسب گشتاور مرکزی استاندارد یا نرمال شده به صورت زیر نوشته خواهد شد.
\large {\displaystyle \operatorname{Skew}[X] {\tilde {\mu }}_{3}=\operatorname {E} \left[\left({\frac {X-\mu }{\sigma }}\right)^{3}\right]={\frac {\mu _{3}}{\sigma ^{3}}}={\frac {\operatorname {E} \left[(X-\mu )^{3}\right]}{(\operatorname {E} \left[(X-\mu )^{2}\right])^{3/2}}}={\frac {\kappa _{3}}{\kappa _{2}^{3/2}}}}
که در آن k_3 انباشتک مرتبه ۳ است.
همچنین در مورد کشیدگی توزیع نیز از گشتاورهای مرکزی نرمال یا استاندارد شده برای محاسبات استفاده میشود. فرم محاسباتی برای کشیدگی در این حالت به صورت زیر خواهد بود.
\large{\displaystyle \operatorname {Kurt} [X]=\operatorname {E} \left[\left({\frac {X-\mu }{\sigma }}\right)^{4}\right]={\frac {\operatorname {E} [(X-\mu )^{4}]}{(\operatorname {E} [(X-\mu )^{2}])^{2}}}={\frac {\mu _{4}}{\sigma ^{4}}}}
محاسبه گشتاور به کمک تابع مولد گشتاور
برای محاسبه گشتاورهای یک متغیر تصادفی میتوان از تابع مولد گشتاور آن متغیر تصادفی نیز استفاده کرد. اگر از رابطه ۴ برحسب t یکبار مشتق گرفته و مقدار حاصل را به ازاء t=0 محاسبه کنیم، گشتاور مرکزی اول حول صفر برای متغیر تصادفی X حاصل خواهد شد. همین عمل را برای محاسبه گشتاور iام نیز میتوان انجام داد و کافی است که i بار از رابطه ۴ مشتق گرفته و حاصل را به ازاء t=0 بدست آورد.
مثال: برای پیدا کردن گشتاور مرتبه ۲، دوبار از رابطه ۴ مشتق بر حسب t میگیریم. در نتیجه خواهیم داشت:
\large {\displaystyle {\begin{aligned}M^{”}_{X}(t)&=\\ \large \dfrac{d^2\operatorname {E} (e^{t\,X})}{dt^2}&= {\operatorname {E} (X^{2})}+\cdots +{\frac {n(n-1)t^{n-2}\operatorname {E} (X^{n})}{n!}}+\cdots \\ \large &=m_{2}+\cdots +{\frac {t^{n-2}m_{n}}{(n-2)!}}+\cdots \end{aligned}}}
حال اگر t=0 قرار دهیم، گشتاور مرتبه دوم محاسبه خواهد شد.
رابطه بین انباشتک و گشتاورهای متغیرهای تصادفی
اگر μ′i گشتاور و κi نیز انباشتک iام باشند، رابطههای زیر بینشان برقرار خواهد بود.
\large {\displaystyle {\begin{aligned}\mu ‘_{1}={}&\kappa _{1}\\[5pt]\mu ‘_{2}={}&\kappa _{2}+\kappa _{1}^{2}\\[5pt]\mu ‘_{3}={}&\kappa _{3}+3\kappa _{2}\kappa _{1}+\kappa _{1}^{3}\\[5pt]\mu ‘_{4}={}&\kappa _{4}+4\kappa _{3}\kappa _{1}+3\kappa _{2}^{2}+6\kappa _{2}\kappa _{1}^{2}+\kappa _{1}^{4}\\[5pt]\mu ‘_{5}={}&\kappa _{5}+5\kappa _{4}\kappa _{1}+10\kappa _{3}\kappa _{2}+10\kappa _{3}\kappa _{1}^{2}+15\kappa _{2}^{2}\kappa _{1}+10\kappa _{2}\kappa _{1}^{3}+\kappa _{1}^{5}\\[5pt]\mu ‘_{6}={}&\kappa _{6}+6\kappa _{5}\kappa _{1}+15\kappa _{4}\kappa _{2}+15\kappa _{4}\kappa _{1}^{2}+10\kappa _{3}^{2}+60\kappa _{3}\kappa _{2}\kappa _{1}+20\kappa _{3}\kappa _{1}^{3}\\&{}+15\kappa _{2}^{3}+45\kappa _{2}^{2}\kappa _{1}^{2}+15\kappa _{2}\kappa _{1}^{4}+\kappa _{1}^{6}\end{aligned}}}
همچنین بین گشتاور مرکزی μi و انباشتکها نیز رابطههای زیر وجود دارد.
\large {\displaystyle {\begin{aligned}\mu _{1}&=0\\[4pt]\mu _{2}&=\kappa _{2}\\[4pt]\mu _{3}&=\kappa _{3}\\[4pt]\mu _{4}&=\kappa _{4}+3\kappa _{2}^{2}\\[4pt]\mu _{5}&=\kappa _{5}+10\kappa _{3}\kappa _{2}\\[4pt]\mu _{6}&=\kappa _{6}+15\kappa _{4}\kappa _{2}+10\kappa _{3}^{2}+15\kappa _{2}^{3}\end{aligned}}}
از طرفی، رابطه بین انباشتکها و گشتاورها نیز به صورت زیر نوشته خواهد شد.
\large {\displaystyle {\begin{aligned}\kappa _{1}={}&\mu ‘_{1}\\[4pt]\kappa _{2}={}&\mu ‘_{2}-{\mu ‘_{1}}^{2}\\[4pt]\kappa _{3}={}&\mu ‘_{3}-3\mu ‘_{2}\mu ‘_{1}+2{\mu ‘_{1}}^{3}\\[4pt]\kappa _{4}={}&\mu ‘_{4}-4\mu ‘_{3}\mu ‘_{1}-3{\mu ‘_{2}}^{2}+12\mu ‘_{2}{\mu ‘_{1}}^{2}-6{\mu ‘_{1}}^{4}\\[4pt]\kappa _{5}={}&\mu ‘_{5}-5\mu ‘_{4}\mu ‘_{1}-10\mu ‘_{3}\mu ‘_{2}+20\mu ‘_{3}{\mu ‘_{1}}^{2}+30{\mu ‘_{2}}^{2}\mu ‘_{1}-60\mu ‘_{2}{\mu ‘_{1}}^{3}+24{\mu ‘_{1}}^{5}\\[4pt]\kappa _{6}={}&\mu ‘_{6}-6\mu ‘_{5}\mu ‘_{1}-15\mu ‘_{4}\mu ‘_{2}+30\mu ‘_{4}{\mu ‘_{1}}^{2}-10{\mu ‘_{3}}^{2}+120\mu ‘_{3}\mu ‘_{2}\mu ‘_{1}\\&{}-120\mu ‘_{3}{\mu ‘_{1}}^{3}+30{\mu ‘_{2}}^{3}-270{\mu ‘_{2}}^{2}{\mu ‘_{1}}^{2}+360\mu ‘_{2}{\mu ‘_{1}}^{4}-120{\mu ‘_{1}}^{6}\end{aligned}}}
و همینطور بین انباشتکها و گشتاورهای مرکزی نیز ارتباطهای زیر برقرار است.
\large \begin{aligned} &\kappa _{2}=\mu _{2}\,\\& \kappa _{3}=\mu _{3}\, \\& \kappa _{4}=\mu _{4}-3{\mu _{2}}^{2}\\& \kappa _{5}=\mu _{5}-10\mu _{3}\mu _{2}\\ & \kappa _{6}=\mu _{6}-15\mu _{4}\mu _{2}-10{\mu _{3}}^{2}+30{\mu _{2}}^{3}\end{aligned}
خلاصه و جمعبندی
در این نوشتار با مفهوم گشتاور و انباشتک در آمار برای متغیر تصادفی آشنا شدید و نقش آن را در شناسایی تابع چگالی یا توزیع احتمال درک کردید. کاربردهای تابع مولد گشتاور در تولید شاخصهای آماری نیز در این مطلب مورد بررسی قرار گرفت. همچنین ارتباط بین گشتاورها و انباشتکها نیز مرور شد.
از آنجایی که تابع مولد گشتاور یا تابع مولد انباشتک، برای هر توزیع یا متغیر تصادفی منحصر به فرد هستند، شناخت آنها به منظور ایجاد رابطههای همتوزیعی بین متغیرهای تصادفی ضروری است. البته ممکن است برای یک متغیر تصادفی، تابع مولد گشتاور یا انباشتک موجود نباشد. در این صورت برای شناسایی و مشخص کردن توزیع یک متغیر تصادفی از «تابع مشخصه احتمال» (Characteristic Function) استفاده میشود.