توزیع آماری چیست؟ | statistical distribution
توزیع آماری چیست؟ | statistical distribution
در نظریه احتمال و آمار تابع توزیع احتمال بیانگر احتمال هر یک از مقادیر متغیر تصادفی (در مورد متغیر گسسته) یا احتمال قرار گرفتن متغیر در یک بازه مشخص (در مورد متغیر تصادفی پیوسته) میباشد. توزیع تجمعی احتمال یک متغیر تصادفی تابعی است از دامنهٔ آن متغیر بر بازهٔ $ [0,1]$. به طوری که احتمال رخدادن پیشامدهای با مقدار عددی کمتر از آن را نمایش میدهد. و به صورت دقیق به شکل زیر تعریف میشود:
- $$ F_{X}(x)=\Pr \left[X\leq x\right]$$
بر اساس این که این متغیر گسسته یا پیوسته باشد توزیع گسسته یا پیوسته نام میگیرد.
خاصیتهای تابع توزیع احتمال
همواره داریم: $ F_{X}(+\infty )=1$ و $ F_{X}(-\infty )=0$
تابع توزیع تجمعی غیر نزولی ست، یعنی: $ x_{1}\leq x_{2}\Rightarrow F_{X}(x_{1})\leq F_{X}(x_{2})$
تابع توزیع همواره از راست پیوستهاست: $ \lim _{x\rightarrow a^{+}}F(x)=F(a)$
اگر تابع توزیع تجمعی پیوسته باشد مشتق ان برابر تابع چگالی متغیر مورد بررسی است و اگر تابع توزیع گسسته باشد مشتق ان برابر تابع احتمال متغیر مورد بررسی است.
توزیع احتمال گسسته
پیشینهٔ نظریهٔ احتمال به مطالعات پاسکال بر رفتار تاسها برمیگردد
پیشینهٔ نظریهٔ احتمال، به قرن هفدهم میلادی و مطالعات بلیز پاسکال روی اعداد ظاهر شده بر تاسها برمیگردد. پس از او لاپلاس، احتمال را به صورت نسبت پیشامدهای مطلوب به کل پیشامدها تعریف کرد. برای مثال احتمال آمدن عدد زوج، هنگام انداختن یک تاس سالم، برابر است با ۳ (یعنی تعداد حالتهایی که ممکن است عدد زوج بیاید یا به تعبیر دیگر ۲، ۴ یا ۶ ظاهر شود) بخش بر ۶ (یعنی کل حالتهایی که ممکن است با انداختن تاس ظاهر شود یا به تعبیر دیگر آمدن ۱، ۲، ۳، ۴، ۵ یا ۶) که برابر میشود با $ {3 \over 6}$ یا $ {1 \over 2}$
نظریهٔ احتمال
چند تعریف
برای ادامهٔ بحث، لازم است که ابتدا چند واژه را تعریف کنیم:
آزمایش تصادفی
یک آزمایش که نتیجهٔ آن به هیچوجه قابل پیشبینی نباشد یا اصطلاحاً تصادفی باشد؛ مثل انداختن تاس یا سکه.
فضای نمونه
مجموعهٔ کل نتیجههایی که ممکن است از یک آزمایش تصادفی حاصل شود؛ مثلاً در آزمایش انداختن تاس فضای نمونه به صورت $ \{1,2,3,4,5,6\}$ است.
پیشامد
به هریک از زیرمجموعههای فضای نمونه یک پیشامد میگویند؛ مثلاً $ \{2,4,6\}$ یک پیشامد در آزمایش انداختن تاس است.
فضای نمونهٔ همشانس
در صورتی که همهٔ اعضای فضای نمونه شانس برابری برای ظاهر شدن داشته باشند یا به عبارت دیگر، شانس تمام اعضا یکسان باشد، این فضای نمونه را همشانس میخوانیم. مثلاً آزمایش انداختن تاس سالم در فضای همشانس است.
احتمال در فضای متناهی
اگر فضای نمونهٔ ما همشانس و دارای تعداد اعضای متناهی باشد، برای محاسبهٔ احتمال وقوع یک پیشامد، فرمول لاپلاس را به کار میگیریم.
$$ p={|E| \over |S|}$$
یا به عبارت دیگر، احتمال وقوع یک پیشامد برابر است با نسبت اندازهٔ پیشامد به اندازهٔ فضای نمونه. برای مثال اگر آزمایش انداختن تاس سالم را در نظر بگیریم که دارای فضای نمونهٔ همشانس با اندازهٔ متناهی است، با توجه به آنچه پیشتر گفته شد، احتمال آمدن عدد ۶، برابر است با اندازه پیشامد (یعنی اندازهٔ $ \{6\}$ که ۱ است) بخش بر اندازهٔ فضای نمونه (یعنی اندازهٔ $ \{1,2,3,4,5,6\}$ که ۶ است). به این ترتیب احتمال آمدن عدد ۶، برابر با $ 1 \over 6$ محاسبه میشود.
احتمال پیشامدهای مرکب
گاهی میخواهیم با داشتن احتمال چند پیشامد، بتوانیم احتمال مجموعهٔ حاصل از اعمال جبر مجموعهها بر آنها را نیز محاسبه کنیم. دو مورد مهمتر به شرح زیر است:
احتمال مکمل یک پیشامد: مکمل یک پیشامد زمانی اتفاق میافتد که خود آن پیشامد اتفاق نیفتد. به عبارت دیگر ما میخواهیم احتمال رخ ندادن یک پیشامد را حساب کنیم. از آنجا که پیشامد زیرمجموعهای از فضای نمونه است، مکمل آن، زیرمجموعهای از فضای نمونه است که اعضای آن در پیشامد مورد نظر ما قرار ندارند. به این ترتیب با توجه به فرمول لاپلاس، رابطهٔ زیر برای محاسبهٔ احتمال مکمل یک پیشامد، با داشتن احتمال خود آن پیشامد به دست میآید:
$$ p({\bar {E}})=1-p(E)$$
با توجه به آنچه گفته شد اثبات این رابطه بسیار ساده است.
احتمال اجتماع دو پیشامد: همانطور که از مفهوم اجتماع مجموعهها برمیآید، وقوع اجتماع دو پیشامد به معنی آن است که حداقل یکی از این دو پیشامد اتفاق بیفتد. برای محاسبهٔ احتمال اجتماع دو پیشامد، با فرض داشتن احتمال خود آنها و احتمال اشتراک شان، رابطهٔ زیر را داریم:
$$ p(E\cup F)=p(E)+p(F)-p(E\cap F)$$
اثبات این رابطه با دانستن اینکه $ |E\cup F|=|E|+|F|-|E\cap F|$ میسر است.
تخصیص احتمال
تا اینجا بیشتر دربارهٔ آزمایشها و فضاهای نمونهای بحث کردیم که همشانس هستند. با این وجود، بسیاری از آزمایشها در فضایهای همشانس اتفاق نمیافتند و در نتیجه برای محاسبهٔ احتمال آنها نمیتوان به سادگی فرمول لاپلاس را به کار برد.
برای حل این مشکل، راهحل تخصیص احتمال را به این ترتیب به کار میبریم: به تکتک اعضای فضای نمونه احتمالی نسبت میدهیم که از دو قانون زیر پیروی کند:
مقدار هر یک از این احتمالها باید بین صفر و یک باشد؛ به عبارت دیگر برای هر $ s\in S$ داشته باشیم: $ 0\leq p(s)\leq 1$ مجموع مقدار احتمالهای تخصیصدادهشده، برابر ۱ باشد؛ به عبارت دیگر داشته باشیم: $ \sum _{s\in S}p(s)=1$
به تابع احتمال p، تابع توزیع احتمال میگوییم. اگر تابع احتمال به هر عضو فضای نمونه، مقدار یکسانی نسبت دهد، آن را توزیع یکنواخت میخوانیم. روشن است که با توجه به آنچه در اینجا تعریف کردیم، احتمال وقوع یک پیشامد برابر است با مجموع احتمال اعضایی از فضای نمونه که در آن پیشامد حضور دارند.
احتمال شرطی و استقلال پیشامدها
فرض کنید خانوادهای دو فرزند دارد. میخواهیم بدانیم اگر فرزند اول پسر باشد، با چه احتمالی فرزند دوم دختر خواهد بود؟ برای حل چنین مسئلهای از رابطهٔ احتمال شرطی استفاده میکنیم که به شکل زیر است:
$$ p(E|F)={p(E\cap F) \over p(F)}$$
یا به عبارت دیگر احتمال وقوع E، اگر F اتفاق افتاده باشد، برابر است با نسبت احتمال اشتراک E و F به احتمال F.
حال اگر این دو پیشامد از هم مستقل باشند، روشن است که وقوع E ارتباطی با وقوع F نخواهد داشت یا به تعبیر دیگر $ p(E|F)$ همان $ p(E)$ خواهد بود. به این ترتیب میتوانیم دو پیشامد E و F را مستقل بدانیم، در صورتی که:
$$ p(E\cap F)=p(E)p(F)$$