توزیع آماری چیست؟ | statistical distribution

توزیع آماری چیست؟ | statistical distribution

در نظریه احتمال و آمار تابع توزیع احتمال بیانگر احتمال هر یک از مقادیر متغیر تصادفی (در مورد متغیر گسسته) یا احتمال قرار گرفتن متغیر در یک بازه مشخص (در مورد متغیر تصادفی پیوسته) میباشد. توزیع تجمعی احتمال یک متغیر تصادفی تابعی است از دامنهٔ آن متغیر بر بازهٔ $  [0,1]$. به طوری که احتمال رخدادن پیشامدهای با مقدار عددی کمتر از آن را نمایش می‌دهد. و به صورت دقیق به شکل زیر تعریف می‌شود:

$$ F_{X}(x)=\Pr \left[X\leq x\right]$$

بر اساس این که این متغیر گسسته یا پیوسته باشد توزیع گسسته یا پیوسته نام می‌گیرد.

خاصیت‌های تابع توزیع احتمال

همواره داریم: $ F_{X}(+\infty )=1$ و $ F_{X}(-\infty )=0$
تابع توزیع تجمعی غیر نزولی ست، یعنی: $ x_{1}\leq x_{2}\Rightarrow F_{X}(x_{1})\leq F_{X}(x_{2})$
تابع توزیع همواره از راست پیوسته‌است: $ \lim _{x\rightarrow a^{+}}F(x)=F(a)$

اگر تابع توزیع تجمعی پیوسته باشد مشتق ان برابر تابع چگالی متغیر مورد بررسی است و اگر تابع توزیع گسسته باشد مشتق ان برابر تابع احتمال متغیر مورد بررسی است.

توزیع احتمال گسسته

پیشینهٔ نظریهٔ احتمال به مطالعات پاسکال بر رفتار تاس‌ها برمی‌گردد

پیشینهٔ نظریهٔ احتمال، به قرن هفدهم میلادی و مطالعات بلیز پاسکال روی اعداد ظاهر شده بر تاس‌ها برمی‌گردد. پس از او لاپلاس، احتمال را به صورت نسبت پیشامدهای مطلوب به کل پیشامدها تعریف کرد. برای مثال احتمال آمدن عدد زوج، هنگام انداختن یک تاس سالم، برابر است با ۳ (یعنی تعداد حالت‌هایی که ممکن است عدد زوج بیاید یا به تعبیر دیگر ۲، ۴ یا ۶ ظاهر شود) بخش بر ۶ (یعنی کل حالت‌هایی که ممکن است با انداختن تاس ظاهر شود یا به تعبیر دیگر آمدن ۱، ۲، ۳، ۴، ۵ یا ۶) که برابر می‌شود با $ {3 \over 6}$ یا $ {1 \over 2}$

نظریهٔ احتمال

چند تعریف

برای ادامهٔ بحث، لازم است که ابتدا چند واژه را تعریف کنیم:

آزمایش تصادفی
یک آزمایش که نتیجهٔ آن به هیچ‌وجه قابل پیش‌بینی نباشد یا اصطلاحاً تصادفی باشد؛ مثل انداختن تاس یا سکه.
فضای نمونه
مجموعهٔ کل نتیجه‌هایی که ممکن است از یک آزمایش تصادفی حاصل شود؛ مثلاً در آزمایش انداختن تاس فضای نمونه به صورت $ \{1,2,3,4,5,6\}$ است.
پیشامد
به هریک از زیرمجموعه‌های فضای نمونه یک پیشامد می‌گویند؛ مثلاً $ \{2,4,6\}$ یک پیشامد در آزمایش انداختن تاس است.

فضای نمونهٔ هم‌شانس

در صورتی که همهٔ اعضای فضای نمونه شانس برابری برای ظاهر شدن داشته باشند یا به عبارت دیگر، شانس تمام اعضا یکسان باشد، این فضای نمونه را هم‌شانس می‌خوانیم. مثلاً آزمایش انداختن تاس سالم در فضای هم‌شانس است.
احتمال در فضای متناهی

اگر فضای نمونهٔ ما هم‌شانس و دارای تعداد اعضای متناهی باشد، برای محاسبهٔ احتمال وقوع یک پیشامد، فرمول لاپلاس را به کار می‌گیریم.

$$ p={|E| \over |S|}$$

یا به عبارت دیگر، احتمال وقوع یک پیشامد برابر است با نسبت اندازهٔ پیشامد به اندازهٔ فضای نمونه. برای مثال اگر آزمایش انداختن تاس سالم را در نظر بگیریم که دارای فضای نمونهٔ هم‌شانس با اندازهٔ متناهی است، با توجه به آنچه پیش‌تر گفته شد، احتمال آمدن عدد ۶، برابر است با اندازه پیشامد (یعنی اندازهٔ $ \{6\}$ که ۱ است) بخش بر اندازهٔ فضای نمونه (یعنی اندازهٔ $ \{1,2,3,4,5,6\}$ که ۶ است). به این ترتیب احتمال آمدن عدد ۶، برابر با $ 1 \over 6$ محاسبه می‌شود.

احتمال پیشامدهای مرکب

گاهی می‌خواهیم با داشتن احتمال چند پیشامد، بتوانیم احتمال مجموعهٔ حاصل از اعمال جبر مجموعه‌ها بر آن‌ها را نیز محاسبه کنیم. دو مورد مهم‌تر به شرح زیر است:

احتمال مکمل یک پیشامد: مکمل یک پیشامد زمانی اتفاق می‌افتد که خود آن پیشامد اتفاق نیفتد. به عبارت دیگر ما می‌خواهیم احتمال رخ ندادن یک پیشامد را حساب کنیم. از آن‌جا که پیشامد زیرمجموعه‌ای از فضای نمونه است، مکمل آن، زیرمجموعه‌ای از فضای نمونه است که اعضای آن در پیشامد مورد نظر ما قرار ندارند. به این ترتیب با توجه به فرمول لاپلاس، رابطهٔ زیر برای محاسبهٔ احتمال مکمل یک پیشامد، با داشتن احتمال خود آن پیشامد به دست می‌آید:
$$ p({\bar {E}})=1-p(E)$$

با توجه به آنچه گفته شد اثبات این رابطه بسیار ساده است.

احتمال اجتماع دو پیشامد: همان‌طور که از مفهوم اجتماع مجموعه‌ها برمی‌آید، وقوع اجتماع دو پیشامد به معنی آن است که حداقل یکی از این دو پیشامد اتفاق بیفتد. برای محاسبهٔ احتمال اجتماع دو پیشامد، با فرض داشتن احتمال خود آن‌ها و احتمال اشتراک شان، رابطهٔ زیر را داریم:
$$ p(E\cup F)=p(E)+p(F)-p(E\cap F)$$

اثبات این رابطه با دانستن این‌که $ |E\cup F|=|E|+|F|-|E\cap F|$ میسر است.

تخصیص احتمال

تا این‌جا بیش‌تر دربارهٔ آزمایش‌ها و فضاهای نمونه‌ای بحث کردیم که هم‌شانس هستند. با این وجود، بسیاری از آزمایش‌ها در فضای‌های هم‌شانس اتفاق نمی‌افتند و در نتیجه برای محاسبهٔ احتمال آن‌ها نمی‌توان به سادگی فرمول لاپلاس را به کار برد.

برای حل این مشکل، راه‌حل تخصیص احتمال را به این ترتیب به کار می‌بریم: به تک‌تک اعضای فضای نمونه احتمالی نسبت می‌دهیم که از دو قانون زیر پیروی کند:

مقدار هر یک از این احتمال‌ها باید بین صفر و یک باشد؛ به عبارت دیگر برای هر $ s\in S$ داشته باشیم: $ 0\leq p(s)\leq 1$ مجموع مقدار احتمال‌های تخصیص‌داده‌شده، برابر ۱ باشد؛ به عبارت دیگر داشته باشیم: $ \sum _{s\in S}p(s)=1$

به تابع احتمال p، تابع توزیع احتمال می‌گوییم. اگر تابع احتمال به هر عضو فضای نمونه، مقدار یکسانی نسبت دهد، آن را توزیع یک‌نواخت می‌خوانیم. روشن است که با توجه به آنچه در این‌جا تعریف کردیم، احتمال وقوع یک پیشامد برابر است با مجموع احتمال اعضایی از فضای نمونه که در آن پیشامد حضور دارند.

 

احتمال شرطی و استقلال پیشامدها

فرض کنید خانواده‌ای دو فرزند دارد. می‌خواهیم بدانیم اگر فرزند اول پسر باشد، با چه احتمالی فرزند دوم دختر خواهد بود؟ برای حل چنین مسئله‌ای از رابطهٔ احتمال شرطی استفاده می‌کنیم که به شکل زیر است:

$$ p(E|F)={p(E\cap F) \over p(F)}$$

یا به عبارت دیگر احتمال وقوع E، اگر F اتفاق افتاده باشد، برابر است با نسبت احتمال اشتراک E و F به احتمال F.

حال اگر این دو پیشامد از هم مستقل باشند، روشن است که وقوع E ارتباطی با وقوع F نخواهد داشت یا به تعبیر دیگر $ p(E|F)$ همان $ p(E)$ خواهد بود. به این ترتیب می‌توانیم دو پیشامد E و F را مستقل بدانیم، در صورتی که:

$$ p(E\cap F)=p(E)p(F)$$