مقدار احتمالP کجا استفاده می شود و نحوه محاسبه آن چگونه است؟

مقدار احتمال p یک معیار آماری است که برای تایید یک فرضیه در برابر داده های مشاهده شده استفاده می شود.

کد خبر: ۷۱۳۵۴۰

مقدار احتمال P اغلب برای ارتقای اعتبار مطالعات یا گزارش‌های سازمان‌های دولتی استفاده می‌شود. به عنوان مثال، اداره سرشماری ایالات متحده تصریح می کند که هر تجزیه و تحلیل با مقدار احتمال p بیشتر از 0.10 باید با بیانیه ای همراه شود که در آن تصریح شده است این مقدار به لحاظ آماری متفاوت از صفر نیست.

نکات کلیدی

مقدار احتمال p احتمال به دست آوردن نتایج مشاهده شده را با فرض صحت فرضیه صفر اندازه گیری می کند.

هرچه مقدار p کمتر باشد، اهمیت آماری تفاوت مشاهده شده بیشتر است.

مقدار احتمال p برابر یا کمتر از 05 به طور کلی از نظر آماری معنا دار در نظر گرفته می شود.

مقدار احتمال P می تواند به عنوان جایگزینی برای سطوح اطمینان از پیش انتخاب شده یا در کنار آن‌ها برای تایید آزمون فرضیه عمل کند.

نحوه محاسبه مقدار احتمال P

مقادیر احتمال P معمولاً در جداول p-value یا صفحات گسترده یا نرم افزارهای آماری یافت می شوند. این محاسبات بر توزیع احتمال مفروض یا شناخته شده داده‌های آماری آزمایش شده مبتنی هستند. مقادیر احتمال P براساس انحراف بین مقدار مشاهده شده و یک مقدار مرجع انتخابی و با توجه به توزیع احتمال داده‌های آماری محاسبه می‌شوند به طوری که اختلاف بیشتر بین این دو مقدار با مقادیر کمتر p متناظر است.

به لحظ ریاضی، مقدار احتمال p با نسبت انتگرال ناحیه زیر منحنی توزیع احتمال برای همه مقادیر آماری که حداقل به اندازه مقدار مشاهده شده با مقدار مرجع فاصله دارند به مساحت کل زیر منحنی توزیع احتمال محاسبه می شود.

روش محاسبه مقدار احتمال p بر اساس نوع آزمایش انجام شده تغییر می‌کند. سه نوع آزمون مختلف برای تعیین مکان مقادیر آماری بر روی منحنی توزیع احتمال استفاده می‌شود: آزمون دنباله پایین، آزمون دنباله بالا یا آزمون دو طرفه.

به طور خلاصه، هر چه تفاوت بین دو مقدار مشاهده شده بیشتر باشد، احتمال اینکه این تفاوت از شانس تصادفی ساده ناشی شود کمتر خواهد و این مسئله با مقدار کمتر p نشان داده می‌شود.

رویکرد مقدار احتمال P برای آزمون فرضیه

در هنگام آزمودن درستی فرضیه به روش مقدار احتمال p، از احتمال محاسبه شده برای تعیین وجود یا عدم وجود شواهدی دال بر رد فرضیه صفر استفاده می‌شود. فرضیه صفر که همچنین به عنوان «حدس» نیز شناخته می شود، ادعای اولیه در مورد یک جمعیت (یا فرآیند تولید داده) است. فرضیه جایگزین بیان می کند که آیا پارامتر جمعیت با مقدار پارامتر جمعیت بیان شده در این حدس متفاوت است یا خیر.

در عمل، سطح معناداری نتایج از قبل بیان می شود تا مشخص شود که مقدار p برای رد فرضه صفر باید چقدر کوچک باشد. از آنجایی که محققان مختلف هنگام بررسی یک مسئله از سطوح اهمیت مختلف استفاده می کنند، گاهی اوقات ممکن است خواننده در مقایسه نتایج دو آزمون مختلف با مشکل مواجه شود. مقدار احتمال P راه حلی برای این مشکل ارائه می دهد.

برای مثال، فرض کنید مطالعه‌ای که بازده دو دارایی خاص را مقایسه می‌کند، توسط محققان مختلفی انجام شده باشد که از داده‌های یکسان اما سطوح اهمیت متفاوتی استفاده کرده‌اند. بدین ترتیب، ممکن است محققان در مورد تفاوت یا عدم تفاوت این دو دارایی به نتایج متضادی برسند.

اگر یکی از محققین از سطح اطمینان 90 درصد استفاده کرده باشد و دیگری برای رد فرضیه صفر سطح اطمینان 95 درصد را الزامی بداند و مقدار p تفاوت مشاهده شده بین این دو بازده 08/0 باشد (که با سطح اطمینان 92 درصد متناظر است)، در این حالت محقق اول به این نتیجه می‌رسد که دو دارایی تفاوتی با یکدیگر دارند که به لحاظ آماری معنادار است، در حالی که محقق دوم تفاوت آماری معناداری بین بازده ها مشاهده نکند.

برای جلوگیری از این مشکل، محققان می‌توانند مقدار احتمال p آزمون فرضیه را گزارش کنند و به خوانندگان اجازه دهند تا اهمیت آماری را خودشان تفسیر کنند. به این روش رویکرد مقدار احتمال P برای آزمون فرضیه می گویند. ناظران مستقل می توانند مقدار p را یادداشت کنند و خودشان تصمیم بگیرند که آیا این تفاوت از نظر آماری معنادار است یا خیر.

هشدار

حتی یک مقدار احتمال p پایین لزوماً دلیلی بر اهمیت آماری نیست، زیرا هنوز این احتمال وجود دارد که داده های مشاهده شده به صورت تصادفی ایجاد شده باشند. فقط آزمایش‌ها یا مطالعات مکرر می‌توانند این مسئله را تأیید کنند که آیا یک رابطه از نظر آماری معنادار است یا خیر.

مثالی از مقدار احتمال P

یک سرمایه گذار ادعا می کند که عملکرد سبد سرمایه گذاری وی با شاخص استاندارد اند پورز 500 (S&P) برابر است. برای تعیین این موضوع، سرمایه گذار یک آزمایش دو طرفه انجام می دهد.

فرضیه صفر بیان می‌کند که بازده سبد سرمایه‌گذاری در یک دوره مشخص معادل بازده S&P 500 است، در حالی که فرضیه جایگزین بیان می‌کند که بازده سبد سرمایه‌گذاری و بازده S&P 500 معادل نیستند – اگر سرمایه‌گذار یک آزمون یک طرفه را انجام داده باشد، فرضیه جایگزین بیان می کند که بازده سبد سرمایه‌گذاری کمتر یا بیشتر از بازده S&P 500 است.

آزمون فرضیه مقدار احتمال p لزوماً از یک سطح اطمینان از پیش انتخاب شده استفاده نمی کند که در آن سرمایه گذار باید فرضیه صفر مبنی بر معادل بودن بازده را بازنشانی کند. درعوض، معیاری از میزان شواهد موجود برای رد فرضیه صفر ارائه می دهد. هر چه مقدار p کوچکتر باشد، شواهد علیه فرضیه صفر بیشتر است.

بنابراین، اگر سرمایه‌گذار متوجه شود که مقدار احتمالp برابر 0.001 است، یعنی شواهد قوی علیه فرضیه صفر وجود دارد و سرمایه‌گذار می‌تواند با اطمینان نتیجه بگیرد که بازده سبد سرمایه‌گذاری وی و بازده S&P 500 معادل نیستند.

اگرچه این رویکرد آستانه دقیقی برای پذیرش یا رد فرضیه صفر توسط سرمایه‌گذارا ارائه نمی‌دهد اما یک مزیت بسیار کاربردی‌تر دیگری دارد. آزمون فرضیه مقدار احتمال P راهی مستقیم برای مقایسه اعتماد نسبی سرمایه گذار به تفاوت عمکلرد گزینه‌های مختلف سرمایه گذاری یا سبد سرمایه‌گذاری نسبت به معیاری مانند S&P 500، ارائه می دهد.

به عنوان مثال، برای دو سبد سرمایه‌گذاری A و B که عملکرد آنها با شاخص S&P 500 به ترتیب با مقادیر پی 0.10 و 0.01 متفاوت است، سرمایه‌گذار می‌تواند اطمینان‌خاطر بیشتری داشته باشد که سبد سرمایه‌گذاری B با مقدار احتمال p پایین‌تر، در واقع به طور مداوم نتایج متفاوتی از خود نشان خواهد داد.

ارسال نظرات