مقدار احتمالP کجا استفاده می شود و نحوه محاسبه آن چگونه است؟
مقدار احتمال p یک معیار آماری است که برای تایید یک فرضیه در برابر داده های مشاهده شده استفاده می شود.
مقدار احتمال P اغلب برای ارتقای اعتبار مطالعات یا گزارشهای سازمانهای دولتی استفاده میشود. به عنوان مثال، اداره سرشماری ایالات متحده تصریح می کند که هر تجزیه و تحلیل با مقدار احتمال p بیشتر از 0.10 باید با بیانیه ای همراه شود که در آن تصریح شده است این مقدار به لحاظ آماری متفاوت از صفر نیست.
نکات کلیدی
مقدار احتمال p احتمال به دست آوردن نتایج مشاهده شده را با فرض صحت فرضیه صفر اندازه گیری می کند.
هرچه مقدار p کمتر باشد، اهمیت آماری تفاوت مشاهده شده بیشتر است.
مقدار احتمال p برابر یا کمتر از 05 به طور کلی از نظر آماری معنا دار در نظر گرفته می شود.
مقدار احتمال P می تواند به عنوان جایگزینی برای سطوح اطمینان از پیش انتخاب شده یا در کنار آنها برای تایید آزمون فرضیه عمل کند.
نحوه محاسبه مقدار احتمال P
مقادیر احتمال P معمولاً در جداول p-value یا صفحات گسترده یا نرم افزارهای آماری یافت می شوند. این محاسبات بر توزیع احتمال مفروض یا شناخته شده دادههای آماری آزمایش شده مبتنی هستند. مقادیر احتمال P براساس انحراف بین مقدار مشاهده شده و یک مقدار مرجع انتخابی و با توجه به توزیع احتمال دادههای آماری محاسبه میشوند به طوری که اختلاف بیشتر بین این دو مقدار با مقادیر کمتر p متناظر است.
به لحظ ریاضی، مقدار احتمال p با نسبت انتگرال ناحیه زیر منحنی توزیع احتمال برای همه مقادیر آماری که حداقل به اندازه مقدار مشاهده شده با مقدار مرجع فاصله دارند به مساحت کل زیر منحنی توزیع احتمال محاسبه می شود.
روش محاسبه مقدار احتمال p بر اساس نوع آزمایش انجام شده تغییر میکند. سه نوع آزمون مختلف برای تعیین مکان مقادیر آماری بر روی منحنی توزیع احتمال استفاده میشود: آزمون دنباله پایین، آزمون دنباله بالا یا آزمون دو طرفه.
به طور خلاصه، هر چه تفاوت بین دو مقدار مشاهده شده بیشتر باشد، احتمال اینکه این تفاوت از شانس تصادفی ساده ناشی شود کمتر خواهد و این مسئله با مقدار کمتر p نشان داده میشود.
رویکرد مقدار احتمال P برای آزمون فرضیه
در هنگام آزمودن درستی فرضیه به روش مقدار احتمال p، از احتمال محاسبه شده برای تعیین وجود یا عدم وجود شواهدی دال بر رد فرضیه صفر استفاده میشود. فرضیه صفر که همچنین به عنوان «حدس» نیز شناخته می شود، ادعای اولیه در مورد یک جمعیت (یا فرآیند تولید داده) است. فرضیه جایگزین بیان می کند که آیا پارامتر جمعیت با مقدار پارامتر جمعیت بیان شده در این حدس متفاوت است یا خیر.
در عمل، سطح معناداری نتایج از قبل بیان می شود تا مشخص شود که مقدار p برای رد فرضه صفر باید چقدر کوچک باشد. از آنجایی که محققان مختلف هنگام بررسی یک مسئله از سطوح اهمیت مختلف استفاده می کنند، گاهی اوقات ممکن است خواننده در مقایسه نتایج دو آزمون مختلف با مشکل مواجه شود. مقدار احتمال P راه حلی برای این مشکل ارائه می دهد.
برای مثال، فرض کنید مطالعهای که بازده دو دارایی خاص را مقایسه میکند، توسط محققان مختلفی انجام شده باشد که از دادههای یکسان اما سطوح اهمیت متفاوتی استفاده کردهاند. بدین ترتیب، ممکن است محققان در مورد تفاوت یا عدم تفاوت این دو دارایی به نتایج متضادی برسند.
اگر یکی از محققین از سطح اطمینان 90 درصد استفاده کرده باشد و دیگری برای رد فرضیه صفر سطح اطمینان 95 درصد را الزامی بداند و مقدار p تفاوت مشاهده شده بین این دو بازده 08/0 باشد (که با سطح اطمینان 92 درصد متناظر است)، در این حالت محقق اول به این نتیجه میرسد که دو دارایی تفاوتی با یکدیگر دارند که به لحاظ آماری معنادار است، در حالی که محقق دوم تفاوت آماری معناداری بین بازده ها مشاهده نکند.
برای جلوگیری از این مشکل، محققان میتوانند مقدار احتمال p آزمون فرضیه را گزارش کنند و به خوانندگان اجازه دهند تا اهمیت آماری را خودشان تفسیر کنند. به این روش رویکرد مقدار احتمال P برای آزمون فرضیه می گویند. ناظران مستقل می توانند مقدار p را یادداشت کنند و خودشان تصمیم بگیرند که آیا این تفاوت از نظر آماری معنادار است یا خیر.
هشدار
حتی یک مقدار احتمال p پایین لزوماً دلیلی بر اهمیت آماری نیست، زیرا هنوز این احتمال وجود دارد که داده های مشاهده شده به صورت تصادفی ایجاد شده باشند. فقط آزمایشها یا مطالعات مکرر میتوانند این مسئله را تأیید کنند که آیا یک رابطه از نظر آماری معنادار است یا خیر.
مثالی از مقدار احتمال P
یک سرمایه گذار ادعا می کند که عملکرد سبد سرمایه گذاری وی با شاخص استاندارد اند پورز 500 (S&P) برابر است. برای تعیین این موضوع، سرمایه گذار یک آزمایش دو طرفه انجام می دهد.
فرضیه صفر بیان میکند که بازده سبد سرمایهگذاری در یک دوره مشخص معادل بازده S&P 500 است، در حالی که فرضیه جایگزین بیان میکند که بازده سبد سرمایهگذاری و بازده S&P 500 معادل نیستند – اگر سرمایهگذار یک آزمون یک طرفه را انجام داده باشد، فرضیه جایگزین بیان می کند که بازده سبد سرمایهگذاری کمتر یا بیشتر از بازده S&P 500 است.
آزمون فرضیه مقدار احتمال p لزوماً از یک سطح اطمینان از پیش انتخاب شده استفاده نمی کند که در آن سرمایه گذار باید فرضیه صفر مبنی بر معادل بودن بازده را بازنشانی کند. درعوض، معیاری از میزان شواهد موجود برای رد فرضیه صفر ارائه می دهد. هر چه مقدار p کوچکتر باشد، شواهد علیه فرضیه صفر بیشتر است.
بنابراین، اگر سرمایهگذار متوجه شود که مقدار احتمالp برابر 0.001 است، یعنی شواهد قوی علیه فرضیه صفر وجود دارد و سرمایهگذار میتواند با اطمینان نتیجه بگیرد که بازده سبد سرمایهگذاری وی و بازده S&P 500 معادل نیستند.
اگرچه این رویکرد آستانه دقیقی برای پذیرش یا رد فرضیه صفر توسط سرمایهگذارا ارائه نمیدهد اما یک مزیت بسیار کاربردیتر دیگری دارد. آزمون فرضیه مقدار احتمال P راهی مستقیم برای مقایسه اعتماد نسبی سرمایه گذار به تفاوت عمکلرد گزینههای مختلف سرمایه گذاری یا سبد سرمایهگذاری نسبت به معیاری مانند S&P 500، ارائه می دهد.
به عنوان مثال، برای دو سبد سرمایهگذاری A و B که عملکرد آنها با شاخص S&P 500 به ترتیب با مقادیر پی 0.10 و 0.01 متفاوت است، سرمایهگذار میتواند اطمینانخاطر بیشتری داشته باشد که سبد سرمایهگذاری B با مقدار احتمال p پایینتر، در واقع به طور مداوم نتایج متفاوتی از خود نشان خواهد داد.