منظور از توزیع نمونه گیری چیست؟
توزیع نمونه گیری، توزیع احتمال آمارهای است که از طریق نمونه گیری مکرر از یک جامعه خاص به دست می آید.
در آمار، جامعه به کل مجموعه ای گفته می شود که یک نمونه آماری از آن استخراج می شود. جامعه ممکن است به یک گروه کامل از افراد، اشیاء، رویدادها، بازدید از بیمارستان یا اندازه گیری ها اشاره کند. بنابراین، میتوان گفت که جامعه آماری، مشاهده کلی آزمودنیهایی است که براساس یک ویژگی مشترک با هم در یک گروه گروهبندی شدهاند.
نکات کلیدی
این توزیع طیفی از نتایج ممکن یک آماره خاص مانند میانگین یا نمای برخی از متغیرها را برای یک جامعه آماری توصیف می کند.
اکثریت داده هایی که محققان تحلیل میکنند در واقع از بررسی نمونهها حاصل شدهاند و نه کل جمعیت.
آشنایی با توزیع نمونه گیری
بسیاری از داده هایی که دانشگاهیان، آماردانان، محققان، بازاریابان، تحلیلگران و غیره ترسیم و استفاده میکنند، در واقع از نمونهها به دست آمدهاند و نه جمعیت. نمونه زیر مجموعه ای از یک جامعه است. به عنوان مثال، یک محقق پزشکی که قصد دارد میانگین وزن همه نوزادان متولد شده در آمریکای شمالی از سال 1995 تا 2005 را با نوزادانی که در آمریکای جنوبی در همان بازه زمانی متولد شدهاند مقایسه کند، نمیتواند دادههای کل جمعیت بیش از یک میلیون زایمانی را که در بازه زمانی ده ساله اتفاق افتاده است در مدت زمان معقولی تهیه کند. این محقق در عوض فقط از وزن مثلاً 100 نوزاد در هر قاره برای نتیجه گیری خود استفاده خواهد کرد. وزن 100 نوزاد استفاده شده در این پژوهش نمونه و میانگین وزن محاسبه شده میانگین نمونه خواهد بود.
حال فرض کنید که این محقق پزشکی به جای استفاده از یک نمونه متشکل از وزن 100 نوزاد از هر قاره، نمونه های تصادفی مکرری را از جمعیت عادی هریک از این دو قاره اخذ و میانگین نمونه را برای هر گروه از نمونهها محاسبه می کند. بنابراین، این محقق برای نمونهگیری از قاره آمریکای شمالی داده های وزن 100 نوزاد ثبت شده در کشورهای ایالات متحده، کانادا و مکزیک را به شرح زیر جمع آوری میکند: چهار نمونه 100 عضوی از بیمارستان های منتخب ایالات متحده، پنج نمونه 70 عضوی از کانادا، و سه نمونه 150 عضوی از مکزیک که در مجموع وزن 1200 نوزاد تازه متولد شده در 12 مجموعه گروه بندی شده را به دست میدهد. این محقق همچنین دادههای نمونه از وزن 100 نوزاد هنگام تولد را از هر یک از 12 کشور آمریکای جنوبی جمع آوری میکند.
مهم
هر نمونه میانگین نمونه خاص خود را دارد و توزیع میانگین نمونه به توزیع نمونه معروف است.
میانگین وزن محاسبهشده برای هر مجموعه نمونه، توزیع نمونه گیری میانگین است. نمونهها تنها برای محاسبه میانگین استفاده نمیشوند. سایر آمارهها مانند انحراف معیار، واریانس، نسبت و دامنه را می توان از داده های نمونه محاسبه کرد. انحراف معیار و واریانس پراکندگی توزیع نمونه گیری را اندازهگیری میکنند.
تعداد مشاهدات در یک جامعه، تعداد مشاهدات در یک نمونه و روشی که برای استخراج مجموعههای نمونه استفاده میشود، پراکندگی توزیع نمونه گیری را تعیین میکنند. انحراف معیار توزیع نمونه گیری، خطای استاندارد نامیده میشود. در حالی که میانگین توزیع نمونهگیری برابر با میانگین جامعه است، خطای استاندارد به انحراف معیار جامعه، اندازه جامعه و اندازه نمونه بستگی دارد.
اطلاع از میزان پراکندگی میانگینهای هر یک از مجموعههای نمونه از یکدیگر و از میانگین جامعه، نشاندهنده نزدیکی میانگینهای نمونهها به میانگین جامعه است. خطای استاندارد توزیع نمونه گیری با افزایش اندازه نمونه کاهش می یابد.
ملاحظات ویژه
یک جامعه یا یک مجموعه نمونه از اعداد دارای توزیع نرمال خواهد بود. با این حال، از آنجا که توزیع نمونه گیری شامل مجموعههای متعددی از مشاهدات میشود، لزوماً شکل منحنی زنگولهای نخواهد داشت.
پیرو مثال ما در بالا، میانگین وزن جمعیت نوزادان در آمریکای شمالی و آمریکای جنوبی دارای توزیع نرمال خواهد بود، زیرا برخی از نوزادان کم وزن (زیر میانگین) خواهند بود و برخی دیگر اضافه وزن (بالاتر از میانگین) خواهند داشت و وزن اکثر نوزادان در این بین (نزدیک به میانگین) قرار می گیرد. اگر میانگین وزن نوزادان در آمریکای شمالی هفت پوند باشد، میانگین نمونه وزن نوزادان در هر یک از 12 مجموعه مشاهدات نمونه ثبت شده برای آمریکای شمالی نیز نزدیک به هفت پوند خواهد بود.
با این حال، اگر هر یک از میانگینهای محاسبهشده در هر یک از 1200 گروه نمونه را بر روی نموداری ترسیم کنید، شکل حاصل ممکن است توزیع یکنواختی را نشان دهد، اما پیشبینی قطعی اینکه شکل واقعی چه خواهد شد دشوار است. هر چه محقق نمونه های بیشتری از جمعیت بیش از یک میلیون وزنی نوزادان تازه متولد شده استخراج کند، شکل نمودار بیشتر به شکل توزیع نرمال نزدیکتر خواهد شد.