دانشکده علوم
پايان نامه ي کارشناسي ارشد در رشته آمار
برآورد ميانگين درنمونه گيري مضاعف براي طبقه بندي با استفاده ازاطلاعات کمکي چند متغيره
به کوشش
ليلا سينايي اصفهاني
استاد راهنما
دکتر محمد صدوقي الوندي
اسفند ماه 1392
به نام خدا
اظهارنامه
اينجانب ليلا سينايي اصفهاني (900369) دانشجوي رشته ي آمار گرايش رياضي دانشکده ي علوم اظهارمي کنم که اين پايان نامه حاصل پژوهش خودم بوده و درجاهايي که از منابع ديگران استفاده کرده ام، نشاني دقيق و مشخصات کامل آن
را نوشته ام. همچنين اظهارمي کنم که تحقيق و موضوع پايان نامه ام تکراري نيست و تعهد مي نمايم که بدون مجوز دانشگاه دستاوردهاي آن را منتشرننموده و يا در اختيار غير قرار ندهم. کليه حقوق اين اثر مطابق با آيين نامه مالکيت فکري و معنوي متعلق به دانشگاه شيراز است.
نام و نام خانوادگي :ليلا سينايي اصفهاني
تاريخ و امضا :4/12/1392
تقديم به
پدر و مادر عزيزم
به خاطر همه ي تلاش هاي محبت آميز ي که در دوران مختلف زندگي ام
انجام داده اند و با مهرباني چگونه زيستن را به من آموخته اند
و
برادرم، محمد و خواهرم، فهيمه همراهان هميشگي و پشتوانه هاي زندگيم .
سپاسگزاري
با سپاس فراوان از راهنمائي‌ها و زحمات استاد محترم و گرانقدر جناب آقاي دکتر محمد صدوقي که از ابتداي راه و در طي انجام اين تحقيق، با راهنمائي‌هاي خود مرا در نگارش اين اثر ياري نمودند. قدرداني و تقدير از اساتيد محترم مشاور، سرکار خانم دکتر زهرا سجادنيا و جناب آقاي دکتر
امين قلمفرسا که دلسوزانه، زحمت مشاوره ي اين پايان نامه را بر عهده گرفته اند، همچنين از استاد محترم سر کار خانم دکتر مينا توحيدي که زحمت داوري اين اثر را برعهده گرفته اند سپاسگزاري مي کنم.
در پايان از کساني که در اين راه از هم فکري و راهنمايي هاي آن ها برخوردار شدم به خصوص سرکار خانم دکتر ساره گلي، استاديار دانشگاه صنعتي اصفهان و دوستاني که بودنشان باعث دلگرمي من شد، صميمانه سپاسگزارم.
چکيده
برآورد ميانگين در نمونه گيري مضاعف براي طبقه بندي
با استفاده از اطلاعات کمکي چند متغيره
به کوشش
ليلا سينايي اصفهاني
نمونه گيري مضاعف (يا نمونه گيري دو فازي) يک طرح نمونه گيري است که با استفاده از اطلاع از متغير يا متغيرهاي کمکي متعدد که در ارتباط با متغير مورد مطالعه مي باشند، دقت برآوردگرهاي ميانگين جامعه را افزايش مي دهند. در طرح نمونه گيري مضاعف براي
طبقه بندي (DSS) در فاز اول يک نمونه ي اوليه بزرگ از متغيرهاي کمکي گرفته شده و واحدهاي نمونه طبقه بندي مي شوند سپس در فاز دوم، زير نمونه اي انتخاب شده و متغير مورد مطالعه اندازه گيري مي شود. در اين پايان نامه با استفاده از طرح نمونه گيري DSS، دو کلاس از برآوردگرها ي ميانگين جامعه مطرح مي شوند. همچنين در بين اين کلاس ها، بهترين برآوردگرها بطور مجانبي و واريانس تقريبي آن ها بدست مي آيند، سپس اين کلاس از برآوردگرها با کلاس برآوردگرهاي مربوط به طرح نمونه گيري مضاعف طبقه بندي نشده (USDS) مورد مقايسه قرار مي گيرند. در پايان با استفاده از يک جامعه واقعي نتايج بدست آمده را اثبات مي کنيم.
کلمات کليدي : متغير مورد مطالعه – متغير کمکي – اريبي – واريانس –
نمونه گيري مضاعف براي طبقه بندي
فهرست مطالب
عنوان
صفحهفصل اول: مباحث مقدماتي
1-1 مقدمه……………………………………………………………………………………………………………………………..1 1-2 تعاريف و مفاهيم پايه اي………………………………………………………………………………………………..3 1-3 طرح هاي نمونه گيري…………………………………………………………………………………………………12
فصل دوم: طرح نمونه گيري مضاعف براي طبقه بندي با استفاده ازيک
اطلاع کمکي
2-1 مقدمه…………………………………………………………………………………………………………………………..19 2-2 پارامترهاي جامعه و طبقات…………………………………………………………………………………………22 2-3 آماره هاي نمونه اي طبقات…………………………………………………………………………………………24 2-4 برآورد معمولي ميانگين در نمونه گيري مضاعف براي طبقه بندي……………………………27 2-5 برآوردگر رگرسيوني مرکب و برآوردگر رگرسيوني جدا در نمونه گيري مضاعف
براي طبقه بندي…………………………………………………………………………………………………………..28 2-5-1 برآوردگر رگرسيوني مرکب براي ميانگين جامعه……………………………………………….29 2-5-2 برآوردگر رگرسيوني جدا براي ميانگين جامعه……………………………………………………30 2-6 يک کلاس بزرگ از برآوردگرها براي ميانگين جامعه با استفاده از يک متغير کمکي.30 2-7 يک کلاس از برآوردگرهاي مرکب براي ميانگين جامعه در نمونه گيري مضاعف
براي طبقه بندي…………………………………………………………………………………………………………..32 2-7-1 محاسبه اريبي و واريانس کلاس برآوردگرهاي مرکب………………………………………..34 2-7-2 کلاس برآوردگرهاي مرکب بر اساس برآورد مقدار بهينه…………………………………..39 2-7-3 مقايسه کلاس برآورد گرهاي مرکب و برآوردگر معمولي y ?_ds ………………………….43 2-8 يک کلاس از برآوردگرهاي جدا براي ميانگين جامعه بر اساس نمونه گيري مضاعف
براي طبقه بندي…………………………………………………………………………………………………………..44 2-8-1 محاسبه اريبي و واريانس کلاس برآوردگرهاي جدا …………………………………………..47 2-8-2 کلاس برآوردگرهاي جدا بر اساس برآورد مقدار بهينه……………………………………….50 2-9 مقايسه دو کلاس برآوردگرهاي مرکب و برآوردگرهاي جدا در طرح نمونه گيري
مضاعف براي طبقه بندي……………………………………………………………………………………………..53
فصل سوم: طرح نمونه گيري مضاعف براي طبقه بندي با استفاده از اطلاعات کمکي
چند متغيره
3-1 مقدمه…………………………………………………………………………………………………………………………..54 3-2 پارامترهاي جامعه و طبقات…………………………………………………………………………………………55 3-3 آماره هاي نمونه اي طبقات…………………………………………………………………………………………57 3-4 برآوردگرهاي رگرسيوني مرکب و جدا در نمونه گيري مضاعف براي طبقه بندي با
استفاده از اطلاعات کمکي چند متغيره……………………………………………………………………….59 3-4-1 برآوردگر رگرسيوني مرکب چند متغيره براي ميانگين جامعه……………………………60 3-4-2 برآوردگر رگرسيوني جدا چند متغيره براي ميانگين جامعه……………………………….61 3-5 يک کلاس بزرگ از برآوردگرها براي ميانگين جامعه با استفاده از اطلاعات کمکي
چند متغيره…………………………………………………………………………………………………………………..62 3-6 يک کلاس از برآوردگرهاي مرکب براي ميانگين جامعه در نمونه گيري مضاعف براي
طبقه بندي……………………………………………………………………………………………………………………65 3-6-1 محاسبه اريبي و واريانس کلاس برآوردگرهاي مرکب………………………………………..67 3-6-2 کلاس برآوردگرهاي مرکب بر اساس برآورد مقدار بهينه……………………………………72 3-6-3 مقايسه کلاس برآورد گرهاي مرکب و برآوردگر معمولي y ?_ds …………………………..74 3-7 يک کلاس از برآوردگرهاي جدا در نمونه گيري مضاعف براي طبقه بندي……………….75 3-7-1 محاسبه اريبي و واريانس کلاس برآوردگرهاي جدا……………………………………………78 3-7-2 کلاس برآوردگرهاي جدا بر اساس برآورد مقدار بهينه……………………………………….84 3-7-3 مقايسه کلاس برآورد گرهاي جدا و برآوردگر معمولي y ?_ds……………………………….87
فصل چهارم: مقايسه طرح نمونه گيري مضاعف براي طبقه بندي با طرح نمونه گيري
مضاعف (طبقه بندي نشده)
4-1 مقدمه…………………………………………………………………………………………………………………………..89 4-2 يک کلاس از برآوردگرها براي ميانگين جامعه در طرح نمونه گيري مضاعف
طبقه بندي نشده (USDS) با استفاده از يک متغير کمکي………………………………………90 4-2-1 آماره هاي نمونه اي……………………………………………………………………………………………..90 4-2-2 کلاس برآوردگرهاي ميانگين جامعه بر اساس برآورد مقدار بهينه…………………….92 4-3 مقايسه دو کلاس برآوردگرهاي مرکب و جدا در طرح نمونه گيري DSS با کلاس
برآوردگرها در طرح نمونه گيري USDS با استفاده از يک متغير کمکي……………………93 4-4 يک کلاس از برآوردگرهاي ميانگين جامعه در نمونه گيري مضاعف طبقه بندي نشده
(USDS) با استفاده از اطلاعات کمکي چند متغيره……………………………………………………..96 4-5 مقايسه کلاس برآوردگرهاي مرکب در طرح نمونه گيري DSS و کلاس برآوردگرها در
طرح نمونه گيري USDS با استفاده از اطلاعات کمکي چند متغيره………………………..103
فصل پنجم: مثال کاربردي و نتيجه گيري
5-1 مقدمه…………………………………………………………………………………………………………………………106 5-2 معرفي و نحوه جمع آوري داده ها…………………………………………………………………………….107 5-3 کارايي نمونه گيري مضاعف براي طبقه بندي………………………………………………………….112
پيوست (برنامه هاي نرم افزاري)……………………………………………………………………115 واژه نامه فارسي به انگليسي………………………………………………………………………….127واژه نامه انگليسي به فارسي………………………………………………………………………….130فهرست منابع………………………………………………………………………………………………132
فهرست جدول ها
عنوان و شماره صفحه
جدول 5-1 : حجم نمونه در هر يک از طبقات در دو فاز از نمونه گيري مضاعف براي
طبقه بندي……………………………………………………………………………………………………………108جدول 5-2 : آماره هاي توصيفي……………………………………………………………………………………………109جدول 5-3 : ضريب همبستگي پيرسون……………………………………………………………………………….110جدول 5-4 : مقايسه برآوردگرها بر اساس ميزان کارايي آن ها…………………………………………….113

فهرست شکل ها
عنوان و شماره صفحه
شکل 1-1 نمونه گيري تصادفي ساده به اندازه 40 از جامعه 400 واحدي……………………..13شکل 1-2 نمونه گيري تصادفي طبقه اي………………………………………………………………………………15شکل 1-3 نمونه گيري مضاعف………………………………………………………………………………………………17نمودار 5-1 نمودارهاي پراکنش ضريب همبستگي ميان متغير مورد مطالعه و متغيرهاي کمکي………………………………………………………………………………………………………………………………………111نمودار 5-2 ميزان کارايي برآوردگرها…………………………………………………………………………………..114

فهرست نشانه هاي اختصاري
SRS = Simple Random Sampling
SRSWR = Simple Random Sampling With Replacement
SRSWOR = Simple Random Sampling With Out Replacement
DSS = Double Sampling for Stratification
USDS = Un-Stratified Double Sampling
Deff = Design effect
RE = Relative Efficeincy

فصل 1
مباحث مقدماتي
1-1 مقدمه
يکي از توانايي هاي علم آمار تحليل موضوعاتي با اطلاعات عددي انبوه مي باشد. در واقع در هر بررسي آماري مراحل جمع آوري، پاک سازي، تلخيص و تحليل داده ها و نتيجه گيري مورد توجه قرار مي گيرد. مرحله ي جمع آوري داده ها به عنوان زير بناي بررسي هاي آماري داراي اهميت ويژه اي مي باشد، زيرا در صورت وجود نقصي در اين مرحله از ارزش و اعتبار کل پژوهش کاسته مي شود. يک جامعه متناهي در نظر بگيريد. جمع آوري اطلاعات عددي از اين جامعه با استفاده از دو روش سرشماري و نمونه گيري امکان پذير است، در صورتي که در جوامع نامتناهي سرشماري امکان پذير نمي باشد و بايد تنها از روش نمونه گيري استفاده کرد. هدف از انواع روش هاي نمونه گيري، تهيه ي اطلاعاتي از جامعه با مطالعه ي بخشي از آن به نام نمونه است. در واقع نمونه گيري، فرايند انتخاب واحدها از جامعه مي باشد به طوري که به کمک آن ها بتوان از جامعه کسب اطلاع کرد. بنابراين يکي از مسائل مهم در نمونه گيري، تطابق نمونه با کل جامعه است.
در حالت کلي براي نمونه گيري، دو روش نمونه گيري احتمالي و غيراحتمالي معرفي
مي گردد. در نمونه گيري احتمالي1 که اولين بار توسط دمينگ2 ]7[ در سال 1950 مطرح شده است، هر واحد نمونه با احتمالي مشخص از جامعه استخراج مي شود. کاربرد گسترده ي اين روش امروزه به گونه اي است که اين روش جايگزين نمونه گيري غير احتمالي شده است.همچنين در بسياري از نمونه گيري ها، در حين جمع آوري اطلاعات مربوط به متغير مورد مطالعه و يا قبل از آن، ممکن است اطلاعاتي درباره متغير يا متغيرهاي ديگري که با متغير مورد مطالعه همبستگي دارند موجود باشد که به اين نوع اطلاعات، اطلاعات کمکي گفته مي شود. از اطلاعات کمکي در مرحله ي برآورديابي و در طرح نمونه گيري مي توان استفاده کرد.
راه دست يابي به اطلاعات کمکي مفيد از منابع متعدد مي باشد و اغلب اين اطلاعات در جوامع متناهي باعث افزايش دقت برآوردگرها مي شود. الکلين3 ]18[ در سال 1958، رائو4 ]21[ در سال 1967، سينگ5 ]37[ در سال 1967، جان6 ]13[ در سال 1969، سريواستاوا7 ]40[ در سال 1971 و ويشواکارما و همکاران8 ]49[ در سال 2012 در مطالعات خود از اطلاعات کمکي به طور گسترده استفاده کرده اند.
در اين فصل، در بخش (1-2) به بيان تعاريف و مفاهيم پايه اي در نمونه گيري که شامل جامعه متناهي، نمونه، طرح نمونه گيري و… است، پرداخته و سپس در بخش (1-3) انواع
طرح هاي نمونه گيري را تعريف مي کنيم.
1-2 تعاريف و مفاهيم پايه اي
در مباحث نمونه گيري داشتن تعاريف دقيق و درست از مفاهيمي هم چون جامعه، نمونه، طرح نمونه گيري و… از ضروري مي باشد. از اين رو در اين فصل به بيان تعاريف پايه اي و برخي نماد ها که در فصل هاي بعدي رساله مورد استفاده قرار خواهند گرفت، مي پردازيم. نماد ها به صورتي در نظر گرفته شده که در اغلب متون نمونه گيري مورد استفاده قرار گرفته است. عمده مطالب اين بخش مبتني بر مراجع کاکران ]4[ و عميدي ]52[ است.
جامعه ي متناهي 9 : يک جامعه ي متناهي از مجموعه اي مشتمل بر تعداد متناهي عناصر متمايز تشکيل شده است. مقدارN ، اندازه ي جامعه ناميده مي شود. يک جامعه ي متناهي U را به صورت زير نمايش مي دهيم:
U={u_1,…,u_k,…,u_N }
طرح نمونه‌گيري10 : با در نظر گرفتن يك طرح نمونه‌اي معين مي‌توان احتمال انتخاب يك نمونه دلخواه مانند s را بيان نمود. اين احتمال را با نماد p(s) نمايش خواهيم داد. حال با فرض اين كه تابع p(.) به‌گونه‌اي وجود دارد كه p(s) احتمال انتخاب s را تحت فرض استفاده از طرح مورد نظر به ‌دست دهد، تابع p(.) طرح نمونه‌گيري ناميده مي‌شود. هر نمونه s بر اساس هر طرح نمونه‌گيري مفروض p(.) را مي‌توان به عنوان مشاهده‌اي از متغير تصادفي مجموعه- مقدار S كه توزيع احتمال آن بوسيله تابع p(.) بيان مي‌شود، مورد توجه قرار داد. اگر ? را معرف تمام نمونه‌هاي ممكن s در نظر بگيريم، در اين صورت با در نظر گرفتن زير مجموعه‌هاي تهي و U، ? مجموعه‌اي شامل N2 زير مجموعه با اندازه‌هاي متفاوت از U خواهد بود. لذا براي هر s?? داريم:
P(S=s)=p(s) .از آنجا كه p(s) يك توزيع احتمال بر روي ? است، داريم:
p(s)?0، براي هر s??
?_(s??)??p(s)=1?
نمونه 11 : عناصري از جامعه كه مشخصات آن‌ها‌ اندازه‌گيري مي‌شود، تشكيل يك نمونه مي‌دهند. در واقع يك نمونه، زيرمجموعه‌اي از جامعة U است كه طبق برنامة خاصي به ‌دست مي‌آيد. اين زيرمجموعه به طور معمول با s نمايش داده شده و n(s) تعداد عناصر نمونه s است. در بسياري از مواقع نمونه‌هايي را در نظر مي‌گيريم كه با استفاده از يك طرح نمونه‌گيري احتمالي تحقق مي‌يابند. دو تعريف براي اصطلاح نمونه وجود دارد كه در اكثر مواقع مورد استفاده قرار مي‌گيرند:
الف- نمونه ي با جايگذاري: دنباله‌اي متناهي به صورت{k_1,…,k_(n(s)) }، كه براي هر n(s) داشته باشيم( k_i?U : i=1,2,…)، در اين حالت واحدهاي انتخاب شده الزاماً متفاوت نيستند. در اين روش انتخاب هر واحد از انتخاب واحدهاي ديگر مستقل است.
ب- نمونه ‌ي بدون جايگذاري: مثل حالت قبل زير مجموعه‌اي غير تهي از U شامل n عنصراست. در اين حالت واحدهاي انتخاب شده الزاماً مجزا مي‌باشند. در واقع در اين روش به صورت تصادفي يک واحد انتخاب شده سپس بدون برگرداندن اين واحد به جامعه به تصادف واحد دوم انتخاب مي شود و اين فرايند تا انتخاب n واحد نمونه ادامه مي يابد.
حجم نمونه يا اندازه نمونه كه با n(s) نشان داده مي‌شود، برابر با تعداد اعضاي s است. مقدار n(s) براي تمام نمونه‌هاي ممكن الزاماً برابر نيست. چنان چه طرح نمونه‌گيري به‌گونه‌اي باشد كه حجم نمونه قبل از پيمايش معلوم و برابر با عدد ثابتي باشد، آن را طرح با حجم ثابت گوييم. در اين حالات تمام نمونه‌هاي ممكن داراي حجم يكسان بوده و براي سادگي از نماد n براي معرفي حجم نمونه استفاده خواهيم نمود.
نشانگر عضويت نمونه 12: براي هر عنصر جامعه و هر طرح نمونه‌گيري مشخص p(.)، به‌صورت يك پيشامد تصادفي دو وضعيتي كه انتخاب يا عدم انتخاب عنصر مزبور در نمونه s را نشان مي‌دهد، تعريف مي‌شود. مقدار اين تابع براي عنصر k- ام با I_K نشان داده مي‌شود و داريم:
I_K={?(1 ، باشد s درون ام k عنصر اگر @0 ، صورت اين غير در )?
توجه كنيد كه I_K=I_K (S) تابعي از متغير تصادفي S است. براي طرح‌هاي با حجم ثابت n از جامعه‌اي به حجم N داريم:
?_(k=1)^N??I_K=n? .
متغير مورد مطالعه13 : معمولاً هدف از يك تحقيق، بررسي صفت )هايي( خاص از جامعه است. به اين صفت، متغير مورد مطالعه گفته شده و معمولاً متغير مورد مطالعه با y و مقدار آن براي k- امين عنصر جامعه با y_k نشان داده مي شود.
متغير کمکي14 : متغير x را يک متغير کمکي گوييم هرگاه با متغير مورد مطالعه y در ارتباط باشد و بتوان با استفاده از x استنتاج هاي دقيق تري در مورد y انجام داد.
اطلاعات کمکي 15: به مجموعه اي از يک يا چند متغير کمکي که با متغير مورد مطالعه y در ارتباط باشند اطلاعات کمکي گويند هر گاه از اين اطلاعات بتوان در مرحله برآورد و طرح نمونه گيري استفاده کرد. به عنوان مثال اگر متغير مورد مطالعه حجم تنه ي درختي از ناحيه اي از جنگل باشد، آن گاه قطر تنه ي درخت و برآورد چشمي از حجم درخت مي تواند به عنوان اطلاعات کمکي در نظر گرفته شود.
پارامتر جامعه متناهي : به هر تابع حقيقي از مقادير (y_1,y_2,…,y_N) يک پارامتر گويند.
? به عنوان نماد عمومي يك پارامتر معرفي مي شود. پارامترهاي مهم جامعه كه در اين رساله مورد توجه قرار مي‌گيرند، عبارتند از:
ميانگين جامعه
واريانس جامعه?=y ?_U=?_U?y_k?N ,
?=S_yU^2=?_U??(y_k-y ?_U)?^2?N-1 .

لازم به ذکر است که ?_U?y_k نماد اختصاري براي ?_(k?U)?y_k است. به ‌منظور برآورد پارامترها، به جاي مشاهده ي مقادير متغير y در مورد تمام عناصر جامعه، مقادير y_k را براي زير مجموعه‌اي از U مشاهده مي كنيم. در ابتدا يك نمونه انتخاب شده و سپس مقدار y_k براي عضو k-ام درون نمونه مشاهده و در نهايت از اين مجموعه ي محدود از مقادير y_k ها به‌ منظور
محاسبه ي برآوردهايي از پارامترهاي مورد نظر استفاده مي‌شود.
برآوردگر16 : يك برآوردگر مانند ? ?=?(s,y) به‌صورت آماره‌اي حقيقي – مقدار از مقادير y است که براي تخمين پارامتر ? به کار مي رود. اميد رياضي و واريانس برآورد گر ? ? به صورت زير تعريف مي شود :
اميد رياضي ? ? : معيار ميانگين وزني مقادير ممكن ? ?(s) با به ‌كارگيري احتمالات p(s) به عنوان وزن مي‌باشد :
E(? ? )=?_(s??)?p(s) ? ?(s) .
واريانس ? ? : ميزان پراكندگي برآوردگر ? ? حول ميانگين آن را نشان مي‌دهد:
Var(? ? )=?_(s??)?p(s) ?( ? ?(s)-E(? ? ) )?^2=E(? ?^2 (s))-E^2 (? ?(s)) .

براي انتخاب يك برآوردگر از بين برآوردگرهاي رقيب، شاخص هاي سنجشي جهت مطلوبيت وجود داردكه در ميان آن ها شاخص نااريبي و كمترين مجموع مربعات خطا داراي اهميت ويژه‌اي هستند.
نا اريبي17 : فرض کنيد p(s) يک طرح نمونه گيري تعريف شده روي فضاي ? باشد. برآوردگر ? ? براي ? نااريب ناميده مي‌شود، هر گاه:
E(? ? )=? ,
و اريبي به‌صورت زير تعريف مي‌شود:
B(? ? )=E(? ? )-? .
وقتي B(? ? ) مثبت (منفي) باشد، گوييم ? ? پارامتر ? را فرابرآورد (دون برآورد) مي کند.
ميانگين توان دوم خطا 18? ? : معياري که به طور معمول براي ارزيابي دقت يک برآوردگر مورد استفاده قرار مي گيرد، ميانگين توان دوم خطا بوده و به‌ صورت زير بيان مي‌شود:
MSE(? ? )=E(? ?-?)^2=?_(s??)?p(s) ?( ? ?(s)-? )?^2 .
مي توان نشان داد که ميانگين توان دوم خطا برابر است با :
MSE(? ? )=Var(? ? )+(B(? ? ))^2 .

اگر ? ? براي ? نااريب باشد، مي‌توان نتيجه گرفت كه:
MSE(? ? )=Var(? ? ) .
اغلب برآوردگرهاي مهم در نمونه‌گيري، نااريب و يا نااريب مجانبي‌هستند. خاصيت يك برآوردگر نااريب مجانبي‌ آن است كه اريبي آن به ‌ازاي نمونه‌هاي بزرگ ناچيز مي باشد. اكثر برآوردگرهاي نااريب مجانبي‌ كه در نظر مي‌گيريم، حتي در نمونه‌هاي با حجم متوسط نيز مقدار اريبي واقعاً كوچكي دارند. حال از بين برآوردگرهاي نااريب مجانبي، برآوردگري با كوچكترين واريانس را به عنوان بهترين برآوردگر انتخاب مي‌كنيم.
خطاي استاندارد 19? ? : جذر واريانس برآوردگر ? ?، يعني ?(Var(? ? ) )، خطاي استاندارد اين برآوردگر ناميده مي شود.
خطاي استاندارد نسبي يا ضريب تغييرات20 : نسبت خطاي استاندارد برآوردگر به مقدار مورد انتظار آن است که به آن خطاي استاندارد نسبي يا ضريب تغييرات گفته شده و به صورت زير بدست مي آيد:
CV(? ? )=?(Var(? ? ) )/E(? ? ) .
کارايي 21 : فرض کنيد براي برآورد پارامتر ? بر اساس طرح نمونه گيري p(s) دو برآوردگر متفاوت? ?_1 و ? ?_2 وجود داشته باشد کارايي برآوردگر ? ?_2 نسبت به ? ?_1 به صورت زير بيان
مي شود:
e(? ?_2, ? ?_1 )=MSE(? ?_1 )/MSE(? ?_2 ) ,
به عبارت ديگر اصطلاح کارايي همان ميزان مطلوبيت دو برآوردگر نسبت به يکديگر است.در صورتي که اين معيار در بازه ي (1و0) قرار گيرد برآوردگر ? ?_1 کاراتر از برآوردگر ? ?_2 است و اگر اين معيار از يک بزرگ تر بدست آيد بيان گر اين است که کارايي برآوردگر ? ?_2 بيشتر است.
اثر طرح 22: براي آن كه بتوان از بين روش‌ها يا طرح‌هاي نمونه‌گيري رقيب، بهترين آن‌ها را انتخاب کرد، لازم است بُعد مسأله را به يك نوع برآوردگر محدود نمود. در اين صورت
مي توان از بين طرح‌هاي پيش رو، بهترين آن‌ها را با توجه به معيارهاي مناسب فرض ‌شده انتخاب نمود. اثر طرح يک شاخص جهت سنجش اثر طرح هاي نمونه گيري بر انحراف استاندارد آماره هاي پيچيده است که توسط کيش23 معرفي شده و با نماد deff (p,? ?) نمايش داده مي شود. واريانس برآوردگر ? ? تحت اين طرح به صورت ?Var?_p (? ?) و تحت نمونه‌گيري تصادفي سادة با جايگذاري ( اين روش نمونه گيري بعدا معرفي مي شود) با ?Var?_srs (? ?) نشان داده شود، آن گاه اثر طرح p(s) براي ? ? با عبارت زير سنجيده مي شود:
deff(p, ? ? )=(?Var?_p (? ? ))/(?Var?_srs (? ? ) ) .
توجه كنيد كه زيرنويس هر يك از واريانس‌ها معرف طرح مورد استفاده مي باشد.
مقايسة بين دو طرح p و تصادفي ساده به‌صورت زير بيان مي شود:
deff(p, ? ? ){?(<1 .است كاراتر ساده تصادفي طرح@=1 . است يکسان طرح دو کارايي@>1 .است كاراتر p طرح )?
به عبارتي ديگر وقتي‌كه deff(p, ? ? ) بزرگتر از يك باشد، استفاده از طرح p مناسب تر است.
مرتبه همگرايي24 : مرتبه همگرايي را مي توان به دو دسته ي عمده، مرتبه کوچکي و مرتبه بزرگي تقسيم بندي کرد:
مرتبه کوچکي : اين مرتبه همگرايي را به طور معمول به صورت o نمايش مي دهند. طبق تعريف، a_n از مرتبه کوچکي b_n ناميده مي شود هر گاه براي هر ?>0 عدد صحيحي مانند n_? يافت شود، به طوري که :
اگر n>n_? ، آن گاه : |a_n |<?|b_n | اين تعريف را به طور مختصر با نماد a_n=o(b_n) نمايش مي دهيم.
همچنين a_n را از مرتبه کوچکي احتمال b_n ناميده و به طور مختصر با نماد a_n=o_p (b_n) نمايش مي دهند، هر گاه براي هر?>0 :
وقتي که n?? آن گاه P(|a_n |<?|b_n |)?1 .
مرتبه بزرگي : اين مرتبه همگرايي را به طور معمول به صورت O نمايش مي دهند. طبق تعريف a_n از مرتبه بزرگي b_n ناميده مي شود، هر گاه مقادير حقيقي ? و n_? صحيح وجود داشته باشد به طوري که:
اگر n>n_? ، آن گاه : |a_n |<?|b_n | و به طور مختصر آن را با نماد a_n=O(b_n) نمايش
مي دهيم.
همچنين a_n را از مرتبه بزرگي احتمال b_n ناميده و به طور مختصر با نماد a_n=O_p (b_n) نمايش مي دهند، هر گاه براي هر?>0 ، ثابتي مانند ? و عدد صحيح n_? وجود داشته باشند به طوري که:
وقتي که n>n_? آن گاه P(|a_n |<?|b_n |?1-?) .

در نمونه گيري از جامعه متناهي براي بررسي همگرايي برآوردگر? ? ، از تفاضل ? ?-? به عنوان a_n استفاده مي شود و اغلب b_n مقادير n^(-1) يا n^(-1?2) را اختيار مي کند.
1-3 طرح هاي نمونه گيري
در اين بخش به معرفي مختصري از طرح هاي نمونه گيري معروف که در فصل هاي بعدي مورد استفاده قرار مي گيرند مي پردازيم. عمده مطالب اين بخش مبتني بر مراجع عميدي ]52[، کاکران ]4[، سوخاتمه ]44[ و تامپسون ]45[ است.
طرح نمونه گيري تصادفي ساده 25
طرح نمونه‌گيري تصادفي ساده يكي از ساده‌ترين و مهم ترين طرح‌هاي نمونه‌گيري محسوب مي‌شود. به ‌طور معمول از اين طرح به عنوان شكل اساسي نمونه‌گيري احتمالي در مواردي كه هيچ گونه اطلاعات كمكي از ساختار جامعه در دست نيست، استفاده مي‌شود. اگردر انتخاب يک نمونه n تايي از جامعه N تايي، تمام نمونه هاي ممکن هم شانس باشند بنا به تعريف يک نمونه تصادفي ساده داريم. احتمال انتخاب هر يك از عناصر جامعه بر اساس اين طرح يكسان بوده و اين نمونه‌گيري با حجم ثابت معمولاً به دو صورت بدون جايگذاري و باجايگذاري انجام مي‌شود.
برآوردگر نااريب براي ميانگين كل جامعه به صورت زير معرفي خواهد شد که از اين برآوردگر معمولا به عنوان يك برآوردگر ميانگين معمولي ياد مي‌شود:
y ?_s=1/n ?_(k?s)?y_k .واريانس اين برآوردگر برابر است با :
Var(y ?_s )=((N-n)/(N-1)) ?^2/n .
که در آن ضريب ((N-n)/(N-1)) را معمولاً ضريب كاهش در نمونه‌گيري بدون جايگذاري مي‌نامند. همچنين كسر f=n/N كسر نمونه‌گيري و -f1 ضريب تصحيح نمونه‌گيري بدون جايگذاري ناميده مي شود.
معمولاً در جامعه‌هاي بسيار بزرگ، كه حجم نمونه در مقايسه با حجم جامعه ناچيز است، مي‌توان از كسر نمونه‌گيري چشم ‌پوشي كرد.
براي درک بهتر طرح نمونه گيري تصادفي ساده به شکل زير توجه نماييد. در اين شکل جامعه ي مورد نظر براي نمونه گيري تصادفي ساده به 400 واحد مربع شکل تقسيم شده و يک نمونه تصادفي شامل 40 واحد از آن انتخاب شده است.
شکل 1-1 نمونه گيري تصادفي ساده به اندازه 40 از جامعه 400 واحدي
طرح نمونه گيري طبقه اي26
در برخي مواقع جامعه به زيرجامعه هايي ناهم پوشا تقسيم مي شود . اصطلاح ناهم پوشا بر اين مطلب دلالت دارد كه هر عنصر جامعه تنها و تنها درون يكي از زيرجامعه ها قرار دارد. هريك از اين زير جامعه ها يك طبقه ناميده مي شود. چنانچه يك نمونه ي احتمالي درون هر طبقه انتخاب شود، به طوري كه انتخاب ها بين طبقات، مستقل از يكديگر باشند، آن گاه نمونه ي به دست آمده را يك نمونه ي طبقه اي و طرح مولد آن را يك طرح نمونه گيري طبقه اي مي نامند. نمونه گيري طبقه اي روشي قدرتمند و انعطاف پذيراست كه به شكل گسترده مورد استفاده قرار مي گيرد.
براي درک بهتر طرح نمونه گيري تصادفي طبقه اي به شکل 1-2 توجه نماييد. در اين شکل جامعه ي مورد نظر که شامل 4 طبقه است براي نمونه گيري طبقه اي به 400 واحد مربع شکل تقسيم شده است. حجم طبقه اول 200 واحد مربع شکل، حجم طبقه دوم 100 واحد مربع شکل و حجم طبقات سوم وچهارم هر کدام 50 واحد مربع شکل در نظر گرفته شده است. يک نمونه تصادفي شامل 40 واحد از بين طبقات اين جامعه به صورت تصادفي ساده بدون جايگذاري انتخاب شده است. در واقع از طبقه اول نمونه اي به حجم 20 واحد مربع شکل تيره، از طبقه دوم نمونه اي به حجم 10 واحد مربع شکل تيره و از هر يک از طبقات سوم و چهارم نمونه اي به حجم 5 واحد مربع شکل تيره انتخاب شده است. بر اين اساس مجموعه واحدهاي مربع شکل تيره نمونه ي انتخابي از اين جامعه است.
شکل 1-2 نمونه گيري تصادفي طبقه اي
1-3-1 طبقه بندي پسين27 (طبقه بندي پس از نمونه گيري)
در برخي مواقع که نمونه ي احتمالي بر اساس يك طرح نمونه گيري تصادفي ساده صورت
مي پذيرد، مي توان در مرحله برآورد از روش هاي مربوط به نمونه گيري تصادفي طبقه اي استفاده نمود. اين استراتژي كه از طرح نمونه گيري تصادفي ساده، و برآورد طبقه اي تشكيل شده است را طبقه بندي پس از نمونه گيري، يا طبقه بندي پسين مي نامند. كارآيي اين استراتژي در مقايسه با استراتژي طرح نمونه گيري تصادفي طبقه اي و برآورد متناظر آن چندان كم نيست .براي استفاده از روش طبقه بندي پسين لازم است به همراه متغير مورد مطالعه، متغير طبقه اي هر واحد نمونه نيز اندازه گيري و ثبت شده باشد، همچنين حجم كل طبقات جامعه نيز معلوم باشد.
طرح نمونه گيري مضاعف 28
درشرايطي که هزينه ي جمع آوري اطلاعات در مورد متغير کمکي به مراتب کم تر از هزينه ي جمع آوري اطلاعات در مورد متغير مورد مطالعه باشد، طرح نمونه گيري مضاعف مورد استفاده قرار مي گيرد. اگر ميانگين جامعه ي کمکي يعني X ?_N نامعلوم باشد نمي توانيم از روش برآورد نسبتي استفاده کنيم. در چنين وضعيتي از طرح نمونه گيري مضاعف يا طرح نمونه گيري دو فازي 29 استفاده مي شود. در اين طرح ابتدا در فاز اول، نمونه اي اوليه به روش تصادفي ساده با حجم n^’ از جامعه ي متغيرهاي کمکي X گرفته مي شود. در فاز دوم، از نمونه ي اوليه زير نمونه اي به حجم n به تصادف از نمونه ي کمکي X ها گرفته و سپس واحدهاي متناظر آن ها از متغير مورد مطالعه y انتخاب مي شود. اگر در اين طرح، زير نمونه در فاز دوم به صورت نمونه گيري تصادفي ساده بدون جايگذاري انتخاب گردد، اين طرح، طرح نمونه گيري مضاعف طبقه بندي نشده30 ناميده مي شود.
براي درک بهتر طرح نمونه گيري مضاعف به شکل 1-3 توجه نماييد. در اين شکل در ابتدا جامعه ي مورد نظر براي نمونه گيري مضاعف به 400 واحد مربع شکل تقسيم شده است. در فاز اول يک نمونه اوليه ي تصادفي از متغير کمکي شامل 60 واحد مربع شکل از اين جامعه به صورت تصادفي ساده گرفته مي شود و در فاز دوم از اين نمونه اوليه زير نمونه اي به حجم 20 واحد مربع شکل تيره بر اساس متغير کمکي و مقادير متناظر متغير مورد مطالعه انتخاب شده است.
شکل 1-3 نمونه گيري مضاعف
طرح نمونه گيري مضاعف براي طبقه بندي 31
درشرايطي که مي خواهيم جامعه به زير جامعه هايي (طبقات مختلف) تقسيم شود اما وزن طبقات W_h=N_h/N , ( h=1,2,…,L ) قبل از شروع نمونه گيري مقادير معلومي ندارند، طرح نمونه گيري مضاعف براي طبقه بندي مي تواند ايده ي مناسبي باشد؛ اين طرح براي اولين بار توسط نيمن32 ]17[ در سال 1938 معرفي شده است. ايده اصلي طرح نمونه گيري مضاعف براي طبقه بندي اين است که ابتدا در فاز اول يک نمونه ي اوليه بزرگ از متغيرهاي کمکي گرفته مي شود و بر اين اساس طبقات بدست مي آيند. در فاز دوم، براي جمع آوري اطلاعات در مورد متغير مورد مطالعه نمونه اي کوچک تر در اين طبقات گرفته مي شود.
از کاربردهاي ديگر اين طرح نمونه گيري، پايين آوردن اريبي ناشي از بي پاسخي 33 است. در واقع، در نمونه گيري مضاعف لازم است ابتدا به جمع آوري داده هاي اوليه (مثلاً پرسشنام? پستي) بپردازيم، به دنبال آن، گروه بندي عناصر در دو طبقه صورت گرفته (مانند پاسخگويان به پرسشنام? پستي و بي پاسخ ها ) و سپس نمونه اي از افراد در يکي از طبقه ها انتخاب
مي شود (مانند بي پاسخ هاي پرسشنام? پستي ) و برآوردگر نهايي، به صورت ترکيبي موزون از برآوردگرهاي هر يک از دو طبقه بدست مي آيد.
فصل 2
طرح نمونه گيري مضاعف براي طبقه بندي
با استفاده ازيک اطلاع کمکي
2-1 مقدمه
از پيشرفت هاي عمده اي که اخيرا در بررسي هاي نمونه اي به چشم مي خورد، استفاده از صفت کمکي x است که در ارتباط با متغير مورد مطالعه y مي باشد. استفاده از متغير کمکي x در روش هاي مختلف برآورديابي باعث افزايش دقت مي شود. براي مثال در برآوردهاي نسبتي و رگرسيوني نياز به کسب اطلاعاتي در مورد ميانگين جامعه ي متغير کمکي x داريم. وقتي ميانگين جامعه ي متغير کمکي x معلوم باشد از يک نمونه گيري تصادفي ساده بدون جايگذاري و وقتي ميانگين جامعه ي متغير کمکي x مجهول باشد از روش نمونه گيري مضاعف استفاده مي شود. به عبارت ديگر ميانگين جامعه ي متغير کمکي x از يک نمونه اوليه با حجم زياد برآورد مي شود به طوري که مشخصه ي کمکي x از پيش معلوم باشد و مقدار X ? توسط مقدار برآورد آن جايگزين مي شود. در اين روش مقادير x به آساني در دسترس است و جمع آوري آن ها نسبت به مقادير y هزينه کم تري دارد.
از جمله طرح هاي نمونه گيري که در عمل کاربرد گسترده اي دارد، طرح نمونه گيري طبقه اي است. اين طرح زماني کاربرد دارد که جامعه به چند بخش يا ناحيه افراز شده باشد که هر کدام از اين بخش ها يک طبقه را مشخص مي کند. از نتايج موثر طبقه بندي جامعه افزايش دقت در مرحله ي برآورد مي باشد. علاوه بر اين استنباط روي هر زير جامعه ي دلخواه از جامعه بر اساس طرح نمونه گيري طبقه اي ميسر خواهد شد. چنانچه براي طبقه بندي کردن جامعه بر اساس يک متغير موثر، تا قبل از انتخاب نمونه نتوان طبقه ي مربوط به يک واحد مشخص از جامعه را تعيين نمود يا در برخي از موارد که انتخاب يک متغير به عنوان طبقه بندي پس از جمع آوري اطلاعات انجام مي پذيرد، نمونه گيري طبقه اي پسين پيشنهاد مي گردد. يکي از طرح هاي نمونه گيري که براي طبقه بندي کردن مناسب مي باشد، طرح نمونه گيري مضاعف است. در صورتي که حجم طبقات يا وزن آن ها نامعلوم باشد يا در واقع اطلاعات از متغيري که براساس آن طبقات تعيين مي شوند به آساني در دسترس نباشد و يا با گذشت زمان برخي از طبقات اطلاعات از دست داده و نياز به بروز کردن نمونه داشته باشند مي توان از اين طرح استفاده کرد. طرح نمونه گيري مضاعف براي طبقه بندي، در جنگل و منابع موجود در اکوسيستم هاي جنگلي کاربرد گسترده اي دارد. تئوري نمونه گيري مضاعف يا نمونه گيري دو فازي براي اولين بار توسط نيمن ]17[ در سال 1938 معرفي شد. پس از آن رائو34 ]20[ در سال 1973 از اين طرح نمونه گيري در بررسي بي پاسخي ها و مقايسه هاي تحليلي استفاده کرد. کاکران 35 ]4[ در سال 1977 نيز برخي از نتايج اساسي طرح نمونه گيري مضاعف را در کتاب خود ارائه کرده است. ايگ و همکاران36 ]11[ در سال 1987 به ارائه برآوردگرهاي مطلوب بر اساس طرح نمونه گيري مضاعف براي طبقه بندي با استفاده از اطلاعات کمکي در فاز اول و فاز دوم پرداخته اند. همچنين سينگ و همکاران 37 ]32[ در سال 2007 کلاس بزرگي از برآوردگرهاي ميانگين جامعه را بر اساس اين طرح نمونه گيري و بر اساس يک متغير کمکي بدست آورده اند.
تعريف 2 . 1. نمونه گيري مضاعف براي طبقه بندي
طرح نمونه گيري مضاعف براي طبقه بندي در دو فاز صورت مي گيرد. در فاز اول يک



قیمت: تومان


پاسخ دهید