سنجش و اندازه گیری

دیدگاه و رویکرد پژوهش بین رشته‏ ای

نمونه سوالات آمار توصیفی و استنباطی

نمونه سوالات آمار توصیفی و استنباطی 

http://population-studies.blogfa.com/cat-2.aspx


برچسب‌ها: نمونه سوالات آمار توصیفی و استنباطی
+ نوشته شده در  دوشنبه 20 مرداد1393ساعت   توسط محمد حسین ضرغامی  | 

آمار توصیفی و استنباطی در یک نگاه کلی

روش ها و تکنیک های مختلف آماری به پژوهشگر امکان می دهند تا با کاووش در داده ها به دانش مورد نیاز دست یابد. علم آمار با بهره گیری از قضایای منطقی و اصول موضوعه ی صحیح در مورد یک دسته از داده ها بر اساس فرض هایی که توسط پژوهشگر تدوین می شود، با در نظر گرفتن مقدار خطا به تلخیص داده ها می پردازد و به پژوهشگر در تصمیم گیری های خود یاری می رساند. زمانی که تکنیک ها و فنون آماری به منظور توصیف و تشریح داده های مشاهده شده، بکار گرفته می شود با وظیفه ای از علم آمار که آمار توصیفی خوانده می شود. توصیف شرایط موجود و دیداری کردن نتایج علاوه بر این که می تواند در نتیجه گیری به پژوهشگر کمک کند تا ظرفیت ها و ضعف های خود را بشناسد، می تواند به ذهن های خلاق در فرضیه بندی های جدید ياري رساند. زمانی که پژوهشگر در نظر دارد نتایج بدست آمده از نمونه را به جامعه بسط دهد، بخشی از آمار درگیر این مهم است که آمار استنباطی خوانده می شود. بنابراین اهمیت هر کدام از انواع آمار در تحلیل داده ها و استنباط نتایج وابسته به اهداف پژوهشگر است و این دو مانند پلی عمل می کنند که دیتا را به دانش تبدیل می نمایند.


برچسب‌ها: آمار توصیفی و استنباطی
+ نوشته شده در  چهارشنبه 14 خرداد1393ساعت   توسط محمد حسین ضرغامی  | 

نمودارهای نواری یا strip plot

نمودارهای نواری یا strip plot

این نمودارها از طریق نرم افزار آر (R) قابل ترسیم اند. در این نمودار ها مقادیر به صورت مربع در یک خط راست نشان داده می شوند. برای بررسی همگنی داده ها و سایر کار بردهای دیگر استفاده می شود. این نمودارها برای زمانی که تعداد داده ها کم اند جایگزین نمودار های باکس پلات یا نمودارهای جعبه ای می شوند:

 زمانی که تراکم بالا است، داده ها می توانند از خط خارج شوند و بالا و پاییین قرار بگیرند:

گاهی اوقات داده ها تکراری اند. در این صورت داده های تکراری بالای خط قرار می گیرند:

موارد ذکر شده در بالا در صفحه ی افقی نشان داده می شوند، گاهی لازم است این موارد به صورت عمودی نشان داده شوند:

 

گاهی اوقات لازم است که نمودارها با یکدیگر تلفیق شود. خوشبختانه نرم افزار آر امکانات فراوانی دارد که به منظور تلفیق نمودارهای مختلف استفاده می شود.

 میزان تراکم مربعات در نمودار نواری همخوان با فراوانی در نمودار هیستوگرام است. 

09122263167


برچسب‌ها: نرم افزار آر, ترسیم نمودار, نمودار نواری
+ نوشته شده در  دوشنبه 12 خرداد1393ساعت   توسط محمد حسین ضرغامی  | 

نمونه سوالات آمار و روش تحقیق کارشناسی ارشد

31- در صورتی که بخواهیم نمیرخ روانی جامعه ی معتادین شهر پاکدشت را بدست آوریم، استفاده از کدام شیوه نمونه گیری عملی است؟

1) تصادفی ساده    2) تصادفی سیستماتیک     3) خوشه ای    4) استفاده از نمونه گیری های غیر احتمالی (مانند نمونه گیری گلوله برفی)

32- آزمون خی دو یا کای دو چه زمانی استفاده می شود؟

1) زمانی که هدف مقایسه میانگین نمرات بیشتر از دو گروه است. 

2) زمانی که هدف مقایسه فراوانی های دو گروه یا بیشتر است. 

3) زمانی که هدف بررسی نرمال بودن توزیع است.

4) زمانی که هدف بررسی همگنی واریانس های توزیع است. 

33- فرض صفر مربوط به آزمون تحلیل واریانس یک راهه کدام است ؟

1)             ¯x_1≠¯x_2≠¯x_3    2) ¯x_1=¯x_2=¯x_3                 3) ¯μ_1=¯μ_2=¯μ_3                   4) ¯μ_1≠¯μ_2≠¯μ_3

34- در پژوهش آزمایشی انتخاب، انتصاب و اعمال متغیر آزمایشی بر گروهها به ترتیب ....... است.

1) تصادفی، تصادفی، غیر تصادفی  2) تصادفی، غیر تصادفی، غیر تصادفی   3) تصادفی، غیر تصادفی، تصادفی    4 تصادفی، تصادفی، تصادفی 

35- کدام شاخص با تغیر مقیاس اندازه گیری طول از متر به سانتی متر ثابت می ماند؟

1) میانه           2) واریانس              3) انحراف استاندارد           4) دامنه تغیرات

 36- برای تحلیل داده هایی که به صورت جدول زیر است از چه آزمونی استفاده می شود؟

فاقد پیش آزمون دارای پیش آزمون

¯x_2 ¯x_1 گروه کنترل

¯x_4 ¯x_3 گروه آزمایش


1) تحلیل کوواریانس  2) تحلیل واریانس نمرات وابسته   3) تحلیل واریانس دو راهه یا دو طرفه    4) تحلیل واریانس چند متغیری

37- اگر مفروضات آزمون پارامتری که برای مقایسه ی میانگین های سه گروه مستقل استفاده می شود؛ برقرار نباشد؛ از چه آزمون جایگزینی می توان استفاده کرد؟

1) فریدمن               2)  خی دو                   3) تحلیل واریانس یک راهه                  4) کراسکال والیس

38- پراکندگی کدام توزیع زیر بیشتر است؟

1) توزیع نرمال با درجه ی آزادی 100           2) توزیع t با درجه آزادی 100              3) توزیع نرمال با درجه آزادی 10           4) توزیع t با درجه آزادی 10

39- اگر نتایج مربوط به آزمون افسردگی بک را به دو دسته افسردگی بالا و پایین تقسیم کنیم، با کدام آزمون آماری می توان رابطه بین افسردگی و نمرات معدل را بدست آورد؟ 

1) دو رشته ای                      2) فی                              3) اسپیرمن                              4) تتراکوریک 

40- در صورتی که 3 گروه از سه طبقه مختلف انتخاب شوند و از آزمون تحلیل واریانس یک راهه برای مقایسه بین میانگین بهره هوشی آنها استفاده شود، درجه آزادی کل آزمون چند است؟

1) 2                                         2) 17                                               3) 59                              4) 57

41- در کدام یک از حالات زیر، لازم است حجم نمونه بیشتر باشد؟

1) انتخاب افراد از میان دانش آموزان تیزهوش 2) انتخاب افراد از میان دانش آموزان دارای نواقص شنیداری 3) انتخاب افراد از میان دانش آموزان عادی 4) انتخاب افراد از میان وزرای امور خارجه کشورهای مختلف

42- کدام یک از متغیرهای زیر هدف اصلی مورد مطالعه پژوهشگر می باشد؟

1) متغیر مستقل           2) وابسته                       3) تعدیل کننده                          4) کنترل

43- در رگرسیون، زمانی که تعداد متغیرهای پیش بینی کننده افزایش می یابد، کدام مورد زیر کاهش می یابد؟

1) خطای نوع اول        2) خطای نوع دوم                 3) خطای پیش بینی              4) خطای نوع اول و دوم 

44- مقدار همبستگی پیرسون برای متغیرهای پیوسته  x و y که واریانس آنها به ترتیب برابر 81 و 36 است و مقدار کواریانس بین آنها 27 است برابر .... می باشد.

1) 1                                 2) 0.25                                     3) 0.5                                    4) 0.75

45- کدام شاخص مرکزی برای داده های زیر مناسب تر است؟

13، 14، 14، 14، 15، 10،10، 15، 14، 20، 19،18، 17، 16، 16، 15، 10

1) میانه                             2) میانگین                           3) نما                      4) چارک سوم 

46- ثابت بودن نتایج یک آزمون در موقعیت های مختلف برای افراد نشان دهنده ی کدام ویژگی آزمون است؟

1) روایی (validity)           2) پایایی (reliability)              3) روایی درونی            4) کاربردی بودن آزمون

47- اگر انحراف استاندار یک نمونه 2 برابر و حجم نمونه 4 برابر شود؛ چه تغییری در فاصله ی اطمینان بوجود می آید؟

1) دو برابر می شود                 2) هشت برابر می شود                      3) نصف می شود                     4) تغییری نمی کند. 

48- کدام یک از موارد زیر ویژگی روش علمی نیست؟

1) تکرارپذیری                        2) قابلیت آزمایش                         3) اطمینان از درستی                        4) مراحل مشخص 

49- در فرضیه زیر متغیر کنترل کدام است؟

"رابطه ی بین اعتقاد به خدا و میزان پیشرفت شغلی در مردان معنادار است"

1) جنس                             2) مقدار رابطه                            3) اعتقاد به خدا                                 4) نوع شغل

50- کدام آزمون جزء آزمون های تعقیبی محسوب نمی شود؟

1) LSD فیشر                                2) شفه                                   3) Tukey                                             4) K-S

.............................................................................................................................

31- گزینه (4) صحیح است.

از آنجا که جامعه معتادین نامشخص و بدون شناسنامه می باشند، استفاده از نمونه گیری های احتمالی یا تصادفی میسر نیست. به نمونه گیری گلوله برفی نمونه گیری شبکه ای یا عنکوتی هم گفته می شود. 

32- گزینه (2) صحیح است. 

وقتی قصد داریم فراوانی بین دو یا بیشتر از دو گروه را از لحاظ آماری مقایسه کنیم از آزمون کای دو استفاده می کنیم. 

خطای معیار یا خطای استاندارد برابر حاصل تقسیم انحراف معیار جامعه بر جذر حجم نمونه است. بنابراین داریم:

s_¯x=s/√n=(4/5)/9=/5

33- گزینه (3) صحیح است. 

در نوشتن فرض های آماری حتما باید از حروف یونانی استفاده شود. فرض صفر نشان دهنده ی عدم تفاوت در میانگین جوامع مورد مطالعه است. 

 34- گزینه (4) صحیح است.

35- گزینه (1) صحیح است.

میانه وابسته به مقیاس نیست و با تغیر مقیاس همواره ثابت می ماند. زمانی که داده های متر به سانتی متر تبدیل می شوند در واقع در عدد 100 ضرب می شوند، ضرب یک مجموعه عدد در مقدار ثابت سبب تغیر واریانس، انحراف استاندارد و دامنه تغییرات می شود. 

36- گزینه (3) صحیح است.

مقدار z در سطح 95 درصد اطمینان برابر 96/1 است. بنابراین مقدار z*s_¯x   حدودا برابر 4 خواهد شد. 

37- گزینه (4) صحیح است.

زمانی که مفروضات آزمون تحلیل واریانس یک راهه برقرار نباشد می توان از آزمون ناپارامتری کراسکال والیس استفاده کرد. 

38- گزینه (4) صحیح است.

مقدار درجه ی آزادی در توزیع t روی پراکندگی تاثیر می گذارد. هر چه درجه ی آزادی افزایش یابد شکل توزیع تی  به شکل توزیع نرمال نزدیک تر می شود، یعنی از پراکندگی توزیع تی کاسته می شود. 

39- گزینه (1) صحیح است.

آزمون آماری بین متغیر دو ارزشی (افسردگی بالا و پایین) و متغیر پیوسته، همبستگی دو رشته ای است.  

 40- گزینه (3) صحیح است.

درجه ی آزادی کل در تحلیل واریانس برابر با مجموع درجات آزادی درون گروهی و بین گروهی است. یعنی df=N-1

41- گزینه (3) صحیح است. 

هر چه ناهمگنی افزایش یابد لازم است حجم نمونه نیز افزایش یابد. 

42- گزینه (2) صحیح است.

هدف اصلی پژوهشگر مطالعه متغیر وابسته است.

43- گزینه (3) صحیح است.

خطای پیش بینی اختلاف بین نمرات تجربی از نمراتی است که از طریق معادله رگرسیونی بدست می آید. هر چه متغیرهای پیش بینی کننده مربوط افزایش یابد، این خطا کاهش می یابد.  

44- گزینه (1) صحیح است.

مقدار همبستگی پیرسون حاصل تقسیم کواریانس بین دو متغیر بر حاصلضرب انحراف استاندارد آنها است.

Rxy=27/(6*9)=1 

45- گزینه (2) صحیح است.

مناسب ترین شاخص مرکزی برای داده هایی که دارای پراکندگی نیستند، میانگین است. میانگین مرکز ثقل داده ها را مشخص می کند. 

46) گزینه (2) صحیح است.

ثابت بودن نتایج یک آزمون بیانگر ثبات آزمون است که یکی از شاخص های پایایی به شمار می رود.

47- گزینه (4) صحیح است.

فاصله اطمینان از طریق معادله زیر بدست می آید:

x ̅-z*s_¯x≤μ≤x ̅+z*s_¯x

 در این معادله 

خطای معیار یا خطای استاندارد برابر حاصل تقسیم انحراف معیار جامعه بر جذر حجم نمونه است. بنابراین داریم:

s_¯x=s/√n=2s/√4n=1s_¯x


از آنجا که z ثابت است، مقدار فاصله اطمینان بدون تغیر می ماند.

48- گزینه (3) صحیح است.

نمی توان به درستی نتایج بدست آمده از روش های علمی اطمینان داشت. این روش ها نیز دارای خطا می باشند.  

49- گزینه (1) صحیح است.

متغیر کنترل متغیری است که اثر آن با وارد کردن تنها یکی از طبقات آن از روی رابطه ی بین متغیرهای مستقل و پیش بینی کننده، حذف می شود. در این فرضیه به این دلیل که تنها از مردان استفاده شده است، عملا اثر متغیر جنس حذف شده است.  

50- گزینه (4) صحیح است.

آزمون k-s یا آزمون کولموگروف اسمیرنف در بررسی نرمال بودن داده ها استفاده می شود. 

............................................................................................................................

09122263167












برچسب‌ها: نمونه سوال آمار و روش تحقیق کار شناسی ارشد
+ نوشته شده در  یکشنبه 21 اردیبهشت1393ساعت   توسط محمد حسین ضرغامی  | 

منحنی های تراز (کانتور یا میزان)

به نظر می رسد که منحنی های تراز بتوانند در حوزه ی سنجش و اندازه گیری به منظور بصری سازی یا دیداری سازی مفاهیم روانسنجی، مخصوصا زمانی که بحثهای چند متغیری مورد نظرند به خوبی مورد استفاده قرار گیرند و به نظر می رسد جای تمرکز و تفکر بیشتری داشته باشند. 

منحنی تراز یا منحنی میزان، (به انگلیسی: contour line)‏ در یک نقشهٔ توپوگرافی منحنی است که همهٔ نقاط هم‌ارتفاع زمین را به هم وصل می‌کند. منحنی‌های میزان همدیگر را قطع نمی‌کند و کوچکترین محیط بسته در این نقشه‌ها، بلندترین نقطه و یا پایین‌ترین نقطه می‌باشد.

فواصل عمودی بین خطوط منحنی‌های میزان، همگی یکسان هستند.

قوانین مربوط به منحنی‌های میزان[ویرایش]


قانون ۱: هر خط حدفاصل (خط کنتور) نمایشگر خطوطی است که کاملاٌ هم ارتفاع هستند.

قانون ۲: خطوط حدفاصل هیچ‌گاه با یکدیگر برخورد نمی‌کنند.

قانون ۳: رفتن از یک خط حدفاصل به یک خط حدفاصل بالاتر، نشان دهندهٔ افزایش ارتفاع می‌باشد.

قانون ۴: هر چقدر، خطوط حدفاصل به همدیگر نزدیکتر باشند، شیب زمین تندتر و هر چقدر فاصلهٔ این خطوط با همدیگر بیشتر باشد، شیب زمین ملایم‌تر است.

قانون ۵: تعدادی خطوط حدفاصل بسته، نشانگر یک تپه یا یک کوه می‌باشند، اما اگر این خطوط بسته به صورت هاشور زده باشند، نمایشگر یک حفره بر روی سطح زمین می‌باشند.

قانون ۶: خطوط حدفاصل در یک دره که رودخانه دارد در نقاط سرچشمه رودخانه و بالای تپه به صورت شکل V در می‌آیند.

قانون ۷: بر روی یک قله یا در عمق یک دره با ارتفاع یکسان ممکن است تعدادی از خطوط حدفاصل تکرار شوند. این معمولاٌ در مورد دره‌های هم سطح یا قله اتفاع می‌افتد.

منحی میزان مکان هندسی کلیه نقاطی است که دارای ارتفاع یکسانی باشند. یا بعبارتی دیگر اصول ترسیم منحنی میزان ها به این صورت است که تعدادی صفحات افقی فرضی به فواصل معین ، ناهمواریها ی زمین را قطع کرده و فصل مشترک چنین صفحاتی با ارتفاعات، منحنی های بسته ای ایجاد می کند که به آنها منحنی میزان گفته می شود.

ساده تر اینکه تمام نقاطی که بر روی یک منحنی میزان است همگی از ارتفاع یکسانی برخوردارند و وقتی از یک منحنی به منحنی دیگر در روی نقشه میرسیم، یعنی ارتفاع افزایش یا کاهش یافته است که براحتی از روی اعداد درج شده روی منحنی ها قابل دریافت است.

هیدروگرافی

منحنی میزان اصلی

منحنی هایی هستند که بر روی نقشه پررنگ تر و با ضخامت بیشتر ترسیم شده و ارتفاع مربوط به آنها روی آنها درج شده است.

منحنی میزان فرعی

محنی هایی هستند که بر روی نقشه کم رنگتر و باریک تر از منحنی های میزان اصلی ترسیم شده اند. بین هر دو منحنی میزان اصلی 4 منحنی میزان فرعی وجود دارد که البته ارتفاع مربوط به هر یک روی آنها درج نشده و ارتفاع شان را باید از روی منحنی میزان های اصلی بدست آورد. ممکن است بین دو منحنی میزان اصلی 8 منحنی وجود داشته باشد که یکی در میان 4 تای آن فرعی و 4تای آن منحنی میزانهای تکمیلی است.

دو نکته:

منحنی های میزان حتما بسته اند و از منحنی های میزان هیچ خطی بصورت شاخه فرعی ترسیم نمی شود.

منحنی های میزان یکدیگر را قطع نمی کنند.بدین معنی که هیچ نقطه ای روی نقشه نمی تواند دو ارتفاع داشته باشد.



برچسب‌ها: منحنی تراز کانتور یا میزان
+ نوشته شده در  شنبه 16 آذر1392ساعت   توسط محمد حسین ضرغامی  | 

نحوه ي تفسير تعامل در تحليل آنوا يا واريانس دو راهه يا دو عاملي

نحوه ي تفسير تعامل در تحليل آنوا يا واريانس دو راهه يا دو عاملي اول پاسخ به سوال دومتان ارائه ي نمودارها تنها براي ديداري سازي ارتباط تعاملي و درك بهتر تعامل ارائه مي شود. براي معنادار بودن تعامل دليلي براي قطع كردن خطوط وجود ندارد .يعني مي تواند تعامل بدون قطع شدن اين خطوط معنادار شود. براي درك اين نكته كافي است به فرمول هايي كه ميزان واريانس تعاملي را براورد مي كنند نگاهي بيندازيد. در صورتي كه دو خط يكديگر را قطع كنند مي توان گفت بين آنها تعامل وجود دارد اما عدم تقاطع را نمي توان به معني عدم وجود تعامل گذاشت. در صورتي كه خطوط با يكديگر كاملا موازي باشند مي توان گفت كه تعاملي بين آنها وجود ندارد. ولي عدم وجود توازي و عدم قطع كردن را بايد به مقادير تحليل آنوا براي تعامل نگاه كرد. براي تفسير تعامل بايد گفت كه تغيير در سطح يك متغير به اين كه متغير ديگر در چه سطحي است مربوط است. در اينجا تاثير برنامه ي تلفيقي به اين وابسته است كه روش قصه گويي است يا سنتي . و برنامه ي تلفيقي براي قصه گويي موثر تر از سنتي است به عبارت ديگر روش تلفيقي براي قصه گويي نسبت به روش غير تلفيقي موثر تر است و براي روش سنتي برنامه ي تلفيقي و غير تلفيقي تفاوت معناداري ندارد (باتوجه به نمودار
برچسب‌ها: نحوه ي تفسير تعامل در تحليل واريانس دو راهه, طرح عاملي
+ نوشته شده در  پنجشنبه 9 خرداد1392ساعت   توسط محمد حسین ضرغامی  | 

آمار و فلسفه علم

یکی از معضلات و مسایل جامعه امروز ما، استفاده از آمار و موارد مرتبط با آن در راه اثبات يا عدم اثبات مواردي است كه توسط ارائه دهندگان اين آمارها مورد استفاده قرار مي گيرد. متاسفانه به نظر مي رسد كه استفاده از آمار در علوم انساني و ساير علوم، ما را به بيراهه برده است، به طوري كه امروز پژوهش هاي ما به بررسي تاثير . .... بر ......... يا رابطه معنادار ... و .........مي پردازد كه هيچ نتيجه اي ندارد و در نهايت، اگر خيلي دقيق و حساب شده باشد، اشاره به خروجي ها يعني output ها دارد و نه به تبعات  و پيامدهاي اقدامات ما، يعني outcome ها. مثلا در اين بين، اشاره به اينكه امسال ظرفيت دانشگاه ها بيش از دواطلبان كنكور است و سال پيش توسط وزير محترم علوم مطرح شد، واقعا بيانگر چه چيزي است؟ آيا براي اين تعداد دانشجو، حداقل امكانات و ظرفيت هاي لازم پيش بيني شده است؟ آيا همه مشكلات كشور با افزايش تعداد دانشجويان حل مي شود؟ به هر حال مثال هايي از اينگونه زياد است. در اين بين، فلسفه علم و آنهايي كه نقشي در اين رابطه دارند و در حوزه سياست گذاري علم و فناوري فعال هستند يا خواهند بود، بايد به اين مهم توجه كنند.

فلسفه علم مي تواند با هر وسيله و شكلي كه ممكن است از بازي با آمار  براي اثبات واقعيت ها جلوگيري كند به اين معني كه ضد علم بودن و فساد و قبح آن را در عرصه علوم انساني آشكار كند. منظور از لزوم جلوگيري از بازي با آمار آن نيست كه آمار براي به دست آوردن مقاصد مفيد نيست، بلكه مقصود اين است كه فلسفه علم بايد استدلال به آمار را در اثبات قضاياي علمي به طور دقيق ارزيابي نمايد. در اين موضوع يك مساله بسيار اساسي بايد مورد توجه قرار گيرد: نبايد با به دست آوردن آماري كه تنها پديده ها و رفتارها و به طور كلي، نمودهاي فيزيكي را بررسي و تحقيق و شمارش مي نمايد، همه آنچه را كه در آن موارد وجود دارد تلقي نمود. مثلا با آمارگيري درباره تعداد افراد باسواد و بي سواد در يك جامعه، نمي توان گفت كه كثرت وجود بي سوادان در يك جامعه معلول ضعف فرهنگ علمي در آن جامعه بوده است يا داراي علت اقتصادي است يا ديگر علل و عوامل و نمي توان از همان آمار، معلول ها و نتايج و واقعيات همزمان با آنچه كه درباره آن آمارگيري شده است، استتنتاج و مشخص نمود.

+ نوشته شده در  جمعه 27 بهمن1391ساعت   توسط محمد حسین ضرغامی  | 

شاخص های مرکزی

شاخص های مرکزی

ميانه، مد،ميانگين:

مهمترين شاخص هاي مركزي عبارتند از :مد ،ميانه ميانگين

مد:داده اي است كه بيشترين فراواني را دارد .

وجود چندين مد نشان دهنده اين واقعيت است كه جامعه ما يك دست نيست .

براي محاسبه مد كافي است فراواني داده ها را با هم مقايسه كنيم وداده با بيشترين فراواني مد است .

ميانه : ميانه يكي از شاخص هاي مركزي است كه مي توان درباره وضعيت جامعه از آن استفاده كرد.پس از مرتب كردن داده ها مقداري را كه تعداد داده هاي بعد از آن با تعداد داده هاي قبل از آن برابر است ميانه مي ناميم.

روش پيدا كردن ميانه :

1ـداده ها را مرتب مي كنيم.

2ـاگر تعداد داده ها فرد باشد داده اي گه در وسط قرار مي گيرد برابر ميانه است .

3ـاگر تعداد داده ها زوج باشد ،نصف مجموع دو داده اي گه در وسط قرار گفته اند برابر ميانه است .

ميانه فقط به اين نكته توجه دارد كه تعداد داده هاي بعد از آن برابر تعداد داده هاي قبل از آن باشد و به بزرگي و يا كوچكي داده ها كاري ندارد .به عبارت ديگر ميانه به اندازه داده ها حساسيت نشان نمي دهد.

ميانگين : ميانگين در مركز داده قرار دارد . يعني همان مقداري كه داده ها از ميانگين اضافي دارند همان مقدار هم از ميانگين كم دارند .   

 

ميانه نيمه اول داده ها را چارك اول

+ نوشته شده در  سه شنبه 3 بهمن1391ساعت   توسط محمد حسین ضرغامی  | 

معرفي كتاب ارشد در روش تحقيق

كتاب ارشد

مجموعه علوم تربيتي و روانشناسي

روش تحقيق

در روانشناسي و علوم تربيتي


فهرست مطالب

فصل اول - علم و روش علمي و مفاهيم پايه در تحقيق ................................................................................... 1

مقدمه / علم / هدف هاي علم و نظري ه / تعاري ف / انواع نظريه / هدف هاي نظريه / نظريه صور ي /

نظريه ي قياسي / نظريه تمثيلي / نظريه تجريدي / ويژگي هاي نظريه / روش علمي و مراحل آن / منابع

اطلاعاتي / مراحل روش علمي / ويژگي هاي علوم انساني / تحقيق و مفاهيم اساسي آن / ويژگي هاي

تحقيق علمي / مراحل تحقيق / انتخاب و تنظيم موضوع تحقيق / منابع و مراجع بر انتخاب موضوع /

محدوديت ها در تحقيق / اشتباهات رايج در تنظيم موضوع تحقيق / سوالات چهارگزينه اي / پاسخنامه

سوالات چهارگزينه اي

فصل دوم - مسئله و فرضيه.............................................................................................................................. 27

مسئله / نحوه ي انتخاب مسئله / ملاك هاي مربوط به مسئل ه / ارزيابي مسئل ه / تدوين فرضي ه /

ويژگي ها يا ملاك هاي فرضيه ي خوب / منابع تشكيل فرضيه / اهميت فرضيه / انواع فرضيه / مزاياي

فرضيه / كليت و اختصاصي بودن فرضي ه ها / نكته ي آخ ر / سوالات چهارگزينه اي / پاسخنامه سوالات

چهارگزينه اي

فصل سوم - مفاهيم، سازه ها، متغيرها و تعاريف ......................................................................................... 43

مقدمه / مفهوم / سازه ها / متغير و انواع آن / تعريف هاي مولفه اي و عملياتي / اندازه گيري متغيرها /

تهيه ابزار يا وسايل انداز ه گيري / پيش بيني مقياس كمي / سوالات چهارگزينه اي / پاسخنا مه سوالات

چهارگزينه اي

فصل چهارم – جامعه و نمونه ............................................................................................................................. 61

جامعه / نمونه / اشتباه هاي رايج در نمونه گيري / تعريف جامعه / نمونه گيري / نمونه گيري تصادف ي /

نمونه گيري منظم يا سيستماتيك / نمونه گيري طبقه اي / نمونه گيري خوشه اي / نمونه گيري غيرتصادفي

/ حجم يا اندازه ي نمونه / برآورد حجم نمونه / سوالات چهارگزينه اي / پاسخنامه سوالات

چهارگزينه اي

فصل پنجم – انواع روش هاي تحقيق................................................................................................................. 81

مقدمه / تحقيق تاريخي / ويژگي هاي تحقيق تاريخي / مراحل تحقي ق تاريخي / تحقيق توصيف ي /

ويژگي هاي تحقيق توصيفي / مراحل تحقيق توصيفي

فصل ششم – تحقيق زمينه يابي ......................................................................................................................... 87

مقدمه / هدف هاي تحقيق زمينه يابي / انواع طرح هاي تحقيق زمين ه يابي / مصاحبه / انواع مصاحبه /

انواع خطاهاي مهم و منابع گمراه كننده در يك مصاحبه / پرسش نام ه / مراحل اجراي زمينه يابي

پرسش نامه اي / مزاياي تحقيق زمينه يابي / محدوديت هاي تحقيق زمينه يابي

فصل هفتم – تحليل محتوا .................................................................................................................................. 97

مقدمه و تعريف / محدوديت هاي تحليل محتوا / مراحل اجراي تحليل محتوا

فصل هشتم – تحقيق فراتحليلي...................................................................................................................... 101

- مقدمه / مراحل اجراي روش فراتحليل / 1- شناسايي منابع و ارزش يابي نتايج پژوهش ها / 2

اندازه اثر / P ارزشيابي نتايج پژوهش / 3- تر كيب و مقايسه نتايج پژوهش با يكديگر / سطح معناداري

استفاده از روش هاي آماري در اجراي فراتحليل / نحوه ي محاسبه ي اندازه ي اثر / تفسير اندازه ي / ES

اثر / روش هاي مقايسه و تلفيق (تركيب) نتايج پژوهش هاي انجام شده / مزاياي فراتحليل / منابع خطا /

محدوديت هاي فراتحليل / كاركردهاي فراتحليل

فصل نهم – تحقيق كيفي.................................................................................................................................... 115

مقدمه / نقاط ضعف روش تحقيق كيفي / تصميمات پژوهشگر در طرح تحقيق كيفي / ميزان مشاركت /

ميزان محرمانه بودن

فصل دهم – تحقيق همبستگي.......................................................................................................................... 119

مقدمه / همبستگي / انواع تحقيق همبستگي / مراحل تحقيق همبستگي / 1- مراحل مطالعات همبستگي

رابطه اي / 2) مراحل تحقيق پيش بيني / روش هاي محاسبه ي ضريب همبستگي دو متغير ي / همبستگي

همبستگي دو / (T) همبستگي كندال / (rno) همبستگي رتبه اي اسپيرمن / (r) ( پيرسون (گشتاوري

همبستگي دو رشته اي گسترده / همبستگي دو رشت ه اي / (rpbis) و دو رشته اي نقطه اي (rbis) رشته اي

نقطه اي / همبستگي چهار خانه اي (تتراكوريك) و ضريب في / همبستگي ايتا (ن سبي) / ضريب توافقي

كاهش همبستگي و اصلاح آ ن / كاهش همبستگي به علت محدوديت دامنه متغيرها / همبستگي / (c)

سهمي يا پاره اي / ب) روش هاي محاسبه ضريب همبستگي چند متغيري / الف) رگرسيون چند متغيري

/ ب) تجزيه و تحليل متمايز كنند ه / ج) همبستگي كانني / د) ماتريس همبستگي و تحليل عامل ي / معنادار

بودن همبستگي / تفسير ضريب همبستگي

فصل يازدهم – روش تحقيق پس رويدادي (علّي – مقايس هاي).................................................................. 129

روش تحقيق پس رويدادي (علّي – مقايسه اي) / مقدمه / مقايسه ي روش هاي پس رويدادي با آزمايش ي

/ مقايسه ي تحقيق پس رويدادي و همبستگي / كنترل در تحقيقات پس رويدادي / نكات مثبت تحقيق پس

رويدادي / محدوديت هاي تحقيق پس رويدادي / مراحل مختلف تحقيق پس رويدادي

فصل دوازدهم – تحقيق آزمايشي.................................................................................................................... 135

مقدمه / گروه هاي آزمايشي و شاهد در تحقيق آزمايشي / ويژگي هاي پژوهش آزمايشي / نحوه كنترل

/ انتخاب تصادفي / تكرارپذيري / كنترل واريانس (منابع واريانس ) / اعتبار تحقيق / عواملي كه اعتبار

دروني را تهديد مي كنند (متغيرهاي مزاحم و ناخواسته ) / عواملي كه اعتبار بيروني را تهديد مي كنند . /

انواع طرح هاي تحقيق آزمايشي (بين گروهي ) / طرح هاي شبه آزمايشي / طرح هاي آزمايش ي /

طرح هاي آزمايشي واقعي كه براساس تحليل عاملي و اندازه گيري هاي مكرر انجام م ي گيرند عبارتند از :

/ طرح هاي نيمه آزمايشي

فصل سيزدهم – آزمايش ميداني و طر حهاي درون آزمودن يها................................................................ 161

آزمايش ميداني / اعتبار بيروني / اعتبار سازه / توان آزمايش / معايب آزمايش ميداني / طرح هاي تك

طرح هاي بازگشتي شامل : / / AB آزمودني / فرايند تحقيق / انواع طرح هاي تك آزمودني / طرح پايه اي

با يك متغير مستق ل / سوالات ABAB طرح / ABAB طرح هاي / BAB طرح / BCB طرح / ABA طرح

چهارگزينه اي / پاسخنامه سوالات چهارگزينه اي

فصل چهاردهم – راههاي آماري براي طرحهاي پژوهشي ........................................................................... 189

-1 آزمون هاي بي پارامتري / آزمون رتبه هاي نشان دار ويلكاكسو ن / آزمون من – ويتني / آزمون

فريدمن / آزمون گرايش ال پيج / آزمون كراسكال – واليس / آزمون گرايش جانكهير / آزمون

وابسته) / آنواي يك راهه ) t مستقل / آزمون t مجذور كاي (خي 2) / آزمون هاي پارامتريك / آزمون

(مستقل) / آنواي يك راهه (وابسته) / آنواي دو راهه (مستقل) / آنواي دو راهه (مستق ل) / آنواي دو

راهه (وابسته) / آنواي دو راهه (آميخته)

فصل اول

علم و روش علمي و مفاهيم پايه در تحقيق

مقدمه

حوزه هاي دانش براساس نوع معياري كه براي درستي دانش خود به كار مي گيرند شناخته شده اند . از

جمله مي توان دانش (معرفت، علم ) 1 فلس في، دانش ديني، دانش هنري و دانش تجربي 2 را نام برد . معيار

حقيقت در فلسفه ، استدلال و برهان است . در دين، كتب و متون مقدس، در هنر، تجارب شخصي و احساس

هنرمند و در دانش تجربي، مشاهده، معيار حقيقت است . البته اين سخن بدان معنا نيست كه معرف ت هاي

مختلف از منابع گوناگون كسب دانش استفاده نمي كنند. مسلماً در علوم تجربي از استدلال و برهان استفاده

مي شود اما داور نهايي در علوم تجربي، قابليت مشاهده و تجربه پذيري است.

در كتاب حاضر، منظور ما از علم، همان علم تجربي است كه وابسته به مشاهده مي باشد. بنابراين ما به

هر نوع مطالعه ي پديده ها به عنوان علم نمي نگريم مثلاً ستاره شناسي شاخه اي از دانش يا معرفت است كه

به عنوان علم (تجربي) پذيرفته نمي شود و علت اساسي، متدولوژي آن است.

علم

علم چيست؟ به اين پرسش نمي توان به آساني جواب داد . در حقيقت هيچ تعريف بي واسطه اي از علم

نمي توان ارائه كرد . در عوض سعي خواهيم كرد برداشت ها و ديدگاه هاي مربوط به علم را مط رح و سپس

كاركردهاي آن را تشريح كنيم.

علم واژه اي است كه سوء تفاهم ها در مورد آن زياد است . به نظر مي رسد سه تفكر قالبي رايج فهم

فعاليت علمي را ضايع مي سازند. اولين تفكر قالبي مربوط به روپوش سفيد آزمايشگاهي با گوشي طبي

است.

دومين تفكر قالبي در دانشمندان اين است كه آنان افرادي باهوش هستند كه م يانديشند و نظريه هاي پيچيده

مي سازند. آنان نظريه پردازان غير تجربي هستند، گرچه تفكر و نظريه شان به نتايج علمي بينجامد.

سومين تفكر قالبي علم را با مهندسي و تكنولوژي (فن شناسي ) برابر مي سازد. تصور بر اين است كه علم

يعني ساختن پل ها، اصلاح ماشين ها، اختراع ماشين هاي آموزشي و نظاير آن.

1 -Know ledge

2 -Science

فصل دوم

مسئله و فرضيه

مسئله

تدوين مسئله در پژوهش امر مهمي است و پژوهشگر هميشه نمي تواند مسئل هي خود را به وضوح طرح

كند، شايد تصور ي كلي درباره ي مسئله داشته باشد و پيش از آن كه بتواند بگويد به دنبال پاسخ به چه

سئوالاتي است، زمان زيادي را صرف تفكر و مطالعه كند. بنابراين چيزي كه در بيان مسئله وجود دارد اين

است كه اگر كسي مي خواهد مسئله اي را حل كند، بايد بداند كه مسئله چيست و اين خود منوط به اين امر

است كه شخص بداند قصد انجام چه كاري را دارد . ديگر آنكه شخص بداند ماهيت مسئله چيست . بيان

مسئله در پژوهش بسيار مهم است.

پژوهشگر بايد براي تهيه ي يك پاسخ مناسب به سئوال هاي پژوهش، به دنبال گردآوري داده ها باشد و

بداند درباره ي مسئله اي كه با آن مواجه است ، چه اطلاعاتي موجود است و پيشينه ي پژوهشي را مورد

مطالعه قرار دهد و توانايي تجزيه و تحليل داده هاي جمع آوري شده را داشته باشد . طرح سئوال و انجام

پژوهش به دو دليل صورت مي گيرد:

1) به منظور تحقيق بنيادي است كه انگيزه پژوهشگر ميل به كسب دانش است.

2) به منظور تحقيق كاربردي است و استفاده از نتايج علمي براي انجام دادن بهتر امور.

در هر دو نوع تحقيق، نيازمند طرح مسئله و تد وين فرضيه هستيم و به دنبال آن جمع آوري داده ها و

نتيجه گيري درباره ي روابط بين متغيرها صورت مي گيرد.

نحوه ي انتخاب مسئله

همان طور كه گفته شد انتخاب مسئله مي تواند براي افزايش دانش نظري باشد يا به دنبال تأمين رفاه

مردم باشد و كاربرد عملي داشته باشد.

انتخاب مسئله پژوهش بستگي به انگيزه هاي پژوهشگر دارد . اين كه پژوهشگر علاقه مند است در

زمينه هاي نظري كاري كند يا در زمينه هاي عملي ، بستگي دارد به ذوق و سليقه وي و تخصص و

تجربه هايش.

فصل سوم

مفاهيم، سازه ها، متغيرها و تعاريف

مقدمه

نظام هاي علمي داراي دو مولفه هستند و پژوهشگران در اين دو سطح عمل مي كنند: 1) سطح نظريه –

فرضيه – سازه و 2) مشاهده. اين دو سطح در عين اين كه از هم جدا هستند به يكديگر مربوط هم هستند .

بدين جهت اين دو سطح را متمايز از هم مي دانيم كه سطح اول يعني ، نظريه – فرضيه – سازه يك سطح

مفهومي است و از مفاهيم تشكيل مي گردد؛ ولي سطح مشاهده، عملي است و در اين سطح پژوهشگر داده ها

را جمع آوري مي كند.

اما همان طور كه مطرح شد اين دو سطح به هم مربوط هستند و پژوهشگر ضمن پژوهش بين اين دو

سطح در حركت است . به هنگام بيان فرضيه در سطح نظريه – فرضيه – سازه عمل مي شود و وقتي براي

آزمودن فرضيه، به دنبال مشاهده و جمع آوري داده مي رويم در سطح مشاهده قرار م يگيريم.

مفهوم 1

مفهوم، نماد بسيار مهمي در پژوهش علمي است . مفهوم به مجموعه اي از رويدادها يا محر كها اطلاق

مي شود كه داراي ويژگ يهاي مشتركي هستند. مفهوم واژه اي است كه م يتوان آن را انتزاع رويدادهاي قابل

مشاهده دانست . به طور مثال وزن به عنوان مفهوم يك بيان كلي از مشاهده ي چيزهاي سبك و سنگين

است. سطح انتزاع مفاهيم با هم متفاوت است ، بخصوص د ر حوزه ي علوم رفتاري و اجتماعي با هم

مفاهيمي سروكار داريم كه سطح انتزاع آن ها بسيار بالاتر از علوم فيزيكي است . مفهوم پيشرفت تحصيلي،

مفهومي است كه حاصل انتزاع از برخي رفتارهاي كودكان مانند خواندن واژه ها، حل مسايل رياضي رسم

اشكال است كه مورد مشاهده قرار گرفته اند.

يك مفهوم به خودي خود يك پديده نيست بلكه نماد يك پديده است . هنگامي كه با يك مفهوم مواجه

مي شويم، انواع رفتارها يا پديده هاي قابل مشاهده را مي توان از آن استنباط كرد ، پس مفهوم دورنمايي

است كه از آن مي توان براي مشاهده پديده ها استفاده كرد . سوم، از طري ق مفاهيم، عمل طبقه بندي و تعميم

صورت مي گيرد و چهارم اين كه مفاهيم از مؤلفه هاي نظريه ها هستند.

1-concept

فصل چهارم

جامعه و نمونه

جامعه

در هر پژوهش علم ي، هدف پژوهشگر دست يابي به دانش و كشف قوان ين جامعه است . وقتي مي گوئ يم

پيشرفت تحص يلي دانش آموزان دبستان ي مناطق شهر ي استان اصفهان ب يشتر از مناطق روستا يي است ،

اين اص لي است كه درباره جامعه ي كودكان دبستا ني است ان اصفهان ب ي ان شده است و ي ا هنگام ي كه

پژوهشگري م ي خواهد تأث ير دو روش تدر يس را در پ يشرفت تحص يلي دانش آموزان دبستان ي استان تهران

بررسي كند، ا ين مطالعه درباره ي جامعه ي دانش آموزان دبستان ي استان تهران انجام مي پذ يرد. بنابر اين

جامعه ي آماري به مجموعه اي از اش يا، اشخاص، مكان ها و رويدادهايي اطلاق مي شود كه در ي ك ي ا چند

صفت مشترك هستند . جامعه با ا ين صفت يا صفات مشترك ب ين اعضا ي آن مشخص مي شود . هر چه

تعداد صفت هايي كه بين اعضا مشترك است كمتر باشد حجم جامعه يا تعداد اعضاي جامعه بيشتر مي شود

« زنان » و هر چه تعداد صفت هاي مشت رك ب ين اعضا ب يشتر باشد، جامعه محدودتر مي شود. به طور مثال

يك جامعه ي آماري است كه تمام زنان جهان را شامل مي شود و صفت مشترك اين جامعه، زن بودن است.

با دو صفت زن بودن و تحص يل كرده بودن مشخ ص مي شود « جامعه ي زنان، تحص يلات بالا ي د يپلم »

كه محدودتر از جامعه ي زنان است.

علاوه بر صفت يا صفت هاي مشترك كه در بين همه ي اعضا ي ي ك جامعه ي آمار ي مشترك است،

صفاتي ن يز وجود دارند كه در ب ين همه ي افراد جامعه مشترك ن يستند. به اي ن صفت ها ، صفت هاي غ ي ر

مشترك يا متغ ير مي گويند. به طور مثال جامعه ي دانشجويان پسر ا يراني يك جا معه آمار ي است كه صفات

مشترك اعضا ي آن ا يراني، پسر بودن و دانشجو بودن است، اما بعض ي دانشجو يان دانشگاه دولت ي هستند

و برخ ي آزاد، بعض ي مجرد هستند و برخ ي متاهل اند، بعض ي در طول تحص يل در كنار خانواده هستند و

برخي دور از خانواده، پس صفات غ ير مشترك شامل وضع يت تاهل ، بوم ي و غ ير بوم ي بودن، دانشجو ي

دولتي و غير دولتي بودن است. آنچه پژوهشگر علاقه مند به مطالعه ي آن است صفات غير مشترك است.

در هر پژوهش، اول ين قدم ا ين است كه جامعه مورد مطالعه با يد تعريف شود. مثال هاي زير، نمونه هايي

از جامعه ي آماري هستند:

- دانشجويان رشته روان شناسي دانشگاه هاي سراسري و آزاد استان تهران

- دانش آموزان پسر دوره ي راهنمايي استان اصفهان

- معلمان كلاس اول دبستان استان خوزستان كه آموزش ضمن خدمت را گذرانده اند.

فصل پنجم

انواع روش هاي تحقيق

مقدمه

پژوهشگر پس از تعيين انتخاب موضوع تحقيق بايد به دنبال انتخاب روش تحقيق باشد . منظور از

انتخاب روش تحقيق اين است كه تعيين شود چه روش ي براي بررسي موضوع مورد نظر مناسب و لازم

است.

هدف از انتخاب روش تحقيق اين است كه محقق مشخص كند چه روشي را اتخاذ كند تا با سرعت

بيشتر و صرف هجويي در هزينه و با سهولت بيشتر به پاسخ دست يابد.

انواع روش هاي تحقيق كه در ادامه توضيح داده خواهند شد عبارتند از:

-1 تحقيق تاريخي

-2 تحقيق توصيفي

-3 تحقيق تداومي و مقطعي (زمينه يابي)

-4 تحليل محتوا

-5 تحقيق فراتحليل

-6 تحقيق كيفي

-7 تحقيق علي – مقايسه اي (پس رويدادي)

-8 تحقيق همبستگي

-9 تحقيق آزمايشي

در فصل حاضر به دو مورد تحقيق تايخي و توصيفي خواهيم پرداخت و با توجه به فشردگي مطالب

مربوط به هر يك از روش هاي ديگر، آن ها را به تفكيك در فصول بعدي به بحث خواهيم گذاشت.

تحقيق تاريخي

در تحقيق تاريخي، پژوهشگر وقايع گذشته را كه در يك مقطع زماني مشخص روي داده اند مورد

مطالعه و بررسي قرار مي دهد . در اين روش تحقيق، پژوهشگر حقايق گذشته را از طريق جمع آوري

اطلاعات و ارزشيابي درستي و نادرست ي اطلاعات و با توجه به دلايل موجود، مورد تجزيه و تحليل قرار

مي دهد.

فصل ششم

تحقيق زمينه يابي

مقدمه

تحقيق زمينه يابي 1 يا پ يمايشي روش ي است جهت جمع آوري اطلاعات به منظور بررس ي نگرش ها ،

باورها، عقا يد و ارزش هاي مردم و تجز ي ه و تحل ي ل پاسخ ها به پرس ش هايي كه به ا ي ن منظور طرح

گرديده اند. از اين روش در انواع مطالعات اكتشافي، توصيفي، تبيين و ارزشيابي استفاده مي گردد.

در روش تحق يق زمينه يابي از مشاهده ي طبيعي بر اي جمع آوري اطلاعات توص يفي استفاده مي شو د و

لازم است رفتار افراد گروه نمونه كه معرف جامعه هستند به دقت مشاهده و ثبت شود . مثل زماني كه قرار

است داده هايي بر اي توص يف اين كه مردم چه نوع كالا ي مصرف ي را ترج يح مي دهند يا نگرش افراد نسبت

به نامزدهاي رياست جمهوري و يا عادات تماشاي تلويزيون جمع آوري مي شود.

از روش زمينه يابي م ي توان بر اي توص يف و بررس ي تغ ييرات در جامعه ن يز استفاده كرد . البته برخ ي

منابع خطا مانع از جمع آور ي دق يق و صح يح داده ها مي گردند و در توص يف ويژگي هاي جامعه خطا ايجاد

مي گردد، بنابراين لازم است ابزارهاي اندازه گيري (مصاحبه يا پرسشنامه) با دقت تدوين شوند، نمونه گيري

درست صورت گ يرد، براي اجراي تحقيق، روش مناسب انتخاب شود، طرح پژوهش ي زمينه يابي تدو ين

گردد و داد هها مورد تجزيه و تحليل آماري قرار گيرند.

هنگامي كه پژوهشگر كل جامعه را مورد مطالعه قرار مي دهد، از روش سرشمار ي استفاده مي كند، اما

اغلب نمونه هايي از كل جامعه انتخاب شده و مورد مطالعه قرار مي گيرند و نتا يج به كل جامعه تعم يم داده

مي شود.

هدف هاي تحقيق زمينه يابي

براي انجام تحقيق زمينه يابي دلايل زيادي مي تواند وجود داشته باشد. روش زمينه يابي روشي است كه

براي توص يف عقا يد، نگرش ها و احساسات مردم و واقع يت هاي اجتماع ي مثل جنس، پا يگاه اجتماع ي –

اقتصادي، سن و شغل و غيره و تبيين روابط بين آنها استفاده مي شود.

به طور كلي اين تحقيق سه هدف را دنبال مي كند:

1 -survey Research

-1 توصيف

-2 تبيين

-3 كشف

فصل هفتم

تحليل محتوا

مقدمه و تعريف

تحليل محتوا، مطالعه ارتباطات است به منظور توصيف رفتار اجتماعي و آزمون فرضيه اي كه در مورد

آن تدو ين شده است . يا به عبارت ي تح ليل محتوا يك روش پژوهش ي است كه به صورت منظم و ع ين ي،

محتواي آشكار ارتباطات را توص يف مي كند. روش هاي ع يني و منظم باعث تم يز اين روش از سا ير روش هاي

پژوهشي مي شوند. در واقع روشي است كه به صورت منظم و عيني، ويژگي هاي پيام ها را تعيين م يكند.

برخي تح ليل محتوا را به عنوان روش ي منظم كه برا ي بررس ي محتوا ي اطلاعات ثبت شده استفاده

مي گردد، تعر يف كرده اند. كرلينجر آن را روش مطالعه و تجز يه و تحل يل ارتباط (توصيف محتوا ي آشكار

يك ارتباط) به شكلي نظام دار، عيني و كمي، به منظور سنجش متغيرها مي داند.

منظور از نظام دار بودن اين است كه محتوا يي كه با يد تح ليل شود طبق قواعد روشن ي انتخاب شود از

جمله انتخاب نمونه براساس ش يوه ي درست و هر ماده شانس برابر ي جهت تحل يل داشته باشد . همينطور

فرايندهاي ارز يابي نيز بايد نظام مند باشد و با تمام محتواي مورد بررسي يكسان عمل شود. در روش هاي

كدگذاري، تجزيه و تحليل و مدت زماني كه كدگذران صرف مي كنند، يكساني عمل، مشاهده شود.

دوم اين كه تح ليل محتوا ع يني است ، يعني محقق نبا يد سوگ يري شخص ي داشته باشد . تحق ي ق بايد

تكرارپذير باشد و اگر پژوهشگر ديگري بخواهد آن تحقيق را تكرار كند، به نتايج مشابهي برسد.

سوم اين كه تحليل محتوا كم ي است . هدف تح ليل محتوا بازنما يي دق يق ي ك مجموعه پ ي ام ها است و

براي رسيدن به عينيت بايد كمي سازي كرد.

هدف تح ليل محتوا پاسخگو يي به سئوال هايي است كه با موارد تجز يه و تحل يل ارتباط مستق يم دارند .

در هر ارتباطي سه عنصر وجود دارد: فرستنده، پيام، پيام گيرنده.

از حلقه هاي ارتباط ي ب ين محتواي پيام و ويژگي هاي فرستنده مي توان به ويژگي هاي گيرن ده پ ي برد .

پژوهشگران اغلب تحليل محتوا را به جهت بررسي و تعيين تأثير پيام برگيرنده به كار مي برند.

منظور از محتوا ي آشكار يعني محتو اي ظاهر ي و هدف اين است كه محتوا به همان شكل ي كه ظاهر

شده است كدگذاري شود نه به شكلي كه تحليل گر آن را احساس مي كند.

در گذشته ت حليل محتوا بر تع يين فراوان ي وقا يع يا متغ يرهاي مورد مطالعه تاك يد داشت ، اما اكنون ا ي ن

روش بينشي دروني است كه به منظور مطالعه تغييرات اجتماعي به كار برده مي شود.

فصل هشتم

تحقيق فراتحليلي

مقدمه

گاهي در نتا يج برخ ي پژوهش ها اعم از روان شناس ي، علوم اجتماع ي و سا ير علوم رفتار ي تناقض هايي

مشاهده مي شود. بررسي نتا يج و مقا يسه آنها با يكديگر به چند دل ي ل كار ي دشوار و غ ي ر ممكن است .

تفاوت در تداب ير آزما يشي از پژوهش ي به پ ژوهش د يگر و كنترل عوامل مح يط ي و روش هاي تحق ي ق

گوناگون و ابزارها ي اندازه گيري متفاوت ، موجب مي شوند كه پژوهشگر نتواند يافته ها را مقا يسه كند و در

اين صورت پژوهشگر ممكن است نياز داشته باشد كه فرايند بازنگر ي تصح يح شود، چرا كه مطالع ه ي

تحقيقات قب لي به شكل ك يفي داراي اشكال هايي است. از جمله ا ينكه اين روش ها ذهن ي هستند و پژوهشگر با

توجه به ملاك هاي ذهن ي خود پژوهش هاي قب لي را بررس ي مي كند؛ دوم اين كه پژوهشگر در انتخاب نوع

ويژگي ها و نكات دچار مشكل مي گردد. انتخاب نوع و يژگي مهم است چون هدف ، حل تناقض در يافته هاي

بدست آمده از پژوهش هاي گوناگون است.

بنابراين ن ياز به يك روش منظم است كه با استفاده از نت ايج پژوهش هاي انجام شده، آن ها را مورد

تفسير و ارزش يابي قرار دهد و نقاط ضعف آنها را شناسايي كند.

فراتحليل مجموعه اي از فنون نظامدار برا ي حل تناق ض هاي يافته هاي بدست آمده از پژوهش هاي

مختلف است . اين روش نتا يج بررس ي هاي گوناگون را به مق ياس مشترك تبديل مي كند يا به عبارت ديگر با

استفاده از روش هاي آمار ي، پژوهش هاي انجام شده را ترك يب مي كند. در اين روش واحد تجز يه و تحل ي ل

يعني نمره از مطالعه به دست مي آيد، نه آزمودني.

بنابراين فرا تحل ي ل مجموعه اي از روش هاي آمار ي است كه برا ي يكپارچه كردن نتا يج حاصل از

پژوهش هاي آزما يشي و همبستگ ي كه هر كدام به طور مستقل درباره ي ي ك موضوع يكسان انجام گرفته اند، به

كار مي رود و پ يش فرض اين است كه هر كدام از پژوهش ها برآورد متفاوت ي از پارامترها ي جا معه و روابط

بين متغيرها را نشان مي دهند كه با تجزيه و تحليل اين يافته ها، برآورد دقيق تري از جامعه به دست مي آيد.

در فر اتحليل ابتدا اطلاعات از منابع اول يه استخراج مي شود، سپس با استفاده از روش هاي آمار ي با

يكديگر ترك يب مي شود و بالاخره ي ك كل جد ي د به دست مي آي د. در روش هاي فراتح لي ل، پژوهشگر،

ويژگي ها و داده هاي پژوهش هاي قب لي را ب ه شكل كم ي ثبت مي كند و بعد با ترك ي ب نتا يج تحق يقات قبل ي،

فصل نهم

تحقيق كيفي

مقدمه

روش هاي همبستگ ي و آزما يشي از عمده تر ين روش هاي پژوهش كم ي هستند . اساس روش هاي

پژوهش كم ي بر ا ين است كه به متغ يرها ارزش عدد ي داده مي شود، به گونه اي كه بتوان آنها را به طور

آماري تحليل كرد. علاوه بر روش هاي پژوهش كمي، روش هاي پژوهشي ديگر با نام رو شهاي كيفي وجود

دارند. اين روش ها، برخلاف روش هاي كم ي (مانند روش هاي همبستگ ي و آزما ي شي) و يژگ ي هاي مورد

بررسي را به كم يت تبد يل م ي كنند. در ا ين روش ها پد يده هاي مورد نظر همان گونه كه هستند (به صورت

كيفي) بررسي مي شوند. روش هاي كم ي به كشف روابط ب ين پد يده ها علاقه مندند در حالي كه روش ك يف ي

سعي بر توص يف پد يده ها دارد و پژوهشگر مي كوشد در دن ياي افراد مورد پژوهش به طور كامل غرق

شود و از ديدگاه كساني كه درگير آن هستند به كنه معني امور پي ببرد.

به هر حال هدف ا ين روش ، توص يف پد يده ها و واقع يت هاي اجتماعي از د يدگاه افراد است نه از دي دگاه

مشاهده كننده . برخي از محققان ك يفي معتقدند برا ي درك د يدگاه د يگران با يد تا حد امكان از نظر ي ه هاي

قبلي كمتر استفاده كرد و محقق بايد خود را در بطن موضوع قرار دهد و ارزش هاي شخصي و

پيش داوري هاي خود را كنار بگذارد و جهان را از دريچه ديد ديگران تجربه كند.

نقاط قوت تحقيق كيفي

-1 بررس ي رفتار در شر ايط طب يعي: در ا ين روش، رفتار اجتماع ي در شر ايط طبيع ي مورد مطالعه

قرار مي گرفته و پد يده در دن ياي واقع ي مورد بررس ي قرار مي گيرد و به هم ين د لي ل نت يجه پژوهش مورد

اعتماد است.

-2 عمق ادراك: چون در اين روش محقق به طور مستقيم در زندگي اشخاص وارد مي شود مي تواند به

نظرهاي شخصي افراد دست يابد.

-3 انعطاف پ ذ يري: در روش ك يفي محقق مي تواند علاوه بر سئوال هاي از پيش طرح شده، به دنبال

پاسخ سئوالات ي باشد كه ضمن تحق يق پ يش مي آيد و بد ين ترت يب مي تواند تح قيق خود را براساس شرا يط

پيش آمده، گسترش دهد.

فصل دهم

تحقيق همبستگي

مقدمه

تحقيق همبستگ ي يكي از انواع تحق يق هاي غ ير آزما يشي است كه در آن رابطه ي دو يا چند متغ ير مورد

بررسي قرار مي گيرد. تحقيقات مختلف هدف هاي گوناگون ي مي توانند داشته باشند . در برخ ي پژوهش ها به

توصيف پ ديده ها در زمان حال پرداخته مي شود و در برخي علاوه بر توصيف، تبيين يعن ي علل آن پد ي ده

مورد بررس ي قرار مي گيرد و از طر يق ايجاد رابطه ب ين زمان حال و گذشته، به دنبال مشخص كردن علل و

عوامل يك پد يده هستند، به طور مثال چرا م ي زان بزهكار ي در نوجوانان فاقد پدر 20 درصد ب ي شتر از

نوجوانان واجد پدر مي باشد. گاهي نيز يك پژوهش در سطح پيش بيني عمل مي كند و بين زمان حال و آينده

رابطه برقرار مي كند و از طر يق م طالعه وضع موجود ، مي خواهد وضع يت يك پد ي ده را در آ ينده مشخص

كند، به طور مثال م يزان پ يشرفت تحص يلي دانش آموزان دبستان ي چقدر خواهد بود . بالاخره در ي ك

پژوهش، هدف مي تواند كنترل باشد ، يعني مي توانيم يك پد يده را تحت كنترل خود در ب ياوريم. به طور مثال

چگونه مي توان ميزان پيشرفت تحصيلي دانش آموزان دبستاني را 15 درصد افزايش دارد.

حال ببينيم تحقيق همبستگي كدام هدف پژوهشي را دنبال مي كند.

همبستگي

از تحق يقات همبستگ ي ب يشتر به منظور توص يف و پيش بيني استفاده مي شود. در تحق ي ق همبستگ ي به

سئوالات زير پاسخ داده مي شود:

آيا بين دو متغير رابطه وجود دارد؟

و در صورت وجود رابطه:

الف) جهت رابطه چگونه است (مثبت يا منفي است)؟

ب) شدت رابطه چقدر است؟

ضريب همبستگ ي يك ابزار آمار ي است كه به پژوهشگر كمك مي كند تا پاسخ اين پرسش ها را پيدا كند.

فرض كن يد پژوهشگر مي خواهد بداند كه رابطه ي بين نمره هاي پ يشرفت تحص يلي گروه ي از دانش آموزان

با نمره هاي آنان در زمينه ي ديگري مثل هوش چگونه است.

فصل يازدهم

روش تحقيق پس رويدادي (علّي – مقايسه اي)

روش تحقيق پس رويدادي (علّي – مقايسه اي)

مقدمه

روش هاي علّي – مقايسه اي يا روش هاي پس رويدادي 1 معمولاَ به تحقيقاتي گفته مي شود، كه پژوهشگر

در آن ها به بررس ي علل احتمال ي وقوع يك متغ ي ر وابسته مي پردازد .به عبارت د يگر ا ي ن نوع تحق ي ق،

گذشته نگر بوده و سعي مي كند از معلول پي به علت احتمالي برد.

از آنج ايي كه برا ي پ ي بردن به رابطه ي علت و معلولي لازم است كه ابتدا علت را به وجود آورد و بعد

معلول را مورد مشاهده قرارداد، پژوهشگر با دستكاري يك متغير، متغير دوم (وابسته) را مورد

است . « خصيصه اي » ، اندازه گيري قرار مي دهد، اما گاه ي اين روش امكا ن پذير ن يست. در برخ ي مواقع علت

به طور مثال جنسيت متغيري غير قابل دستكار ي است . در بعض ي مواقع ، علت خص ي صه اي ني ست، اما

دستكاري آن ها از كنترل پژوهشگر خارج است . اطلاعات لازم برا ي بررس ي علل وقوع ي ك رو ي داد زمان ي

جمع آوري مي شود، كه آن رو يداد رخ داده است مثل موفق يت در كنكور و يا پرخاشگر ي در نوجوانان فاقد

پدر. در اين نوع پژهش ها علل احتمال ي موفق يت در كنكور يا علل پرخاشگري در نوجوانان در اخت يار محقق

نيست، پژوهشگر فقط ا ين افراد را شناسا يي مي كند و و يژگي هاي آن ها را مورد بررس ي قرار مي دهد تا

بتواند به علل احتمالي اين ويژگي ها پي ببرد.

كرلينجر مي گويد تحقيق پس رويدادي عبارت است از، مطالعه ي عين ي و منظم بودن كنترل مستق يم

متغيرهاي مستقل . در اين پژوهش ها متغ ير مستقل از پ يش اتفاق افتاده و قابل دستك اري محقق ن يست. فقط

پژوهشگر براساس بررس ي هاي خود فرضيه هايي در مورد علت احتمالي پديده ي مورد نظر تدوين مي كند و

بعد به آزمون آن ها مي پردازد، و براساس نتايج به دست آمده نكاتي را مطرح مي كند.

براي انجام تحقيق پس رويدادي سه شرط لازم است:

-1 اول ا ين كه ب ين متغ ير وابسته و مستقل تغ ييرات همزمان را بتوان مشاهده كرد . گاهي وجود رابطه

بين دو متغ ير به علت وجود متغ ير سوم ي است كه موجب همبستگ ي ب ين آن دو متغ ي ر مي گردد ، كه اگر

متغير سوم حذف شود، ديگر رابطه ي بين دو متغير اول مشاهده نخواهد شد.

1 -causal - comparative

فصل دوازدهم

تحقيق آزمايشي

مقدمه

تحقيق آزما يشي روش ي است كه در آن پژوهشگر، محرك، رفتار ي ا شر ايط محيط ي را دستكار ي

مي كند، تا نحوه ي تاثير اين تغييرات را بر شرايط يا رفتار آزمودني ها مورد مشاهده و بررسي قرار دهد.

پژوهشگر با يد از تاث ير سا ير عوامل و متغ يرها بر نتا يج پژوهش آگاهي داشته باشد، كوشش كند سا ير

عوامل را به شكلي كنترل يا حذف كند، تا بتوان به روابط علت و معلولي دست يابد.

تحقيق آزما يشي روش ي را برا ي آزمودن فرض يه فراهم مي كند. پس از طرح و ب يان مسئله ، ي ك پاسخ

احتمالي يا فرض يه پ يشنهاد مي گردد و رابط ه ي احتمالي ب ين متغ يرهايي كه تحت شرايط كنترل شده هستند

مورد مشاهده قرار مي گيرد، رابطه ي مطرح شده، مورد تأييد قرار مي گيرد يا رد م يشود.

تحقق آزما يشي، روش كلاس يك آزما يشگاه ها و پژوهش هاي علم ي است . تحق ي ق آزما ي شگاهي بس يار

موثر و كارآمد در كشف دانش و ارائه ي نظر يه هاي علم ي مي باشد. اما از آنجا كه در علوم انسان ي مسائل

داراي پ يچيدگي ب يشتري هستند ، از روش هاي آزما ي شگاهي كمتر استفاده مي شود . بنابرا ين از تحق ي ق

آزمايشي در شرايط غير آزمايشگاهي نيز استفاده مي شود، مانند كلاس درس كه عوامل يا متغيرها تا حدي

قابل كنترل هستند.

پس تحق يق آزما ي شي ر ا مي توان به دو طبقه تقس يم كرد : آزما يش آزما ي شگاهي و آزما يش غ ي ر

آزمايشگاهي (آزمايش ميداني).

آزمايش آزما يشگاهي در يك موقع يت ف يزيكي جدا از موقع ي ت هاي عاد ي و طب يع ي انجام مي گي رد.

پژوهشگر متغير مستقل را دستكاري و متغيرهاي مزاحم يا ناخواسته را با دقت هر چه بيشتر كنترل مي كند

يعني اثر آن ها را حذف يا خنث ي مي كند. با اندازه گيري دق يق متغ يرهاي آزما يشي، وار يانس خطا به حداقل

مي رسد.

البته از محدود يت هاي روش آزما يشي آزما يشگاهي، مصنوع ي شدن شرا يط آزما يش مي باشد. هنگامي

كه پژوهشگر مي كوشد تا تمام متغيرهاي ناخواسته را كنترل كند، اين عمل موجب ايجاد يك محيط ساختگي

مي گردد، كه با مح يط طب يعي و واقع ي زندگ ي متفاوت است ، در نت يجه تعم يم پذ يري نتا يج تحق ي ق مختل

مي گردد. اعتبار دروني آزمايش آزمايشگاهي در مقايسه با ساير روش هاي تحقيق بالا است.

فصل سيزدهم

آزمايش ميداني و طرح هاي درون آزمودني ها

در اين فصل ابتدا آزما يش م يداني مورد بحث قرار خواهد گرفت، و سپس طرح هاي درون آزمودن ي ها

توضيح داده خواهد شد.

آزمايش ميداني 1

هنگامي كه صحبت از آزما يش مي شود تصور مردم بر وجود ي ك آزماي شگاه و انجام مطا لعه در آن

است. در حا ليكه وجود يك آزما يشگاه لزوماً منجر به يك آزما يش دق يق نمي گردد. آنچه در انجام آزما يش

مهم است آرا يش تصادف ي است كه برا ي انجام آن نيازي به وجود آزماي شگاه نيست . انجام آزما يش در

محيط طب يعي نوع ي آزما يش است كه به آن آزما يش م يداني گفته مي شود. علت انجام آزما يش در مح يط

طبيعي مي تواند به دلايل زير باشد.

1) تعميم نتايج به شرايط طبيعي تر

2) تعميم نتايج به افراد جامعه

3) افزايش توان آزمايش

4) واكنش طبيعي آزمودني ها در زمان آزمايش

اعتبار بيروني

همان طور كه مي دانيم منظور از اعتبار بيروني، تعميم نتايج آزمايش به جامعه مي باشد، يعني شر ايطي

كه خارج از فضا ي آزمايش است. هدف آزمايش مي داني اي ن است كه نتا يج آزماي شگاهي را در شر ايط

طبيعي بدست آورد.

هدف بعد ي، تعم يم نتا يج به گروه هاي مختلف مردم است . معمولاً در آزما يشگاه ها نمونه ها داوطلبانه

انتخاب مي شوند كه با مرد م جامعه متفاوت خواهند بود ، نمي توان نتا يج حاصل از آزما يش بر رو ي اي ن

افراد را به گروه هاي مختلف افراد جامعه تعميم داد.

1 -field experiment

فصل چهاردهم

راه هاي آماري براي طرح هاي پژوهشي

-1 آزمون هاي بي پارامتري

آزمون رتبه هاي نشان دار ويلكاكسون

آزمون و يلكاكسون براي طرح هاي وابسته ي دو موقعيتي به كار برده مي شود كه در آن آزمودن ي ها

يكسان و همتا هستند . هدف اين آزمون مقا يسه عملكرد هر آزمو دني (يا جفت هاي آزمودن ي ها ) به منظور

يافتن تفاوت هاي معنادار ب ين نمر ه هاي آن ها در دو موقع يت است . فرض كن يد مي خواهيم بدان يم كه آ ي ا بين

مقدار واژگان مورد استفاده ي كودكاني كه مهد كودك مي روند يا در خانه مي مانند، تفاوت ي وجود دارد . در

ابتد از نظر سن، جنس، هوش ي ا هر متغ ي ر « خانه » و « مهد » چنين شر ايطي لازم است دو گروه كودكان

ديگري كه فكر مي كنيم ممكن است ن ياز به كن ترل آن داشته باش يم، همتا شوند و بعد مورد آزمون قرار

گيرند.

آزمون و يلكاكسون جز آزمون هاي بي پارامتري است و در شرا يطي مورد استفاده قرار مي گي رد كه

داده ها ترتيبي اند، آزمودني ها يكسان يا همتا هستند (طرح وابسته) و متغير مستقل داراي دو سطح باشد.

مقا ي سه مي گردد تا مشخص W محاسبه مي شود و با ارزش بحران ي W در اين نوع آزمون، ارزش

معني دار است؟ W شود كه آيا ارزش مشاهده شده

آزمون من – ويتني

آزمن من و يتني را با يد در طرح مستقل (آزمودني ها متفاوت ) دو موقع يتي به كار برد . منظور از دو

موقعيتي اين است كه متغ ير مستقل دارا ي دو سطح يا دو موقع يت است. فرض كنيد مي خواهيم تأثير ماده ها

يا مطالب معن ي دار را در يادآوري بررس ي كن يم. از يك گروه شش نفر ي مي خواهيم كه ماد ه ها ي ا مطالب

معني دار را ياد بگ يرند (يك موقع يت)، تعداد واژه هاي به ياد مانده مع يار مناسب ي بر اي اندازه گيري حافظه ي

آزمودني ها است و موقعيت ديگر يادآوري مطالب و واژه هاي بي معني است.

چون در يك طرح مستقل مبنايي براي مقايسه ي تفاوت بين جفت هاي نمره ها وجود ندارد ، بنابر اين در

اين نوع آزمون ، نمره هاي همه آزمودن ي هاي متفاوت را به شكل ي ك مجموعه واحد ، رتبه بندي مي كنند .

چنانچه تفاوت هاي بين دو موقع يت تصادف ي باشد (فرضيه صفر ) نمره ها و رتبه ها با ي د در دو موقع ي ت

منابع

-1 بيابانگرد، اسماعيل. ( 1384 ). روش هاي تحقيق در روان شناسي و علوم تربيتي، تهران: نشر دوران.

-2 دلاور، علي. ( 1380 ). مباني نظري و عملي پژوهش در علوم انساني و اجتماعي، تهران: انتشارات رشد.

-3 دلاور، علي. ( 1384 ). روش تحقيق در روان شناسي و علوم تربيتي، تهران: نشر ويرايش.

-4 سرمد، زهره و همكاران. ( 1376 ). روش هاي تحقيق در علوم رفتاري، تهران: انتشارات آگاه.

-5 شريفي، حسن پاشا و شريفي، نسترن . ( 1383 ). روش هاي تحقيق در علوم رفتاري، تهران : انتشارات

سخن.

-6 كرلينجر، فرد، ان . ( 1986 ). مباني پژوهش در علوم رفتاري، تر جمه حسن پاشا شريفي و جعفر

نجفي زند ( 1389 ). تهران: انتشارات آواي نور.

-7 گرين، جوديت و اُليويرا، مانوئلادي . كاربرد آزمون هاي آماري در پژوه ش هاي علوم رفتاري، ترجمه

علي دلاور و مهرداد پژهان. ( 1380 ). تهران: نشر اسباران.

-8 نادري، عزت الله و سيف نراقي، مريم . ( 1385 ). روش هاي تحقيق و چگونگي ارزشيابي آن در علوم

انساني، تهران: دفتر تحقيقات و انتشارات بدر.

-9 وزيري، شهرام و همكاران . ( 1383 ). روش تنظيم و گزارش پژوهش در روان شناسي و مشاوره و

علوم تربيتي، تهران: نشر روان.

+ نوشته شده در  چهارشنبه 1 آذر1391ساعت   توسط محمد حسین ضرغامی  | 

lمعرفي قسمت هاي مختلف يك كتاب آمار توصيفي و استنباطي

كتاب ارشد

فهرست مطالب

بخش اول _ آمار توصيفي

فصل اول _ كليات

1 تعريف آمار و اهميت آن ....................................................................................................................................................... 1

2 سنجش و يا انداز هگيري........................................................................................................................................................ 2

3 انواع مقيا سهاي اندازه گيري................................................................................................................................................. 3

4 انواع داد ههاي آماري............................................................................................................................................................. 5

5 علائم آماري .......................................................................................................................................................................... 6

11.......................................................................................................................................................................... ( خودآزمائي ( 1

15.........................................................................................................................................................( پاسخنامه خودآزمائي ( 1

فصل دوم _ تنظيم و جدولبندي داده هاي آماري

1 جدولبندي داده هاي مقياس اسمي و رتبه اي ...................................................................................................................... 17

1 جدولبندي داده هاي يك متغيري ............................................................................................................................ 17 _1

1 جدولبندي داده هاي چندمتغيري........................................................................................................................... 18 _2

2 جدول توزيع فراواني در داد ههاي داراي مقياس نسبي و فاصل ها ي............................................................................... 18

2 تشكيل جدول فراواني............................................................................................................................................ 19 _1

2 توزيع فراواني طبقه بندي شده .............................................................................................................................. 20 _2

2 مراحل ساختن توزيع فراواني طبق ه بندي شده..................................................................................................... 21 _3

24.......................................................................................................................................................................... ( خودآزمائي ( 2

26.........................................................................................................................................................( پاسخنامه خودآزمائي ( 2

فصل سوم _ نمودارهاي فراواني

1 رسم نمودارها در داد ههاي مقياس نسبي و فاصل هاي ..................................................................................................... 27

1 نمودار چند ضلعي ................................................................................................................................................. 27 _1

1 نمودار هيستوگرام (ستوني)................................................................................................................................. 29 _2

1 نمودار فراواني متراكم (تجمعي) يا منحني گالتون .............................................................................................. 30 _3

1 منحني درصد فراواني متراكم (اُجي و) ................................................................................................................... 31 _4

-1-5 نمودار شاخ و برگي....................................................................................................................................................

2 رسم نمودارها در داد ههاي مقياس اسمي و رتب ها ي ........................................................................................................ 33

2 نمودار ميله ا ي......................................................................................................................................................... 33 _1

2 نمودار داير هاي....................................................................................................................................................... 34 _2

36.......................................................................................................................................................................... ( خودآزمائي ( 3

38.........................................................................................................................................................( پاسخنامه خودآزمائي ( 3

فصل چهارم _ اندازه هاي گرايش مركزي

الف) ميانگين ............................................................................................................................................................................... 39

1 ميانگين حسابي ................................................................................................................................................................... 39

1 خواص ميانگين ...................................................................................................................................................... 40 _1

1 محاسبه ميانگين داد هها......................................................................................................................................... 41 _2

44.......................................................................................................................................................... (G) 2 ميانگين هندسي

45............................................................................................................................................................(H) 3 ميانگين همساز

ب) ميانه .................................................................................................................................................................................... 45

1 محاسبه ميانه ...................................................................................................................................................................... 46

2 محاسبه نقاط درصدي ...................................................................................................................................................... 48

3 محاسبه رتبه درصدي ...................................................................................................................................................... 48

ج) نما .......................................................................................................................................................................................... 49

53 .......................................................................................................................................................................... ( خودآزمائي ( 4

56 ........................................................................................................................................................ ( پاسخنامه خودآزمائي ( 4

فصل پنجم _ شاخص هاي پراكندگي

الف) شاخص هاي پراكندگي در مورد داد ههاي مقياس نسبي و فاصل هاي........................................................................... 59

59 .............................................................................................................................................................. (R) 1 دامنه تغييرات

2 دامنه بين صد كها و دامنه بين ده كها...................................................................................................................... ........ 59

61 .................................................................................................................................. (A.D) 3 انحراف متوسط از ميانگين

4 واريانس و انحراف استاندارد............................................................................................................................................ 62

67 ................................................................................................................................................. (CV) 5 ضريب تغييرپذيري

ب) شاخص هاي پراكندگي در مورد داده هاي مقياس اسمي و رتب ها ي................................................................................. 67

ج) محاسبه انحراف استاندارد مركب...................................................................................................................................... 69

د) تركيب نمر هها با يك عدد ثابت و تاثير آن در شاخ صهاي پراكندگي ............................................................................. 69

ه) گشتاورهاي پيرامون ميانگين ............................................................................................................................................ 70

73 .......................................................................................................................................................................... ( خودآزمائي ( 5

75 ........................................................................................................................................................ ( پاسخنامه خودآزمائي ( 5

فصل ششم _ همبستگي و رابطه متغيرها

1 مفهوم و ضريب همبستگي ................................................................................................................................................. 76

2 نمودارهاي پراكنده................................................................................................................................................................. 77

3 روشهاي محاسبه ضريب همبستگي بين متغيرها ............................................................................................................ 80

3 روشهاي محاسبه ضريب همبستگي در داد ههاي مقياس فاصل هاي و نسبي ................................................... 80 _1

3 روشهاي محاسبه همبستگي در داد ههاي مقياس ترتيبي ..................................................................................... 86 _2

86.............................................................................................. (rS) روش اول: محاسبه ضريب همبستگي تفاوت رتب هاي

88 .......................................................................................................... (τ) روش دوم: محاسبه ضريب همبستگي كندال

عوامل موثر بر ضريب همبستگي ................................................................................................................................ ... 88

تفسير ضريب همبستگي .................................................................................................................................................... 89

3 روشهاي محاسبه همبستگي در داد ههاي مقياس طبقه اي (اسمي) .................................................................... 90 _3

4 ساير روشهاي محاسبه ضريب همبستگي........................................................................................................................ 90

90 .............................................................................................................. (rPbis) 4 همبستگي دو رشته اي نقطه اي _1

91 ................................................................................................................. (rbis) 4 ضريب همبستگي دو رشته اي _2

92 ................................................................................................................................................... (Φ) 4 ضريب فاي _3

93 ......................................................................................................................... (rt) 4 ضريب همبستگي تتراكوريك _4

95 .......................................................................................................................................................................... ( خودآزمائي ( 6

98 ........................................................................................................................................................ ( پاسخنامه خودآزمائي ( 6

بخش دوم _ آمار استنباطي

فصل هفتم _ احتمالات

1 تئوري احتمالات و مفهوم احتمال .................................................................................................................................... 103

2 احتمال وقوع يك پيشامد .................................................................................................................................................. 103

3 احتمال پيشامدهاي مركب................................................................................................................................................ 106

3 استفاده از قوانين و قضاياي مربوط به احتمالات............................................................................................. 106 _1

3 استفاده از بسط دو جمل هاي نيوت ن ..................................................................................................................... 108 _2

_ بسط دوجمل هاي نيوت ن ......................................................................................................................................... 110

_ جدول مثلث پاسكال ............................................................................................................................................. 113

4 استفاده از سطح زيرمنحني نرمال .................................................................................................................................. 113

118........................................................................................................................................................................ ( خودآزمائي ( 7

122.......................................................................................................................................................( پاسخنامه خودآزمائي ( 7

فصل هشتم _ توزيع و منحني طبيعي

مفهوم زيرمنحني طبيعي ......................................................................................................................................................... 125

سطح زيرمنحني طبيعي ........................................................................................................................................................... 125

نمره هاي تراز شده و سطح زيرمنحني طبيعي ...................................................................................................................... 126

134........................................................................................................................................................................ ( خودآزمائي ( 8

137.......................................................................................................................................................( پاسخنامه خودآزمائي ( 8

فصل نهم _ استنباط آماري

1 مفهوم استنباط آماري...................................................................................................................................................... 139

2 خصوصيات برآوردكنند هها.............................................................................................................................. 140

3 طرح كلي برآورد پارامتر .................................................................................................................................. 141

4 توزيع نمونه بردار ي .......................................................................................................................................... 141

5 خصوصيات ميانگين نمون ههاي منتخب از يك جامعه (فضيه حد مركزي) .......................................................... 142

6 خطاي استاندارد شاخ صهاي آماري................................................................................................................. 145

7 برآورد فاصله اي _ آزمون فرضيه .................................................................................................................... 148

8 منطق آزمودن فرضي هها ................................................................................................................................... 149

9 نتايج آزمون فرضيه ......................................................................................................................................... 151

10 _ كارآئي آزمون آماري..................................................................................................................................... 153

11 _ برآورد حجم (اندازه) گروه نمونه.................................................................................................................... 153

الف) برآورد حجم نمونه براي مطالعه متغيرهاي كمي ............................................................................................. 154

ب) برآورد حجم نمونه در مورد داد ههاي متغير اسمي يا طبق ه اي............................................................................ 156

157 ...................................................................................................................................................( خودآزمائي ( 9

159.......................................................................................................................................................( پاسخنامه خودآزمائي ( 9

فصل دهم _ آزمون هاي آماري (پارامتري)

1 آزمو ن آماري و انواع آن ................................................................................................................................................. 161

2 آزمو نهاي پارامتريك و پي شفرض هاي مربوط به آن .................................................................................................. 161

3 انواع آزمو نهاي پارامتر ي............................................................................................................................................... 162

3 آزمون ميانگين تك گروهي ................................................................................................................................. 162 _1

3 آزمون معني دار بودن تفاوت بين ميانگين دو گروه.......................................................................................... 167 _2

3 آزمون تفاوت ميانگين دو گروه مستقل در گرو ههاي بزرگ........................................................................... 168 _3

169......................................................... (N< 3 آزمون تفاوت ميانگين دو گروه مستقل در گرو ههاي كوچك ( 30 _4

3 آزمون تفاوت واريانس دو گروه مستقل............................................................................................................ 170 _5

براي دو گروه مستقل با واريان س هاي نابرابر ................................................................................... 172 t 3 آزمون _6

براي گروه نمونه وابسته ...................................................................................................................... 173 t 3 آزمون _7

3 آزمون تفاوت واريانس دو گروه همبسته .......................................................................................................... 176 _8

3 آزمون معن يدار بودن تفاوت ميانگين بيش از دو گروه مستقل (تحليل واريانس يك طرفه )........................ 176 _9

3 تحليل واريانس يك راهه وابسته ...................................................................................................................... 182 _10

3 مقايسه هاي پس از تجربه ................................................................................................................................. 184 _11

3 تحليل واريانس عاملي ....................................................................................................................................... 188 _12

3 آزمون معني دار بودن ضريب همبستگي ......................................................................................................... 192 _13

196..................................................................................................................................................................... ( خودآزمائي ( 10

203....................................................................................................................................................( پاسخنامه خودآزمائي ( 10

فصل يازدهم _ آزمو نهاي آماري ناپارامتري

208........................................................................................................chi-square - test χ 1 آزمون مجذور خي (كاي) 2

(S )

1 آزمون تك متغيري مجذ ور كاي ......................................................................................................................... 208 _1

1 آزمون مجذور خي در طبقه بندي هاي دو طرفي................................................................................................ 211 _2

2 آزمون تفاوت نسب تها و درصدها.................................................................................................................................. 215

2 آزمون معن يدار بودن تفاوت بين دو نسبت مستقل.......................................................................................... 215 _1

2 آزمون معن يدار بودن تفاوت بين دو نسبت همبسته........................................................................................ 217 _2

3 مقايسه گروههاي مستقل در متغير رتبه اي ...................................................................................................................... 218

مان _ وتيني ....................................................................................................................................... 218 U 3 آزمون _1

3 آزمون ميانه ......................................................................................................................................................... 221 _2

4 مقايسه بيش از دو گروه مستقل در يك متغير رتب ه اي (تحليل واريانس رتب ه اي كروسكال واليس ) .......................... 222

-5 مقايسه بيش از دو گروه از آزمونهاي يكسان و ياهمتا شده (تحليل وايانس فريدمن) در يك متغير رتب ه اي ......... 225

6 استنباط آماري در مسائل مربوط به دو مجموعه از انداز ههاي وابسته طبقه ا ي ......................................................... 226

7 استنباط آماري براي مسائل مربوط به دو مجموعه از انداز ههاي وابسته رتبه اي ...................................................... 228

228.............................................................................................................. (T) آزمون رتبه هاي علامت دار ويلكاكسون

8 آزمون تك متغيري كالموگروف اسميرنف ..................................................................................................................... 230

9 ضريب هماهنگي (تطابق) كندال ....................................................................................................................................... 231

234.................................................................................................................................................................... ( خودآزمائي ( 11

240....................................................................................................................................................( پاسخنامه خودآزمائي ( 11

فصل دوازدهم _ رگرسيون و پيش بيني

1 مفهوم رگرسيون............................................................................................................................................................... 245

225................................................................................................................................... (Z) 2 پيش بيني نمر ههاي تراز شده

3 رگرسيون به طرفه ميانگين.............................................................................................................................................. 225

4 خط رگرسيون و معادله آن............................................................................................................................................. 226

250.............................................................................................................................. Eest 5 خطاي استاندارد برآورد

6 رگرسيون چند متغيره ...................................................................................................................................................... 251

254..................................................................................................................................................................... ( خودآزمائي ( 12

256....................................................................................................................................................( پاسخنامه خودآزمائي ( 12

259.......................................................................................... « آمار توصيفي » سوال هاي چند گزين هاي مربوط به بخش اول

286................................................................................................... « آمار توصيفي » كليد و پاسخ سوال هاي بخش اول

305........................................................................................ « آمار استنباطي » سوال هاي چند گزين هاي مربوط به بخش دوم

344................................................................................................. « آمار استنباطي » كليد و پاسخ سوال هاي بخش دوم

366............................................................................................................................................ تست هاي سراسري سال 1388

جداول ضميمه ........................................................................................................................................................................ 373

خذ ........................................................................................................................................................ 408 Ĥ منابع و م

فصل اول

كليات

1 تعريف آمار و اهميت آن

واژه آمار در لغت به معني شمردن و حساب كردن است ولي علم آمار فعاليتي گسترد ه تر از شمارش و

ارائه حقايق به صورت اعداد و ارقام است . علم آمار به مجموعه اي از فنون و روشهاي علمي _ رياضي

گفته مي شود كه براي جمع آوري، ت نظيم، ارائه، و تحليل و تفسير اطلاعات كمي و كيفي و نتيج ه گيري از آنها

در جهت هدفي معين به كار مي رود. 1

علم آمار و روشهاي آن قسمتي از رو ش هاي تحقيق علوم را تشكيل مي دهد و اهل تحقيق در همه رشت ه ها

بدان نيازمندند . اما ضرورت آمار صرفاً به كار تحقيقي محدود نم ي شود. روشهاي آماري داراي دو وظيفه

هستند:

1: روش هاي آماري در طبقه بندي، خلاصه كردن، توصيف و تفسير اطلاعات جمع آوري شده و برقراري _1

ارتباط از طريق آنها، به پژوهشگر كمك مي كنند. روش هاي آماري كه براي اين وظيفه بكار مي روند آمار

توصيفي 2 ناميده مي شوند. روشهاي آمار توصيفي هميشه براي تعيين و بيان ويژگ ي ها و اطلاعاتي كه به

وسيله پژوهشگران از يك گروه نمونه آماري جمع آوري شده اند بكار برده م يشوند.

1: به پژوهشگران امكان مي دهند كه با استفاده از اطلاعات جمع آوري شده از نمونه كوچكي از _2

آزمودني ها، ويژگيهاي جامعه اي ر ا كه نمونه از آن انتخاب شده است برآورد يا استنباط كن ن د. روشهاي

آماري مربوط به اين وظيفه را آمار استنباطي 3 مي نامند. در آمار استنباطي هدف پژوهشگر عبارت از تعميم

اصول و يافته ها به نحوي است كه قادر باشد حوادث را تبيين و پيش بيني كند، بنابراين از آمار استبناط ي

مي توان از طريق يافته هاي حاصل از گرو ه هاي كوچك دربارة گرو ه هاي بزرگ به استنباط پرداخت .

صرفنظر از ارزش آموزشي آمار، مي توان مهمترين موارد اهميت آن را به ترتيب زير بيان كرد:

الف) جمع آوري و ارزشيابي اطلاعات و تعميم و كاربرد علمي و فوري آنها در جهت ايجاد س هولت و

كارآئي در فعاليتهاي روزمره

ب) كشف و جم عآوري اطلاعات براي حل مسائل عملي و تجزيه و تحليل اطلاعات موجود.

-1 روشهاي آماري در علوم رفتاري، شريفي و نجفي زند

2- descriptive Statistics

3- Inferential Statistics

فصل دوم

تنظيم و جدول بندي داده هاي آماري

پس از گردآوري داده هاي آماري لازم است كه طوري تنظيم و سازماندهي شوند كه بهتر بتوان اطلاعات

مورد نياز را به روشني و به دقت از آنها استخراج كرد . براي اين منظور نخست بايد داده ها به صورت

جدول هاي آماري تنظيم شوند . نحوة تنظيم و جدول بندي داده ها را با توجه به نوع مقياس اندازه گيري آنها

در دو بخش توضيح مي دهيم.

1 جدول بندي داده هاي مقياس اسمي و رتب هاي

جداول مربوط به اين بخش ممكن است مربوط به داده هاي يك متغيري و يا چند متغيري باشند.

1 جدول بندي داده هاي يك متغيري: _1

مراد از داده هاي اسمي يك متغيري اين است كه فقط يك صفت يا متغير در مورد افراد نمونه آماري مورد

مشاهده قرار گرفته و موارد تكرار يا فراواني آن يادداشت مي شود. در مورد داده هاي مقياس رتبه اي نيز

رتبه ها را همراه با توصيف آنها (در صورت لزوم ) به ترتيب نزولي و يا صعودي مي نويسيم و پس از

(2_ استخراج فراواني هر رتبه، نسبت و يا درصد مربوط به آن را محاسبه و ثبت مي كنيم . در جدول ( 1

توزيع فراواني يك گروه نمونه 100 نفري از دانشجويان براساس رشته تحصيلي (مقياس اسمي ) و در

2) توزيع فراواني يك گروه نمونه 80 نفري از د انشجويان برحسب ميزان تمايل به ازدواج _ جدول ( 2

براي هر يك محاسبه گرديده است. (P%) و درصدي (P) (مقياس رتبه اي) نشان داده شده و فراواني نسبي

(2_ 2) جدول ( 1 _ جدول ( 2

فراواني درصدي

P%

فراواني نسبي

P

ميزان تمايل به F فراواني

ازدواج

فراواني

P% درصدي

رشته F فراواني P فراواني نسبي

تحصيلي

45 مشاوره 0/45 20 بسيار زياد 45 0/25 25

35 روانشناسي 0/35 30 زياد 35 0/38 37/5

20 علوم اجتماعي 0/20 15 تاحدودي 20 0/19 19

Σ N=100 ΣP=1 ΣP%= 10 كم 100 0/12 12/5

5 بسيار كم 0/06 6

Σ 80 ΣP=1 ΣP%=100

فصل سوم

نمودارهاي فراواني 1

رابطه بين نمره ها و فراوانيها نخستين نتيجه اي است كه از تنظيم و بررسي داده هاي آزمايشي به دست

مي آيد اين رابطه را بصورت كلي و كيفي از جدول فراواني و بصورت دقيق و كمي از راه محاسبه مي توان

مشخص كرد.

بررسي كلي توزيع فراواني را روشن تر از آنچه در جدول فراواني گفتيم با تشكيل نمودارهاي فراواني

مي توان انجام داد. نمودار فراواني نمايش هندسي جدول فراواني است.

نمودار ابزاري تصويري است كه براي توصيف و نمايش داده هاي جمع آوري شده بكار برده مي شود. پس

از سازمان بندي كردن داده ها در جدول توزيع فراواني، نمايش آنها به وسيله نمودار به پژوهشگر كمك

مي كند تا ويژگيهاي داده ها را بهتر و آسا نتر توصيف كند و آنها را با توزي عهاي ديگر مقايسه كند.

رسم نمودارها و منحن يها 2

در اين قسمت روش ترسيم نمودارها در دو بخش توضيح داده مي شود.

1 رسم نمودارها در داده هاي مقياس نسبي و فاصل هاي:

براي رسم نمودارهاي فراواني كه نمايش هندسي جدول فراواني مي باشند از محور مختصات استفاده

مي كنيم و مقياس نمره ها را در طول و فراوانيها را در عرض محور نشان مي دهيم. در اين بخش به توضيح

روش ترسيم و استفاده از نمودارهاي چند ضلعي 3، هيستوگرام (ستوني ) 4، فراواني متراكم (تجمعي ) 5 و

اُجيو 6 يا منحني درصد فراواني متراكم 7 كه در مورد داده هاي مقياس نسبي و فاصله اي بكار برده م يشوند

مي پردازيم.

1 نمودار چند ضلعي: (چند كنج فراواني) _1

همانطوري كه قبلاً اشاره شد زماني كه داده ها داراي مقياس فا صله اي و كميت ها پيوسته هستند از اين

را برحسب (XX') نمودار استفاده مي شود. ابتدا محورهاي مختصات را رسم مي كنيم و سپس محور افقي

1- Frequency diagram

2- Curves

3- Polygon

4- Histogram

5- Cumulative frequency graph

6- Ogive

7- Cumulative percentage curve

فصل چهارم

اندازه هاي گرايش مركزي

براي آن دسته از داده ها به كار مي رود « شاخص آماري » يا « آماره » همانطوري كه قبلاً اشاره شد اصطلاح

كه در مورد يك گروه نمونه به دست آمده است . اين شاخصها نشان مي دهند كه موارد مطالعه شده به

طور كلي چگونه اند و به طور متوسط چ ه وضعي دارند . اين شاخص ها در معناي متوسط تحت عنوان

اندازه هاي گرايش مركزي مطرح مي شوند و عبارتند از:

الف) ميانگين

ب) ميانه

ج) نمايامد

هر يك از اين شاخصها به نوعي معرف مقدار متوسط يا اندازه گرايش مركزي داده ها تلقي م يشوند و ذيلاً

مورد بحث قرار م يگيرند.

: الف) ميانگين 1

اين شاخص كه براي بيان و توصيف داده هاي كمي بيش از ساير اندازه ها به كار مي رود به سه صورت

مطرح مي شود

1 ميانگين حسابي 2

2 ميانگين هندسي 3

3 ميانگين همساز 4

اينك به توضيح هر يك از آنها مي پردازيم:

1 ميانگين حسابي:

نشان مي دهند ميانگين از طريق M يا X ميانگين حسابي را براي سهولت ت نها ميانگين مي نامند و با

محاسبه خارج قسمت مجموع نمره ها بر تعداد آنها به دست مي آيد.

(4_1) n

X

X Σ =

1- Mean

2- Arithmetic Mean

3- Geometric Mean

4- Harmonic Mean

فصل پنجم

شاخص هاي پراكندگي 1

در فصل 4 موارد استفاده از شاخصهاي مركزي كه براي تعيين مقدار متوسط توزيع نمره ها به كار برده

مي شود مورد بحث قرار گرفت، اما براي توصيف كامل تر خصوصيات آماري نمره ها بايد به نحوة

پراكندگي داده ها حول ميانگين يا ميانه نيز توجه كرد. پراكندگي يكي از ويژگيهاي عمومي توزيع نمره ها

است كه پژوهشگران در صدد مطالعه آنها هستند . به عنوان مثال ميانگين نمره ها در سه گروه 5 نفري ذيل

برابرند اما نم يتوان گفت كه شاگردان سه گروه بطور كلي همقوه اند.

12-11-10-9- گروه اول: 8

17-15-7-6- گروه دوم: 5

20-19-6-4- گروه سوم: 1

گروه اول شامل شاگردان متوسط، گروه دوم شامل شاگردان ضعيف و قوي و گروم سوم از شاگردان

بسيار قوي و بسيار ضعيف تشكيل شده است . فرقي كه بين اين گروه ها وجود دارد و ميانگين آنرا نشان

نمي دهد چگونگي توزيع نمره ها در اطراف مقدار متوسط است . اين خ صوصيت را در آمار پراكندگي 2

5 دو منحني فراواني نشان مي دهد كه ميانگين هر دو 10 است اما پراكندگي آن ها با هم _ مي نامند. شكل 1

از 5 تا 15 است) B پراكندگي از صفرتا 20 و در منحني A اختلاف فاحش دارند (در منحني

5_ شكل 1

1- Variability

2- Dispression

فصل ششم

همبستگي

1 مفهوم همبستگي 1

در فصلهاي پيشين، توصيف يك متغير مورد توجه قرار گرفت . اما در پژوهش موقعيت هاي فراواني يافت

مي شود كه در آنها دو يا چند متغير وجود دارد و منظور از بررسي متغيرها مشخص كردن روابط موجود

بين اين متغيرهاست . بين برخي از متغيره ا رابطه مستقيم وجود دارد . هنگامي كه افزايش در يك متغير با

افزايش در متغير ديگر، يا كاهش يك متغير يا كاهش متغير ديگر همراه باشد همبستگي بين آنها مستقيم و

مثبت است (مثلاً همبستگي بين هوش و پيشرفت تحصيلي دانش آموزان). چنانچه افزايش در يك متغير با

كاهش در متغي ر ديگر همراه باشد همبستگي بين دو متغير منفي و معكوس است (مثلاً همبستگي بين سن و

قدرت حافظه افراد بزرگسال)

ضريب همبستگي 2

اندازه همبستگي بين متغيرها ضريب همبستگي ناميده مي شود. ضريب همبستگي براي اولين بار توسط

فرانسيس گالتون به شكل نمودار پديد آمد و سپس كارل پيرسون روش محاسبه آن را پيدا كرد . ضريب

همبستگي يك عدد جبري است كه علامت آن جهت همبستگي و قدرمطلق آن ميزان همبستگي را نشان

−1 ) . اين ضريب ≤ Rxy ≤ + مي دهد. مقدار ضريب همبستگي از 1- تا صفر و از صفر تا 1+ است ( 1

چنانچه 1+ يا نزديك به آن باشد همبستگي كا مل مثبت يا رابطه خيلي زياد مستقيم را مي رساند و چنانچه

-1 يا نزديك به آن باشد همبستگي كامل منفي يا خيلي زياد معكوس را معرفي مي كند اگر ضريب همبستگي

صفر و يا نزديك به آن با شد نبودن رابطه بين دو متغير را معلوم مي كند (مثلاً بين قد و اجتماعي بودن

ضريب همبستگي در حدود صفر است زيرا بلندي يا كوتاهي قد تاثيري در اجتماعي بودن ندارد).

وجود همبستگي بين متغيرها به آن معني نيست كه يك متغير علت متغير ديگر است . در آمار همبستگي به

رابطه بين دو يا چند متغير كه قابل تبديل به مقدار هستند اطلاق مي شود و معني آن اين است كه م ي توان با

را پيش بيني كرد . همبستگي رابطه بين دو متغير را در يك جامعه توصيف Y مقدار X معلوم بودن متغير

مي كند. مي توان از همبستگي براي تعيين رابطه دو متغير در گروهي از افراد و همچنين براي دو گروه

1- Correlation

2- Correlation Coefficient

فصل هفتم

احتمالات

1 تئوري احتمالات و مفهوم احتمال

مقادير آماري كه از يك گروه نمونه بدست مي آيند شاخصهاي توصيفي بشمار مي روند . به وسيله اين

شاخصها، داده هاي تجربي را بطور خلاصه بيان مي كنيم. به عنوان مثال ميزان تصادف يك پديده را كه

چند بار تجربه كرده ايم با يك شاخص مقدار متوسط (ميانگين، ميانه و يا نما ) نشان مي دهيم و يا

پراكندگي هائي را كه در اين پديده مشاهده كرده ايم با يك شاخص تغييرپذيري (دامنه تغيير، دامنه دهكها و

صدكها، انحراف متوسط از ميانگين و يا واريانس و انحراف استاندارد ) اندازه گيري مي كنيم و بالاخره

رابطه اين پديده را با يك پديده وابسته ديگر به وسيله ضريب همبستگي بيان مي كنيم.

از آنجا كه اين بررسي هاي توصيفي اصولاً محدود به مواردي است كه در آنها تجربه و آزمايش بعمل

آمده است، بنابراين نتيجه آنها از كليت و اعتبار يك قاعده علمي برخوردار نيست . فايده علمي شاخصهاي

توصيفي بستگي به اين دارد كه تا چه ميزان بتوان از آنها براي بيان قواعد و روابط كلي استفاده كرد.

در آمار استنباطي پس از توصيف نتايج عيني آزمايش بايد به تحليل آن پرداخت . هدف از اين تحليل در

اصل آن است كه احتمال درست بودن محتواي شاخصهاي توصيفي معين شود . به بيان ديگر هدف هر

تحليل آماري آن است كه به نتايج يك تحقيق مشخص و محدود عموميت داده و وسيله پيشگوئي علمي در

موارد مشابه قرار گيرد . بايد بدانيم كه اطلاعاتي را كه از يك گروه نمونه بدست م ي آيد فقط با احتمال

معيني مي توان پذيرفت . بهمين سبب پايه و اس اس آمار استنباطي بر اصول احتمالات نهاده شده است . با

توجه به اين نكته، آشنائي با برخي از قوانين مقدماتي احتمالات و اصول و مفاهيم آن به ويژه براي درك

بهتر مدلهاي آماري (مانند توزيع دوجمله اي و نرمال) ضرورت دارد.

تئوري احتمالات

از آنجا كه نمي توانيم همه شرايط ي را كه پاره اي از پيشامدها به آن بستگي دارد تشخ يص دهيم، علت وقوع

اين پيشامدها و يا عدم وقوع آنها را نمي توانيم با دقت پيش بيني كنيم. به پيشامدهائي كه علت آنها بر ما

گفته مي شود. اگر بتوانيم پيشام دها را با « تصادفي » ، معلوم نيست و پي آمد آنها را نمي توان پيش بيني كرد

استفاده از قانون توجيه كنيم ديگر تصادفي نخواهند بود . بنابراين شانس و يا تصادف برحسب تعريف به

ظاهر عدم حضور قانون را مي رساند. مع الوصف بايد دانست كه پيشامدهاي تصادفي با وجود غيرقابل

پيش بيني بودن از قوانين معيني پيروي مي كنند كه در تئوري احتمالات مورد بررسي قرار مي گيرند .

فصل هشتم

توزيع و منحني طبيعي

1 مفهوم منحني طبيعي

در فصل مربوط به احتمالات وقتي كه دربارة روش تقريب منحني نرمال بحث شد اشاره مختصري به

منحني نرمال و رابطه سطح زير منحني با ميانگين و انحراف استاندارد توزيع بعمل آمد با توجه به اهميت

موضوع در اين فصل نيز بطور مبسوط به بررسي و مطالعه آن مي پردازيم.

در توزيع بهنجار بيشتر داده ها حول مركز (ميانگين) توزيع انباشته شده و هر چه به طرفين پيش رويم

بتدريج از تراكم كاسته مي شود، بهمين جهت شكل منحني توزيع، طبيعي و زنگوله اي است و اندازه ميانگين،

ميانه و نما يكسانند . اين منحني در هر دو سطح نامحدود است يعني هر اندازه كه امتداد يابد هرگز محور

ها را قطع نمي كند. مساحت زير منحني (مجموع نسبتها ) مساوي با يك است . طول منحني از ∞- تا ∞+ و X

0 است. / عرض آن در نقطه ميانگين برابر 3989

2 سطح زيرمنحني طبيعي:

تعداد كل حوادث است كه 50 درصد آن در بالا و 50 درصد ديگر N سطح كل زير منحني نرمال برا بر با

تهيه شده است σ= و 1 N= در پائين ميانگين قرار مي گيرد. با توجه به آنكه جدولهاي منحني نرمال براي 1

هاي مختلف است استفاده كنيم لازم σ و N اگر بخواهيم از اين جدولها براي پاسخ به مسائلي كه شامل

را استاندارد محاسبه كنيم . همانطوريكه قبلاً اشاره شد نمره استاندارد از σ و N است ك ه مقادير مختلف

طريق فرمول

x Sx

x

S

Z X X =

= قابل محاسبه است (اين فرمول را در مورد داده هاي منحني نرمال

σ بصورت

−μ

مي توان نوشت) Z = X

يكي از خواص عمده منحني نرمال رابطه واحد انحراف استاندارد توزيع و سطح زير منحني است بدين معني

كه سطح زير منحني با واحدهاي انحراف استاندارد به نسبتهاي ثابت و مشخصي به شرح زير تقسيم م يشود:

0) موارد يا افراد بين ميانگين و يك انحراف / 34 درصد ( 3413 / الف _ در يك توزيع نرمال حدود 13

استاندارد بالا (و يا پائين) ميانگين قرار مي گيرند.

(μ → ±1σ)=34/13 %

(-1σ → +1σ)=68/26 %

⎠⎟ درصد 68 بنابراين حدود

⎜⎝

3

2

موارد يا افراد در يك توزيع نرمال بين يك انحراف استاندارد زير تا يك

انحراف استاندارد بالاي ميانگين قرار دارند و به آنها افراد متوسط اطلاق مي شود.

فصل نهم

استنباط آماري

1 مفهوم استنباط آماري

مردم در جريان فعاليت هاي روزمره معمولا براساس آگاهي هاي محدود در مورد خود، ديگران و جه ان

اطراف به داوري و ارزشيابي م ي پردازند، هر چند كه ظاهرا برخورد و رفتار آنان حاكي از واقعي بودن

اطلاعات در مورد جامعه مور د نظر است ولي از نظر عيني و دقيق بودن، اطلاعات مورد نظر ممكن است

مبين خصوصيات اصلي جامعه بوده و بنابراين معتبر باشند و يا فاقد ويژگيهاي جامعه اصلي بوده و

درنتيجه فاقد اعتبار تلقي شوند . آماردانان و محققان علوم رفتاري بمنظور استنباط صحيح و معتبر

خصوصيات جامع ه موردنظر، سعي مي كنند نمونه مورد مطالعه هر چه بيشتر معرف جامعه تعريف شده

باشد. به همين جهت آنان در پژوهش هاي خود از مدلهاي استنباط آماري خاصي تبعيت مي كنند.

در مدل استنباط آماري چنين فرض مي شود كه مي خواهيم در مورد يك مجموعه خيلي وسيع كسب

اطلاعات كنيم (مثلا نمره پيشرفت تحصيلي درس علوم تجربي دانش آموزان كلاس سوم راهنمائي در

سراسر كشور ). به اين مجموعه خيلي بزرگ جمعيت يا جامعه گفته مي شود . گاهي حجم جامعه آن قدر

بزرگ و وسيع است كه امكان مطالعه تمام آن وجود ندارد به همين جهت از اين كل، يك زير مجموعه

بعنوان نمون ه انتخاب م ي شود. اين زير مجموعه را كه شامل تعداد محدودي از اعضاء جامعه مورد نظر

است گروه نمونه آماري مي نامند.

بمنظور استنباط خصوصيات جامعه براساس خصوصيات نمونه، مدل آماري ايجاب مي كند كه افراد گروه

نمونه بصورت تصادفي انتخاب شوند . روش نمونه گيري وقتي تصادف ي است كه همه افراد جامعه به يك

اندازه، شانس انتخاب شدن و شركت در گروه نمونه آماري را داشته باشند . بعلاوه انتخاب هر فرد مستقل

از افراد ديگر صورت گيرد . محقق با فرض انتخاب تصادفي آزمودنيها يك موقعيت مناسب براي تعميم

يافته هاي حاصل از مطالعه نمونه را به دست مي آورد.

براي استنباط در مورد يك جامعه بايد خصوصيات مربوط به آن (مقادير متوسط و يا پراكندگي ) با

استفاده از خصوصيات گروه نمونه توصيف شود . در آمار به مقاديري كه خصوصيات جامعه را توصيف

مي كند پارامتر گويند بنابراين به اندازه ميانگين، واريانس، انحراف معيار و ... جامعه پارامتر اطلاق مي شود

و متقابلا به مقاديري كه خصوصيات گروه نمونه را بيان مي كنند (نظير ميانگين، واريانس و انحراف معيار )

شاخص آماري و يا آماره گفته مي شود. بمنظور تميز بين مفهوم پارامتر و شاخصهاي آماري معمولا

فصل دهم

آزمون هاي آماري پارامتريك

1 آزمون هاي آماري و انواع آنها

از ميان همه دانشجويان دانشگاههاي n= هرگاه تعداد زيادي از پژوهشگران نمونه هائي با حجم مثلا 50

ايران انتخاب و قد را آنها اندازه گيري كنند ميانگين قد نمونه هاي منتخب با هم مساوي نخواهند بود. ميانگين

قد بعضي از نمونه ها نسبتاً زياد و برخي ديگر نسبتاً كم است اما ميانگين بيشتر نمونه ها حول ميانگين

جامعه انباشته خواهد شد . اين تغييرپذيري در ميانگين ها از خطاي نمونه گيري ناشي مي شود كه صرفاً

بيانگر تغييرپذيري تصادفي است كه بطور اجتناب ناپذيري در م حاسبه ميانگين بعضي از نمونه ها تاثير

مي گذارد. بهمين جهت پذيرفتن اين فرض كه ميانگين هر يك از نمونه ها احتمالاً با ميانگين جامعه تفاوت

دارد منطقي خواهد بو د. از آنجا كه استنباط آمارشناسان از جامعه تنها بر خصائص يك نمونه استوار

است بنابراين تغييرپذيري ميانگين نمونه ها ظاهراً به صورت يك مشكل جدي به نظر مي رسد . اما چون

ماهيت آنها مشخص است برآورد تغييرپذيري ميانگين نمونه ها براساس احتمالات از طريق اجراي

آزمون هاي آماري امكان پذير خواهد بود.

آزمون هاي آماري روش هائي هستند كه بمنظور بررسي ميزان دقت و اعتبار داد ه هاي آماري و يا به بيان

ديگر تعيين ميزان تاثير خطاي نمونه گيري در برآورد پارامتر جامعه براساس شاخص هاي آماري نمونه

بكار مي روند و بطور كلي بر دو گونه اند : پارامتر يك و ناپارامتر يك . در اين فصل به توضيح انواع

آزمونهاي پارامتر يك و موارد كاربردي آنها مي پردازيم.

2 آزمون هاي پارامتريك و پيش فرضهاي مربوط به آن

آزمون هاي پارامتري را مي توان موثرترين آزمون ها دانست كه در غالب موارد در تعميم نتايج حاصل از

گروه نمونه به جامعه آماري مورد استفاده قرار مي گيرند. مشروط بر اينكه پيش فرض هاي زير در مورد

آنها رعايت شود:

1 هر يك از موارد مشاهده شده مستقل است . يعني انتخاب يك مورد به انتخاب هيچ مورد ديگري وابسته

نيست.

2 واريانس نمونه ها برابر يا تقريباً برابر است . رعايت اين نكته در نمونه هاي با حجم كم اهميت بيشتري

دارد.

3 توصيف متغيرها براساس مقياس هاي نسبي و يا فاصله اي انجام مي گيرد.

فصل يازدهم

آزمون هاي ناپارامتريك

تحت عنوان آزمون هاي پارامتري مورد بحث قرار گرفتند و ديديم كه اين F و t ، Z قبلاً آزمون هاي

آزمون ها بر طبيعي بودن توزيع متغير در جامعه مبتني هستند و بعلاوه داده هاي مربوط به آنها از نوع

پيوسته و منظم بوده و به عبارت ديگر داراي مقياس اندازه گيري نسبي و يا فاصل هاي م يباشند.

گاهي در پژوهش ها داده هائي جمع آوري مي شوند كه داراي مقياس اسمي يا رتبه اي هستند و يا ممكن است

داده ها داراي مقياس فاصله اي باشند ولي توزيع داده ها در جامعه طبيعي نيست در چنين مواردي

پژوهشگر ملزم به اس تفاده از آزمونهاي غير پارامتريك است . اين آزمونها در كليه مواردي كه پژوهشگر

نمي تواند از آزمونهاي پارامتريك استفاده كند ابزار مناسبي براي آزمون فرضيه ها هستند بطور كلي

مي توان گفت كه اين آزمونها در مورد داده هائي به كار مي روند كه:

1 مقياس اندازه گيري آنها اسمي و يا رتبه اي باشد (از نوع داده هاي ناپيوسته و يا منفصل و بنابراين

حاصل شمارش هستند).

2 بر نرمال بودن توزيع در جامعه استوار نيستند.

مهمترين آزمون هاي ناپارامتري عبارتند از:

χ 1 آزمون مجذور كاي (مجذور خي) 2

2 آزمون نسبت ها و درصدها

3 آزمون ميانه

مان وتيني U 4 آزمون

5 آزمون نشانه

6 آزمون رتبه هاي علامت دار ويل كاكسون

(H) 7 آزمون كروسكال واليس

8 آزمون كالموگروف اسميرنف

اينك به توضيح هر يك از اين آزمون ها مي پردازيم:

فصل دوازدهم

رگرسيون و پيش بيني

1 مفهوم رگرسيون

با استفاده از Y رابطه وجود داشته باشد، مي توان نمره فردي را در متغير Y و X هرگاه بين دو متغير

با ميزان موفقيت (X) برآورد يا پيش بيني كرد. به عنوان مثال چنانچه هوش يك دانش آموز X متغير

همبستگ ي مثبت داشته باشد، مي توان پيش بيني كرد كه دانشجوئي كه نمره هوشي او از (Y) تحصيلي او

حد متوسط بالاتر است در دوره تحصيل نيز موفقيت تحصيلي و پيشرفت درسي او از ميانگين بالاتر

خواهد بود . در اين مثال از نمره هوشي به عنوان يك متغير پيش بيني كننده براي برآورد ميزان موفقيت

تحصيلي استفاده شده است . هر چه شدت همبستگي دو متغير بيشتر باشد، دقت پيش بيني نيز افزايش پيدا

مي كند. اگر همبستگي دو متغير كامل ( 1 ±) باشد در آن صورت پيش بيني كامل و دقيق امكا ن پذير خواهد

بود.

: (Z) 2 پيش بيني نمر ههاي تراز شده

روش پيش بيني كردن نمره هاي تراز ش ده ابتدائي ترين روشي است كه با استفاده از ضريب همبستگي

و متغيري را (Y) پيرسون براي پيش بيني به كار برده م ي شود. متغيري را كه مي خواهيم پيش بيني كنيم با

نشان مي دهيم . در اين روش بين متغيرها و ضريب (X) كه پيش بيني از طريق آن صورت مي گيرد با

12 ) برقرار است. _ همبستگي آنها رابطه ( 1

ZY = (ZX) (rXY) (12_1)

0 و نمره تراز شده / برابر 50 (Y) و آمار (X) مثال: اگر ضريب همبستگي بين نمرات درس رياضي

باشد نمره تراز شده آمار او برابر است با: ZX = +1/ رياضي دانش آموزي 60

ZY = 1/ 60 ×0/ 50 = +0/ 80

را. X را پيش بيني كرد و هم نمره تراز شده Y تبصره: از فرمول مذكور مي توان هم نمره تراز شده

3 رگرسيون به طرف ميانگين

اگر بين متغيرها همبستگي كامل نباشد، پيش بيني دقيق امكان پذير نخواهد بود، زيرا در چنين شرايطي

نمره هاي پيش بيني شده به طرف ميانگين نمره گرايش پيدا مي كنن د. اين پديده تاثير رگرسيون ناميده

مي شود و چون غالباً رگرسيون به طرف ميانگين دومين متغير است آنرا رگرسيون در اطراف ميانگين

آمار توصيفي و استنباطي 􀀟 366

-1 پديده رگرسيون تحت كدا ميك از حال تهاي زير، به طور كامل اتفاق م يافتد؟

r = +1 (4 r = 0/ 50 (3 r = 􀁄 (2 r = −1 (1

-2 در يك توزيع غيرنرمال، براي محاسبه ميزان پراكندگي، كدام شاخص مناسب تر است؟

1) واريانس 2) تفاضل چارك ها 3) انحراف چاركي 4) انحراف استاندارد

-3 چنانچه در يك نمونه 25 نفري، مقدار ميانگين نمونه از پارامتر بيشتر و فرضيه صفر رد شده

باشد، كدام رابطه درست است؟

tob ≥ tα (4 Zob > tα (3 Zob ≥ Zα (2 Zob > Zα (1

-4 اگر دو متغير داراي توزيع نرمال بوده ولي نمرات آنها فقط به صورت دو مقول ه اي (صفر و ي ك )

در دسترس باشد، با كدام روش همبستگي م ي توان ميزان ارتباط اين دو متغير را به درستي

سنجيد؟

1) تتراكوريك 2) رتبه اي 3) پيرسون 4) في

-5

2

3

قرار مي گيرند؟ (Z) از مساحت زير منحني نرمال در كدام دامنه نمرات استاندارد

(− 2 , 2) (1

3 3

(−1,1) (4 (−2,2) (3 (−3,3) (2

-6 خطاي طبق هبندي هنگامي بيشتر م يشود كه فاصله طبقات ............ و تعداد طبقات نيز ............ باشد.

1) زياد - كم 2) كم - زياد 3) زياد - زياد 4) كم - كم

-7 انحراف استاندارد بر كدام ويژگي يا شاخص توزيع فراواني تأثير دارد؟

1) كجي 2) نما 3) ميانگين 4) كشيدگي

حاصل مي شود؟ n1 + n2 − -8 در كدام آزمون آماري، مقدار درجه آزادي از طريق 2

1) مقايسه دو ميانگين همبسته 2) مقايسه دو ميانگين مستقل

3) مقايسه ميانگين با يك ارزش ثابت 4) آزمون آماري دو نسبت

تبديل كرده ايم. نمره Z -9 نمرات 30 دانش آموز را در دو درس تعيين و آنها را به نمر ه ي استاندارد

دانش آموزان در هر دو امتحان دقيقاً برابر شده است. ضريب همبستگي دو توزيع كدام است؟ Z

1) صفر

+0/50 (2

+1 (3

4) بدون داشتن نمرات و انجام محاسبه، تعيين آن ميسر نيست.

تست هاي علوم تربيتي 1 و 2 و روانشناسي سراسري 1388

جداول ضميمه

+ نوشته شده در  چهارشنبه 1 آذر1391ساعت   توسط محمد حسین ضرغامی  | 

جدول ماتریس همبستگی را ترسیم و انواع همبستگی را ذکر کنید؟

جدول ماتریس همبستگی را ترسیم و انواع همبستگی را ذکر کنید؟

قبل از پاسخ به سوال،شرح مختصری از تحلیل رابطه همزمانی متغیرها و ارائه تعریفی از رابطه متقارن و همزمانی لازم و مفید است.

*تحلیل رابطه همزمانی متغیرها:

به منظور پی بردن به رابطه بین تغییرات دو یا چند متغیر که همزمان اندازه گیری شده اند،تحلیل رابطه همزمانی مورد استفاده قرار می گیرد.برای پی بردن به میزان رابطه شاخص های همبستگی بکار برده می شود.این نوع شاخصها با توجه به مقیاس اندازه گیری متغیرها انتخاب می گردد.شاخص های رابطه میان متغیرها را به طور کلی می توان به دو دسته پارامتری و ناپارامتری تقسیم کرد.

محاسبه همبستگی برای تحقیقات پارامتری

چنانچه دو متغیر در مقیاس‏های فاصله‏ای یا نسبی اندازه گیری شده باشند، می‌توان برای تعیین رابطه بین آنها از ضریب همبستگی گشتاوری پیرسون استفاده کرد. در محاسبه ضریب همبستگی پیرسون پیش فرض اینست که دو متغیر دارای توزیع دومتغیری بهنجار باشد. درصورتی که این پیش فرض صادق نباشد از روش های دیگری استفاده می‏کنیم که به شرح ذیل می باشد(سرمد و همکاران،1390 ،ص222).


جدول1- ضریب های همبستگی دومتغیری در تحلیل های پارامتری

ضریب همبستگی نماد متغیر 1 متغیر 2 مقیاس اندازه گیری

ضریب همبستگی گشتاوری پیرسون r پیوسته پیوسته هر دو متغیر فاصله‏ای

ضریب همبستگی دورشته‏ای دو سطحی ساختگی پیوسته یک متغیر اسمی دو سطحی و دیگری فاصله‏ای

ضریب همبستگی دورشته‏ای نقطه‏ای دو سطحی واقعی پیوسته یک متغیر اسمی دو سطحی و دیگری فاصله‏ای

ضریب همبستگی تتراکوریک دو سطحی  ساختگی دو سطحی  ساختگی هر دو متغیر اسمی دو سطحی

حسین چهارباشلو دانشجوی دکتری دانشگاه خوارزمی

+ نوشته شده در  یکشنبه 21 آبان1391ساعت   توسط محمد حسین ضرغامی  | 

علت رخداد کجی و کشیدگی در توزیعات چیست؟ و برای برون رفت از آن چه راهکاری وجود دارد؟

علت رخداد کجی و کشیدگی در توزیعات چیست؟ و برای برون رفت از آن چه راهکاری وجود دارد؟

در نگاه نخست برای پاسخ به این سوال ،به ارائه تعریفی از توزیع نرمال،کجی و کشیدگی به ترتیب خواهیم پرداخت:

* توزیع نرمال یا متقارن توزیعی است که در آن مد، میانه و میانگین برابر است.

* در تعریف کجی باید گفت :کجی یعنی انحراف یک منحنی از حالت تقارن.کجی به سه صورت است،در حالتی کجی صفر است که منحنی متقارن باشد.در توزیعهای متقارن فاصله بین چارک اول تا میانه با فاصله بین چارک سوم تا میانه مساوی است. در حالت کجی منفی مد بزرگتر از میانه و میانه بزرگتر از میانگین است(بیانگر این است که افراد زیادی نمره ی بالایی گرفته اند و بنابراین امتحان ساده بوده است). در حالت کجی مثبت نیز میانگین بزرگتر از میانه و میانه بزرگتر از مد است(یعنی آزمون دشوار بوده است).به دیگر سخن، کجی یا چولگی زمانی ایجاد می شود که منحنی مشاهدات متقارن نباشد. اگر سمت راست منحنی مشاهدات طول بیشتری نسبت به سمت چپش داشته باشد مشاهدات کجی مثبت دارند یا چوله به راستند. در این حالت مشاهدات کوچکتر از نما (مد) تنوع عددی کمی دارند ولی فراوانی های بزرگی دارند ولی مشاهدات بزرگتر از نما تنوع عددی زیادی دارند ولی فراوانی هایشان کوچک است. اگر سمت چپ منحنی مشاهدات طول بیشتری نسبت به سمت راستش داشته باشد مشاهدات کجی منفی دارند یا چوله به چپند. این حالت عکس حالت قبل است. یعنی مشاهدات کوچکتر از نما پر تنوعند با فراوانی های کوچک و مشاهدات بزرگتر از نما کم تنوعند با فراوانی های بزرگ. 

* کشیدگی:هنگامی که مقدار کشیدگی برابر صفر باشد توزیع نمره ها طبیعی است یعنی در شکل توزیع که بلند و رو به بالاست، نمرات نزدیک به هم یا یکسان می باشند و واریانس کم است.در صورتی که کشیدگی مثبت باشد برآمدگی منحنی توزیع نمره ها در نقطه اوج قرار خواهد گرفت. در شکل توزیع مسطح که کشیدگی منفی دارد، نمرات دور از هم‌ قرار دارند و واریانس زیاد است. ميزان كشيدگي يا پخي منحني فراواني را نسبت به منحني نرمال استاندارد، برجستگي آن مي نامند. به عبارتی دیگر،کشیدگی زمانی ایجاد می شود که پراکندگی مشاهدات بیشتر از پراکندگی مشاهدات نرمال باشد که در این صورت منحنی مشاهدات پهن تر از منحنی نرمال خواهد بود و تاجش نیز پایین تر از تاج منحنی نرمال خواهد بود. از طرفی اگر پراکندگی مشاهدات کمتر از پراکندگی مشاهدات نرمال باشد منحنی مشاهدات جمع تر از منحنی نرمال و تاجش نیز بالاتر از تاج منحنی نرمال خواهد بود. حالت اول را کشیدگی مثبت و دومی را کشیدگی منفی گوییم(دلاور،1383،ص103). 


علت رخداد:

ویژگی های غیرنرمال بودن توزیع بدین صورت است: داده هایی که دارای کجی هستند یا در قسمتی از مقیاس اندازه گیری به شدت مجتمع شده اند، واریانس- کوواریانس میان متغیرها را تحت تاثیر قرار می دهند، بعلاوه کشیدگی در داده ها، آماره ها را متاثر می کند. داده های لپتوکوریک (کشیده) در مقایسه با یک توزیع نرمال متقارن، کشیده ترند. درحالی که داده های پلاتی کوریک (پهن) در مقایسه با آن پهن تر و مقادیر در طول محور x پراکنده اند، اما بر روی محور y دارای فراوانی کمی هستندکه منجر به ظاهر شدن توزیع فراوانی به شکل یک مستطیل است. داده های غیرنرمال به دلایلی نظیر مقیاس سازی متغیرها( رتبه ای به جای فاصله ای)، نمونه گیری محدود از موارد تحت مطالعه و یا داده های انتهایی و دور افتاده رخ می‏دهد (قاسمی،1390 : 46).

راه برون رفت:

راه حل‏های ممکن برای کجی و کشیدگی، پیرایش نمونه‏ها و یا اجرای یک تبدیل خطی مجاز نظیر تبدیل های ریشه دوم، معکوس، لجیت یا پروبیت است که  به شرح هر یک می‏پردازیم:

1-تبدیل‏ها: در مواردی می‏توان از تبدیل ها استفاده کرد که بین میانگین و واریانس گروه ها رابطه ای وجود داشته وشکل توزیع خطا در تمام آنها یکسان باشد. متداولترین تبدیل هایی را که می توان بکاربرد عبارتند از تبدیل جذری (ریشه دوم)، تبدیل لگاریتمی، تبدیل معکوس و تبدیل قوس سینوسی (آرک سینوس) تصمیم درباره اینکه کدام تبدیل را باید بکاربرد براساس بررسی رابطه بین واریانس‏ها و میانگین‏های متغیر آغاز می‏شود. ماهیت این رابطه تعیین می‏کند که کدام تبدیل را بکار برد (فرگوسن و تاکانه،1383: 326).

تبدیل جذری: هرگاه متغیر وابسته فراوانی وقوع حادثه ای با احتمال خیلی کم باشد، از تبدیل جذری می توان استفاده کرد. این تبدیل هنگامی مناسب است که واریانس‏ها با میانگین‏ها متناسب باشند.

تبدیل لگاریتمی: در مواردی که بعضی از نمرات صفر و یا خیلی کوچک باشند، از این تبدیل استفاده می‏شود. استفاده از این تبدیل در مواردی که توزیع متغیر وابسته، کج مثبت باشد مفید است.

تبدیل معکوس: چنانچه مجذور میانگین گروه‏ها متناسب با واریانس گروه‏ها باشد یک تبدیل معکوس مناسب است. در مواقعی که یکی از نمرات صفر باشد از تبدیل دوم استفاده می‏کنیم.  

تبدیل قوس سینوسی: در مواردی که واریانس ها متناسب با میانگین ها باشند و توزیع دو جمله‏ای باشد از این تبدیل استفاده می کنیم.

2-پیرایش نمونه ها: روش دیگر برای ایجاد همگنی واریانس ها و نرمال بودن، پیرایش نمونه هاست. در مواقعی که توزیع پهن بوده، توزیع فراوانی مشاهدات در دنباله ها سنگین است و یا بعبارت دیگر تعداد مشاهدات در دنباله‏ها بصورت غیرمعمولی زیاد است، درصدی از نمونه ها در دنباله ها برداشته می شود.

روش دیگری که با پیرایش نمونه ها ارتباط دارد، وینزوری کردن نمونه هاست که در آن مقادیر پیرایه شده با مقادیر ماقبل آنها جایگزین می شود و تغیری در تعداد نمونه صورت نمی گیرد (سرمد،1388: 146-144).

حسین چهارباشلو: دانشجوی دکتری برنامه ریزی درسی دانشگاه خوارزمی

+ نوشته شده در  یکشنبه 21 آبان1391ساعت   توسط محمد حسین ضرغامی  | 

نمودارها و مفاهيم نزديك به توزيع تك متغيري

به نام خدا

  نام و نام خانوادگی:حسین چهارباشلو                                                                          تاریخ:  24/7/1391

  در توزیع تک متغیری با چه سوالاتی روبرو هستیم؟ توضیح تفضیلی.

پاسخ 

با توجه به اینکه هدف توزیع‏های تک متغیری اینست که تغییرات متغیرها را بطور جداگانه در جامعه معینی توصیف کند، باید وضعیت جامعه را نسبت به آن متغیر بدانیم. بنابراین باید به سوالات زیر پاسخ دهیم:


1- الگوی کلی داده ها چگونه است؟(جدول و نمودار)

جدول توزیع فراوانی:

یکی از کارآمدترین روشها برای خلاصه و سازمان بندی کردن اطلاعات جدول توزیع فراوانی می باشد.توزیع فراوانی عبارت است از سازمان دادن به اندازه ها یا مشاهده ها به وسیله در آوردن آنها در قاب طبقه ها همراه با ذکر فراوانی هر طبقه.یکی از نقاط ضعف نمایش داده ها به وسیله جدول فراوانی این است که اطلاعات جدول رو نمی توان به سرعت درک کرد.بنابراین به منظور دریافت تصویر روشن تری از داده های جمع آوری شده از نمودار استفاده می شود.

نمودار و انواع آن:

نمودار ابزاری تصویری است که برای توصیف و نمایش داده های جمع آوری شده به کار برده می شود.پس از سازمان بندی کردن داده ها در جدول توزیع فراوانی،غالبا نمایش آن ها به وسیله نمودار به پژوهشگر کمک می کند تا ویژگیهای داده ها را بهتر و آسان تر توصیف کند.

برای بررسی نمایش گرافیکی داده ها بصورت نمودار می توانیم از نمودارهای زیر استفاده کنیم: 

نمودار ستونی

رایج‌ترین نوع نمودارها، نمودار ستونی افقی یا عمودی است که از نظر خواندن، ساده‌ترین نوع نمودار است. تهیه این نوع نمودار نیز بسیار آسان است، به این ترتیب که هر دسته از اطلاعات را در یک ستون قرار می‌دهیم. از نمودار ستونی بیشتر برای مقایسه استفاده می شود که ستون‌ها را با گذاشتن فاصله‌هایی میان آنها از هم جدا می‌کنند. این ستون‌ها یا همگی افقی هستند یا عمودی، برای مقایسه اجزاء تشکیل‌دهنده یک کمیت در یک زمان معین از ستون‌های افقی استفاده می‌شود و برای مقایسه اجزا در زمان‌های مختلف ستون‌های عمودی به کار می‌رود.به دیگر سخن،از این نمودار زمانی استفاده می شود که داده های جمع آوری شده به متغیرهای گسسته تعلق داشته باشند و با استفاده از مقیاس اسمی اندازه گیری شده باشند.

نمودار خطی

هنگامی که داده‏ها به صورت پیوسته باشد باید از نمودارهای خطی استفاده کرد. ساده ترین نوع نمودار می‏باشند.همچنین در نشان دادن ارتباط میان دو سری اطلاعات بسیار مفید هستند. هنگامی از این نوع استفاده می‌شود که اطلاعات بسیار زیادی در دست باشد. در این نمودار تنظیم اعداد بر روی محور افقی از چپ به راست و بر روی محور عمودی از پایین به بالا صورت می‌گیرد و همواره باید نقطه صفر مشخص شود و مقیاس فواصل مساوی باشد. برای رسم نمودارهای خطی می‌توان از کاغذهای شطرنجی استفاده کرد. محور افقی در این نمودار معمولاً اندازه‌های متغیر مستقل و محور عمودی صفت اندازه‌گیری شده را نشان می‌دهد.

نمودار دایره‌ای

یکی دیگر از نمودارهایی که اطلاعات موجود را به سرعت در معرض دید قرار می‌دهد نمودار دایره‌ای است. در این نوع نمودار شعاع‌های دایره به طور عمودی کشیده می‌شوند و بخش‌های تشکیل‌دهنده نمودار در جهت حرکت عقربه ساعت از بزرگ به کوچک تنظیم می‌شود. در یک دایره ۳۶۰ درجه‌ای نسبت عددها، برحسب تعداد درجه‌های هریک از بخش‌های نمودار مشخص می‌شود. نمودار دایره‌ای ساده‌ترین و در عین حال مناسب‌ترین روش برای مقایسه و نمایش داده‌های جمع‌آوری شده از متغیرهای گسسته است.

نمودار تصویری

در نمودار تصویری از انواع شکل‌های سیاه و سفید یا رنگی استفاده می‌شود و بدین ترتیب حالت حقیقی و جذاب به نمودار داده می‌شود. این نوع نمودار در حقیقت از نمودار ستونی گرفته شده است و در واقع همان اطلاعات را نیز ارائه می‌دهد. نمودار مصور به سادگی قابل خواندن است و این مزیت را دارد که شکل‌های حقیقی در آن مورد استفاده قرار می‌گیرند.

هیستوگرام

نمودار هیستوگرام همانند نمودار ستونی است و تنها تفاوتی که وجود دارد، نمایش ستون‌هاست. در هیستوگرام ستون‌ها به یکدیگر چسبیده‌اند. اتصال ستون‌ها در هیستوگرام موجب می‌شود تا این نمودار وسیله مناسبی برای نمایش داده‌های ناشی از اجرای متغیرهای پیوسته باشد، متغیرهایی که با استفاده از مقیاس‌های فاصله‌ای و نسبی مورد اندازه‌گیری قرار می‌گیرند.در هیستو گرام هر ستون نشان دهنده یک طبقه از اعداد است.عرض هر ستون برابر فاصله طبقه و ارتفاع آن مساوی فراوانی همان طبقه است.

نمودار چندبر(چند ضلعی)

اگر بخواهیم متغیرهای کمی پیوسته را به صورت دقیقی نشان دهیم از نمودار چندبر فراوانی استفاده می کنیم.نمودار چند ضلعی کاربرد فراوانی دارد.دلیل این امر هم سهولت ساختن و توصیف آن است.برای رسم این نوع از نمودارها مرکز دسته را روی محور افقی x و فراوانی داده ها را روی محور عمودی به عنوان y در نظر می‏گیریم و با وصل کردن این نقاط به هم نمودار چندبر فراوانی بدست می آید.در نمودار چند ضلعی،طول محورهایx و y معمولا به نسبت 3 به 2 یا 4 به 3 ترسیم می شود.غالبا در ابتدا و پایان محور افقی دو طبقه در نظر گرفته می شود که فراوانی آنها صفر است،یعنی هیچ نمره ای در این طبقات واقع نشده است.اضافه کردن آنها فقط به خاطر آن است که شروع و خاتمه چند ضلعی به محور افقی ختم شود.دلیل عمده ترسیم نمودارهای چند ضلعی و هیستو گرام این است که آنها نحوه توزیع نمره ها را در روی مقیاس نمره ها نشان می دهند.به این معنی که آنها شکل توزیع نمره ها را مجسم می سازند.

نمودار چند ضلعی تراکمی(اجایو):

این نمودار وقتی مفید است که پژوهشگر علاقه مند باشد وضعیت یک نمره یا یک فرد را نسبت به بقیه نمره ها یا افراد مشخص باشد.به عنوان مثال  پژوهشگری می خواهد تعیین کند که نمره ای از چند درصد نمره ها بیشتر یا کمتر است.

نمودار جعبه‌اي (Box and Whisker Plot):

زماني‌ كه‌ هدف‌ تاكيد بر نقاط‌ مشخصي‌ از توزيع‌ باشد از اين‌ نمودار براي‌ ارائه‌ اطلاعات‌ استفاده‌ مي‏گردد. این نمودار انجام‌ مقايسه‌ بين‌ چند مجموعه‌ داده‌ را به‌ آساني‌ امكان‌ پذيرمي‌سازد. نمودار جعبه‌اي با استفاده از يك مستطيل (باكس) در دو خط در دو طرف مستطيل (ويسكر) و به وسيله ميانه، چارك هاي اول و سوم و كمترين و بيشترين اندازه مشاهده شده رسم مي شود. با استفاده از اين نمودار مي‏توان مركزيت،‌ پراكندگي و چولگي داده ها را تفسير نمود.

روش‌ ترسيم‌ :

1. داده ها را به صورت صعودی مرتب می کنیم.

2. میانه داده ها را مشخص می کنیم. 

3. چارک اول و سوم را مشخص می کنیم. 

4. یک خط افقی مدرج که بتوان همه داده ها را روی آن نشان داد رسم می کنیم. 

5. مکان کوچک ترین عدد مشاهده شده، بزرگ ترین عدد، میانه، چارک اول و چارک سوم را تعیین می کنیم. 

6. بالای خط مدرج رسم شده مستطیلی رسم می کنیم که طول آن برابر با Q3- Q1 (برد چارک ها) بوده و از نقطه Q1 شروع و به نقطه Q3 ختم شود و عرض این مستطیل به اندازه معقول در نظر گرفته می شود. اندازه میاننه را به صورت خطی به موازات عرض مستطیل رسم نموده و مستطیل را به وسیله یک خط منقطع به موازات خط مدرج شده به دو قسمت تقسیم می کنیم. 

7. مرزهای داخلی و خارجی داده ها را با توجه به روابطی خاص تعیین می کنیم.

8. با استفاده از داده های مرتب شده، دو اندازه کوچک ترین و بزرگ ترین داده را که داخل مرزهای داخلی قرار دارند، تعیین کرده و خط منقطع وسط مستطیل را تا این دو نقطه به صورت خط پر ادامه می دهیم. این خطوط را ویسکر می نامند که از چارک ها شروع و به نقاط فوق ختم می شوند.

هر عددي كه خارج از مرزهاي داخلي قرار گرفته باشد را يك داد پرت ناميده و چنانچه بين مرزهاي داخلي و خارجي قرار گيرد، آن را داده پرت ضعيف ناميده و با علامت ○ نشان مي دهيم و چنانچه خارج از مرزهاي خارجي قرار گیرد آن را داده پرت قوي که بعضی به آن داده انتهایی نیز می گویند و با علامت ● نشان مي دهيم.

 

با استفاده از نمودار باكس - ويسكر مي توان اطلاعات زير را در مورد داده ها كسب نمود:

الف) اگر ميانه نزديك وسط مستطيل (باكس) باشد توزيع داده ها تقريبا متقارن است.

ب) اگر ميانه در طرف چپ وسط مستطيل باشد توزيع چوله به راست و اگر ميانه در طرف راست وسط مستطيل قرار گيرد توزيع چوله به چپ است.

ج) اگر خطوط دو طرف مستطيل (ويسكرها) تقريباً برابر باشند توزيع داده ها به توزيع متقارن نزديك بوده و در صورت نامساوي بوده خطوط توزيع داراي چولگي است.

د) در مقايسه نمودار باكس - ويسكر دو مجموعه از داده ها مي توان پراكندگي آنها را با توجه به طول مستطيل هاي نمودار با يكديگر مقايسه نمود. مستطيلي كه طول بزرگتري دارد داراي پراكندگي بيشتر مي باشد.

ه) داده هاي پرت ضعيف و داده هاي پرت قوي را با استفاده از نمودار باكس - ويسكر مي توان تعيين نمود.

نمودار شاخه و برگ

این نمودار نیز براي توصيف داده هاي كمي به كاربرده مي‏شود. رسم نمودار شاخه و برگ به دليل از دست ندادن اطلاعات، به نمودارهاي فراواني ترجيح داده مي شود. هر داده یک ساقه و یک برگ دارد. معمولا برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند . برای مثال در عدد 317 عدد 7 برگ و 31 ساقه است. يك‌ نمودار منعكس‌ كننده‌ توزيع‌ فراواني‌ و هيستوگرام‌ است‌ و ضمن‌ نشان‌ دادن‌ شكل‌ هيستوگرام‌، داده‌ هاي‌ اصلي‌ را نيز نشان‌ مي‏دهد. در این نمودار بجاي رسم ميله‌ها، فراواني‌ها به شكل اعداد (با نمايش تعداد تكرار و بيان اعداد مشاهده شده) نشان داده می شوند.

روش ترسیم:

1. هر داده  به دو قسمت تقسیم می شود. یک قسمت از داده  ساقه و قسمت دیگر برگ است. برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند. 

2. ساقه ها به ترتیب از کوچک به بزرگ مرتب می شوند. 

3. هر برگ به ساقه مناسب اضافه می شود.

با مقايسه نمودار نمودار شاخه و برگ و نمودار هيستوگرام ديده مي‌شود كه در نمودار هيستوگرام با ايجاد طبقات ديگر دستيابي به مقادير انفرادي مشاهدات امكان پذير نيست اما در نمودار شاخه و برگ ضمن داشتن ايده تصويري از نحوه توزيع داده ها به يكايك اطلاعات نيز دسترسي داريم.

نمودار میله ای

براي داده هاي كمي گسسته، وقتيكه از رده ها استفاده مي شود، نمودار ميله‌اي مناسب ترين نمودار است كه همانند داده هاي كيفي رسم مي شود، با اين تفاوت كه به جاي گروههاي مختلف داده كيفي از رده ها در محور افقي استفاده مي شود.

نمودار چند گوش:؟؟

 این نمودارها برای نمایش داده های کمی گسسته به کار می روند.


نمودار راداري ( Radar Chart) :

نوعي از نمودار خطي است. با اين تفاوت که نمودار مزبور بجاي اينکه نسبت به محور ترسيم شود، نسبت به يک نقطه مرکزي ترسيم مي شود. يعني خط افقي در نمودار خطي ، در نمودار راداري بصورت دايره نشان داده مي‏شود.

به نمودار راداری نمودار تار عنکبوتی یا گراف ستاره ای نیز گفته می شود که بیشتر به منظور نمایش مشاهدات چند متغیره استفاده می‏شود. یک نمودار راداری شامل مجموعه ای از پره (محور) های متساوی الزاویه بوده که هر یک بیان کننده یک متغیر می باشد. یک داده از یک متغیر بر روی محور مربوطه چنان نگاشته می شود که فاصله آن از مرکز نسبت به طول محور برابر با مقدار آن متغیر نسبت به بیشینه مقدار ممکن متغیر باشد. خطوطی نقاط مجاور را به یکدیگر متصل کرده و نهایتاً یک چند ضلعی مشخص حاصل از مشاهدات بدست می آید. بنابراین نمودار راداری تنها با یک چند ضلعی به محقق کمک کرده تا متغیر (متغیرهای) غالب را برای یک سری مشاهدات تشخیص دهد. 

نمودار پراكنش

ارائه داده هاي دو متغيره كمي بوسيله نمودار پراكنش در بسياري از مطالعات با ثبت دو صفت كمي به دنبال يافتن رابطه بين دو صفت براي واحدهاي مطالعاتي مي باشيم. اگر مقادير دو صفت را با x و y نمايش دهيم آنگاه براي هر كدام از مشاهدات يك زوج مشاهده داريم. با رسم اين زوج مشاهدات در محورهاي مختصات، نمودار حاصل را نمودار پراكنش مي‌نامند.


2- حد متوسط  عملکرد گروه چگونه است؟

برای پاسخ به این سوال باید شاخص های مرکزیت (میانگین، میانه، نما) داده ها را مشخص کنیم.

شاخص های مرکزی یا گرایش به مرکز شاخص هایی هستندکه با استفاده ازآنها مجموعه ای ازداده ها در یک مقدار یا عدد که نماینده ی آن مجموعه است خلاصه می شود .به دیگر سخن،این شاخص حد متوسط رانشان می دهد و نماینده مجموعه ی از اعداد هستند.نما و میانه و میانگین (mean, median, mode) سه شاخص مرکزی هستند.

نما mode:

 ساده ترین شاخص گرایش مرکزی است، نما عددی است که دارای بیشترین فراوانی است. عددی که دارای بیشترین فراوانی است،اغلب نزدیک به مرکز توزیع فراوانی قرار دارد. درچنین شرایطی نما یک شاخص مرکزی است. اما نما همیشه در مرکز توزیع فراوانی قرار ندارد، به همین دلیل نمی توان به عنوان یک شاخص مرکزی به آن اطمینان داشت. در میان شاخص های گرایش به مرکزیت نما شاخصی بی ثبات است. به توزیع فراوانی که فقط یک نما دارد، یک نمایی و به توزیعی که دونما دارد، توزیع دونمایی می گویند و به توزیع بیش از دونما، توزیع چند نمایی گفته می شود. از نما هنگامی استفاده می کنیم که مقیاس اندازه گیری اسمی باشد و یک برآورد تقریبی از ارزش های مرکزی کفایت کند.به عبارتی دیگر،نما به عنوان یک شاخص مرکزی مورد استفاده محدودی دارد.نما مخصوصا در گروه های کوچک دارای اعتبار نیست.زیرا میزان آن فقط تابع چند عدد است.پژوهشگران معمولا هنگامی از نما استفاده می کنند که مایل باشند بینش کلی درباره شاخص مرکزی به دست آورند.این شاخص درباره گرایش مرکزی تزیع نمره ها اطلاعی به ما نمی دهد.زیرا شاخص مرکزی یک توزیع الزاما عدد با ارزشی نیست که دارای بیشترین فراوانی باشد.

میانه median :

میانه نقطه وسط یک توزیع است. هنگامی که نمرات توزیع فراوانی به ترتیب از بالاترین به پایین ترین نمره مرتب شود، نصف نمرات بالای میانه و نصف نمرات پایین میانه قرار می‏گیرد، بنابراین میانه نقطه 50درصدی است. اندازه یا حجم واحدهای اندازه‏گیری در میانه تاثیر ندارد. ثبات آن از میانگین کمتر ولی از نما بیشتراست. میانه با مقیاس های ترتیبی، فاصله ای و نسبی به کاربرده می شود.ویژگی اصلی میانه این است نسبت به اعداد کوچک و بزرگ حساس نیست.

میانگین mean :

معتبرترین شاخص گرایش مرکزی میانگین است.میانگین معدل حسابی گروهی از نمرات است که از طریق جمع کردن تمام نمرات و تقسیم حاصل جمع بر تعداد کل نمرات به دست می آید. از ویژگی های عمده میانگین این است که این شاخص نسبت به تک تک اعداد توزیع  فراوانی حساس است.اگر میانگین را ضربدر تک تک اعداد کنیم مجموع آن بدست می آید.همچنین میانگین مرکز ثقل داده هاست.یعنی مجموع نمرات انحرافی همیشه صفر است. یکی دیگر از ویژگی های میانگین این است که میانگین، نقطه ای از توزیع نمرات است که همیشه مجموع مجذور در انحراف نمرات از میانگین کوچکتر یا مساوی با مجموع مجذور در انحراف نمرات از هر عددی دیگر است. همچنین با مقیاس های فاصله ای و نسبی به کار برده می شود، و به استفاده کنندگان خود اجازه عملیات ریاضی رو می دهد،به همین دلیل مورد استفاده زیادی در آمار استنباطی دارد. و انواع مختلفی دارد.

3- داده ها حول این حد متوسط چقدر از یکدیگر فاصله دارند؟

پژوهشگر برای توصیف کامل توزیع نمره ها علاوه بر شاخصهای مرکزی،به پراکندگی نمره ها نیز نیاز دارد.به دیگر سخن،برای یک مجموعه داده ها،علاوه بر شاخص گرایش به مرکز،شاخصهای دیگر وجود دارند به نام شاخص های پراکندگی؛در واقع بیانگر فاصله،تغییرات،پراکندگی و انحرافات را نشان می دهند.شاخص های پراکندگی میزان پراکندگی یا تفسیر نمره‏ها را درمجموعه‏ای از نمرات نشان می‏دهند.دامنه ی تغییرات،انحراف چارکی،انحراف متوسط،واریانس و انحراف معیار شاخصهایی هستند که به منظور پراکندگی نمره ها به کار برده می شوند.افزون بر این،وجود یا عدم پراکندگی ضرورتا نه خوب است نه بد.قضاوت در این مورد با توجه به هدف پژوهش صورت می گیرد.

دامنه ی تغییرات:

ساده ترین شاخص پراکندگی دامنه‏ی تغییرات است که دریک توزیع فراوانی عبارتست از تفاضل بزرگترین وکوچکترین نمره، درواقع دامنه ی تغییرات یک شاخص پایدار پراکندگی نیست، زیرا مقدار آن با تغیر یک نمره (بزرگترین وکوچکترین) تغییر می‏کند. استفاده ازدامنه‏ی تغیرات مستلزم داشتن مقیاس فاصله‏ای است.دامنه تغیرات بی ثبات ترین و بی اعتبار ترین شاخص پراکندگی است.چون در محاسبه دامنه تغییرات فقط دو عدد مورد استفاده قرار می گیرد.به علاوه،چون که دامنه تغییرات بر اساس بزرگترین و کوچکترین نمره ای توزیع محاسبه می شود،بنابراین مقدار آن در نمونه های مختلفی که از یک جامعه انتخاب شود،تفاوت خیلی زیادی خواهد داشت.عیب دیگر دامنه ی تغییرات این است که مقدار آن به حجم نمونه بستگی دارد.به طور کلی،هر چه حجم نمونه زیاد باشد،مقدار دامنه تغیرات احتمالا زیاد خواهد شد.

انحراف چارکی:

جزء شاخصهای که معروف به چند دهکها مربوط می شوند.و با دو نقطه-25./. و 75./.- سرو کار دارد.این شاخص پایدارتر از دامنه‏ی تغییرات است و مساوی است با نصف تفاضل بین چارک سوم و اول. انحراف چارکی مانند میانه تحت تاثیر نمره های خیلی بزرگ یا خیلی کوچک قرار نمی گیرد. از انحراف چارکی زمانی استفاده می شود که مقیاس اندازه‏گیری حداقل فاصله‏ای باشد.هنگامی که میانه مناسب ترین شاخص مرکزی توزیع نمره ها باشد می توان از انحراف چارکی برای محاسبه پراکندگی استفاده کرد.هنگامی که نمودار نمره ها دارای کجی باشد،انحراف چارکی شاخص مناسبی برای نشان دادن پراکندگی است.

انحراف متوسط:

در آمار فاصله بین هر عدد از یکی از شاخصهای مرکزی،انحراف نامیده می شود. میانگین قدر مطلق انحرافات از میانگین را نیز انحراف متوسط گویند.به زبان ساده،انحراف متوسط،میانگین مجموع قدر مطلق انحرافات گویند.برای استفاده از انحراف متوسط،مقیاس اندازه گیری باید حداقل فاصله ای باشد.زیرا برای تفسیر نتایج تحقیق،دانستن فاصله نمره ها از میانگین ضروری می باشد و برای محاسبه میانگین نیز،داشتن مقیاس فاصله ای ضروری است.عیب این شاخص در قدر مطلق آن است یعنی قدر مطلق اجازه عملیات آماری با این فرمول رو نمی دهد و باید آن رو مجذور کنیم.

واریانس:

قبلا گفته شد که از بین شاخصهای مرکزی،میانگین شاخص با ثبات و معتبر تری است.در صورتی که بتوانیم فاصله بین هر یک از اعداد تا میانگین را تعیین کنیم آنگاه قادر خواهیم بود تا یک شاخص پراکندگی با ثبات و معتبر را محاسبه کنیم.این روش در محاسبه واریانس و انحراف استاندارد به کار برده می شود. واریانس یک شاخص پراکندگی است که از طریق محاسبه ی انحراف نمره ها ازمیانگین محاسبه می شود. برابر است با مجذور انحراف نمره ها از میانگین(میانگین مجموع مجذور انحرافات) یا مجموع مجذور انحراف نمره ها از میانگین تقسیم برتعداد نمره ها.در محاسبه انحراف متوسط،علائم اعداد و در محاسبه انحراف چارکی،کلیه ارزشهای مقداری تمام اعداد مورد بررسی قرار نمی گیرد.برای محاسبه یک شاخص پراکندگی باثبات و معتبر باید از ارزشهای عددی کلیه نمره ها استفاده کرد.در مجموع،با مجذور کردن انحراف نمره ها از میانگین،واحد واریانس یا واحد اندازه گیری تغییر پیدا خواهد کرد که نقطه ی ضعف واریانس است که با جذر واریانس مشکل حل خواهد شد.

انحراف استاندارد (انحراف معیار) :

مشکل اختلاف واحد اندازه‏گیری با واریانس را می‏توان با جذر گرفتن از واریانس حل کرد. این عمل موجب می‏شود که واحد شاخص محاسبه شده با واحد اندازه گیری به کاربرده شده یکسان شود و یکی از شاخص های معتبر آماری به نام انحراف استاندارد بدست آید. به عبارت دیگر جذر واریانس، انحراف استاندارد نامیده می شود. انحراف استاندارد مفیدترین و متداول ترین شاخص پراکندگی است. مفیدبودن این شاخص به این دلیل است که بااین شاخص می‏توان میزان پراکندگی هر توزیع پیوسته را برحسب واحد اندازه‏گیری نشان داد. این شاخص دقیق ترین شاخص پراکندگی است. استفاده از انحراف استاندارد مستلزم این است که مقیاس اندازه گیری به کاربرده شده  حداقل فاصله ای باشد.افزون بر این،انحراف استاندارد،شاخصی است که به منظور تعییت تغییرات یا پراکندگی توزیع نمره ها به کار برده می شود.مقدار انحراف استاندارد به تناسب تغییر در پراکندگی نمره ها تغیر می کند.در صوری که توزیع نمره ها نسبت به میانگین پراکندگی زیادی داشته باشد،مجموع مجذور انحراف نمره ها از میانگین، و در نتیجه انحراف استاندارد بزرگ خواهد شد.همچنین عکس آن هم صادق است.

4- شکل توزیع داده ها چگونه است؟

برای پاسخ به این سوال باید شکل توزیع (نرمال، کجی و کشیدگی) داده ها را مشخص کنیم.

شکل توزیع به سه صورت است:

نرمال یا متقارن: در منحنی نرمال در حالت تقارن مد، میانه و میانگین برابر است.

کجی (Skewness) :کجی یعنی انحراف یک منحنی از حالت تقارن.کجی به سه صورت است،در حالتی کجی صفر است که منحنی متقارن باشد.در توزیعهای متقارن فاصله بین چارک اول تا میانه با فاصله بین چارک سوم تا میانه مساوی است. در حالت کجی منفی مد بزرگتر از میانه و میانه بزرگتر از میانگین است(بیانگر این است که افراد زیادی نمره ی بالایی گرفته اند و بنابراین امتحان ساده بوده است). در حالت کجی مثبت نیز میانگین بزرگتر از میانه و میانه بزرگتر از مد است(یعنی آزمون دشوار بوده است).

کشیدگی:هنگامی که مقدار کشیدگی برابر صفر باشد توزیع نمره ها طبیعی است یعنی در شکل توزیع که بلند و رو به بالاست، نمرات نزدیک به هم یا یکسان می باشند و واریانس کم است.در صورتی که کشیدگی مثبت باشد برآمدگی منحنی توزیع نمره ها در نقطه اوج قرار خواهد گرفت. در شکل توزیع مسطح که کشیدگی منفی دارد، نمرات دور از هم‌ قرار دارند و واریانس زیاد است. ميزان كشيدگي يا پخي منحني فراواني را نسبت به منحني نرمال استاندارد، برجستگي آن مي نامند.

5- جایگاه داده ها نسبت به یکدیگر چگونه است؟

در واقع این سوال،روش های تفسیر نمره های خام را مورد بررسی خواهد داد.در این بحث اندازه ها یا شاخصهایی که موقعیت نسبی فرد یا عدد را در گروه یا توزیع نمره ها مشخص می کند. برای تعیین موقعیت نسبی هر یک از اعداد در توزیع نمره هایشان از شاخصهای مختلفی منجمله رتبه درصدی،رتبه نسبی و نمره های استاندارد استفاده خواهیم کرد.

رتبه درصدی:

رتبه درصددی،رتبه نسبی یک نمره از توزیع نمره ها را براساس مقیاس 100 تعیین می کند.رتبه درصدی یک نمره به ما می گوید که چند درصد نمره ها در توزیع در زیر آن نمره قرار گرفته اند.رتبه درصددی یک شاخص آماری رتبه ای است.رتبه در صورتی دارای معنی است که تعداد نمره ها در توزیع مشخص باشد.این شاخص معیاری برای تفسیر و مقایسه نمره ها در گروه یا توزیع فراهم می کند.رتبه درصددی وضعیت فرد را فقط در درون یک جامعه معین مشخص می کند و وقتی دارای معنی است که ماهیت مقایسه گروهی معلوم باشد.

نقاط درصددی:

نقاط درصددی همانند رتبه های درصدی اندازه های ترتیبی هستند.با استفاده از انها می توان تعیین کرد چه عددی توزیع را به درصددهای مختلف تقسیم می کند.بنابراین نقاط درصددی نقاطی بر روی مقیاس نمره هاست که معادل رتبه های درصدی اند.نقاط درصدی زمانی به کاربرده می شوند که پزوهشگر بخواهد از یک جامعه قسمتی یا تعدادی را انتخاب کند.به عنوان مثال ممکن است مدیر یک کارخانه از بین داوطلبان استخدام کسانی را انتخاب کند که به 30 درصدد سوالات ازمون استخدامی پاسخ صحیح داده باشند.

نمره استاندارد:

 از نمره استاندارد Z زمانی استفاده می‌کنیم که می‏خواهیم دو نمره خام را قابل مقایسه کنیم. یعنی مبدا و مقیاس نمرات را یکی می‌کنیم. به کمک این نمره مى‌توان تفاوت موجود در پراکندگى نمرات را بوسيله تقسيم انحراف هر نمره از ميانگين بر انحراف استاندارد آن نمرات رفع کرد و نمره‌‌ها را با يکديگر مقايسه نمود.به عبارتی دیگر،نمره های استاندارد ،وضعیت افراد یا نمره ها را نسبت به میانگین تعیین می کنند.نمره های استاندارد با مقیاس فاصله ای به کاربرده می شوند و همانند رتبه های درصددی به منظور تعیین موقعیت فرد در درون گروه به کار برده می شوند.افزون بر این،نمره های استاندارد مستقیما از نمره های خام به دست می آیند ب)چون با مقیاس فاصله ای به کاربرده می شوند بنابراین محاسبات ریاضی با آنها امکان پذیر است.نمره های استاندارد تعیین می کنند که یک نمره،چند انحراف استاندارد بالاتر یا پایین تر از میانگین قرار دارد. نمره های T و نه گانه هم جزء نمره های استاندارد هستند.

در پایان به عنوان ماحصل بحث می توان گفت که آمار توصیفی تک متغیری شامل نمایش گرافیکی (جدول، نمودار) و شاخص‌های عددی است که شامل شاخص‌های مرکزی، شاخص‌های پراکندگی و شکل توزیع است. اما در توزیع چند متغیری چونrelationship  متغیرها مطرح می باشد، اثر متقابل متغیرها علاوه بر اثر کلی مورد علاقه پژوهشگر می باشد.


+ نوشته شده در  پنجشنبه 4 آبان1391ساعت   توسط محمد حسین ضرغامی  | 

رگرسیون چیست؟

رگرسیون چیست؟

تاریخچه : 

واژه رگرسیون در فرهنگ لغت به معنی بازگشت است و اغلب جهت رساندن مفهوم "بازگشت به یک مقدار متوسط یا میانگین” به کار می رود. بدین معنی که برخی پدیده ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می کنند .

 بیش از 100 سال پیش در سال 1877 فرانسیس گالتون (Francis Galton) در مقاله ای که در همین زمینه منتشر کرد اظهار داشت که متوسط قد پسران دارای پدران قد بلند ، کمتر از قد پدرانشان می باشد . به نحو مشابه متوسط قد پسران دارای پدران کوتاه قد نیز بیشتر از قد پدرانشان گزارش شده است. به این ترتیب گالتون پدیده بازگشت به طرف میانگین را در داده هایش مورد تأکید قرار داد . برای گالتون رگرسیون مفهومی زیست شناختی داشت اما کارهای او توسط کارل پیرسون (Karl Pearson) برای مفاهیم آماری توسعه داده شده . گرچه گالتون برای تأکید بر پدیده "بازگشت به سمت مقدار متوسط" از تحلیل رگرسیون استفاده کرد، اما به هر حال امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده می شود .  

نمودار پراکندگی :

در حقیقت تحلیل رگرسیونی فن و تکنیکی آماری برای بررسی و مدل سازی ارتباط بین متغیرها است. رگرسیون تقریباً در هر زمینه ای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیشبینی مورد نیاز است . می توان گفت تحلیل رگرسیونی، پرکاربردترین روش در بین تکنیک های آماری است. شمایی کلی و خلاصه شده از یک تحلیل رگرسیونی ساده به صورت زیر می باشد: 

در ابتدا تحلیل گر حدس می زند که بین دو متغیر نوعی ارتباط وجود دارد ، در حقیقت حدس می زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع آوری اطلاعات کمی از دو متغیر می پردازد و این داده ها را به صورت نقاطی در یک نمودار دو بعدی رسم می کند.

 این نمودار که به آن نمودار پراکندگی [scatter plot] گفته می شود نقش بسیار مهمی را در تحلیل های رگرسیونی و نمایش ارتباط بین متغیرها ایفا می کند.

 در صورتی که نمودار نشان دهنده این باشد که داده ها تقریباً (نه لزوماً دقیق) در امتداد یک خط مستقیم پراکنده شده اند، حدس تحلیل گر تأیید شده و این ارتباط خطی به صورت زیر نمایش داده می شود:                          

y = a x + b

 که در آن  a عرض از مبدأ و b شیب این خط است.

متغیر ها و خطا : 

بین برخی از نقاط و تصویر آنها بر روی خط رگرسیونی (خط y) کمی تفاوت به چشم می­خورد که از آن به عنوان خطای برآورد یاد می کنیم. 

 این خطا ممکن است از خطا در اندازه گیری ، شرایط محیط ، تفاوت های طبیعی و... ناشی شده باشد. بنابراین معادله اولیه را به صورت زیر اصلاح می کنیم :

y = ax + b + ?

معادله بالا یک مدل رگرسیون خطی نامیده می شود . معمولاً به x متغیر مستقل (رگرسیونی) و به y متغیر وابسته (پاسخ) گفته می­شود . که ? خطای تصادفی است که برای کامل شدن مدل و نشان دادن این که خطا نیز تا حدی وجود دارد در نظر گرفته می شود.

فرضیات : 

معمولا فرض میشود که خطاها یکدیگر را خنثی میکنند ، به عبارت دیگر مجموع خطا ها برابر صفر است . همچنین فرض میشود خطای موجود در یک مشاهده رابطه ای با خطاهای دیگر ندارد و در نهایت تغییرات بین خطاها ثابت در نظر گرفته میشود . این سه فرض برای ساختن یک مدل ضروری است و روشهای بسیاری برای پی بردن به وجود (یا عدم برقراری ) این فرض ها وجود دارد . یکی از دلایل استفاده های نادرست از رگرسیون معمولا نادیده گرفتن این فرض ها است که موجب استدلال های غلط خواهد شد .

در صورتی که در مدل رگرسیونی فقط یک متغیر مستقل وجود داشته باشد، مدل را مدل رگرسیونی خطی ساده می نامند.

روش های رگرسیونی : 

ا این مرحله مدل رگرسیونی معرفی شده و کافی است پارامترهای مجهول مدل (در اینجا a و b) برآورد شوند. برآورد پارامترها در مدل سازی با استفاده از روش های مختلف انجام میشود از جمله روش کمترین مربع خطا .


 

روش کمترین مربع خطا که یکی از روش های مورد استفاده در تحلیل رگرسیونی است اولین بار توسط لژندر (Legendre) ریاضیدان فرانسوی در سال 1805 و گوس (Gauss) ریاضیدان مشهور آلمانی در سال 1809 معرفی و در مطالعات نجومی به کار برده شد . 

پس تا این قسمت تحلیل گر مدلی مشخص را به عنوان الگویی برای داده ها معرفی کرده است. مرحله بعدی "کنترل مناسب بودن مدل" می باشد که مدل از نظر قابل استفاده بودن و این که تا چه حد می تواند خوب داده ها را بیان کند بررسی می شود و در مورد بکارگیری مدل تصمیم گرفته می شود. در نتیجه مدل یا قابل استفاده تشخیص داده می شود و یا اینکه باید اصلاح شود . بنابراین تحلیل رگرسیونی فرآیندی همراه با تکرار و بازنگری است، یعنی در ابتدا مدلی معرفی می شود، کیفیت مدل مورد بررسی قرار میگیرد ، مدل قبول و یا اینکه مجدداً اصلاح می شود.

رابطه قد و وزن، رابطه عرضه و تقاضا در علم اقتصاد، تعیین رابطه بین سن افراد و فشارخون آنها، رابطه بین میزان مطالعه دانش آموزان و سطح نمرات آنها، رابطه بین نمرات و میزان قبولی در کنکور سراسری مثال هایی ساده در کاربرد رگرسیون  هستند .

¤ نویسنده: سیامک داداشی

+ نوشته شده در  چهارشنبه 1 شهریور1391ساعت   توسط محمد حسین ضرغامی  | 

دقت اندازه گيري، خطاي اندازه گيري و ضريب پايايي

يكي از بحث هاي رايج در حوزه ي دقت اندازه گيري شاخص مربوط به اين دقت است. براي برآورد دقت اندازه گيري دو شاخص وجود دارد. يكي مقدار پايايي و ديگري مقدار خطاي اندازه گيري. در مورد اهميت هر كدام از اين دو بحث هاي فراواني شده است. لين در فصلي با عنوان پايايي با بررسي اين موضوع وارد بحث شده است و دلايلي را ذكر مي كند كه خطاي اندازه گيري شاخص بهتري نسبت به پايايي براي بيان دقت يك آزمون است. اين دلايل عبارتند از:

1. از طريق شاخص خطاي اندازه گيري مي توان دامنه ي اطمينان  تعريف نمود.

2. تغيير درجه همگني گروه نمونه روي ضريب پايايي اثر گذاشته اما روي خطاي اندازه گيري تاثيري ندارد. 

3. شاخص خطاي معيار اندازه گيري شاخص عملي تري نسبت به پايايي است. 

4. رابطه ي بين دقت اندازه گيري و خطاي اندازه گيري رابطه ي معكوس و قابل فهمتري است نسبت به شاخص پايايي.


+ نوشته شده در  دوشنبه 12 تیر1391ساعت   توسط محمد حسین ضرغامی  | 

ضريب آلفاي کرونباخ؛ مفاهيم، کارکرد و شيوه هاي نوين آن

ضريب آلفاي کرونباخ؛ مفاهيم، کارکرد و شيوه هاي نوين آن  

دکترامير تيمور پاينده1، دکتر مريم اميدي نجف آبادی2، فهيمه مسعودي فر3

1و 3: دانشگاه شهيد بهشتي، دانشکده علوم رياضي، گروه آمار

2: دانشگاه آزاد اسلامي واحد علوم وتحقيقات، گروه ترويج و آموزش کشاوزي

amirtpayandeh@sbu.ac.ir 

چکيده :

بي شک همه ي ما درطول دوران زندگي خود حداقل يکبار پرسشنامه پرکرده ايم. تا بحال ازخود پرسيده ايد که اين پرسشنامه ها چگونه تهيه مي شوند و نيز معياري براي بررسي ميزان قابليت اطمينان آنها وجود دارد يا خير؟ بديهي است که چنين مقياسي وجود دارد، چرا که بسياري از بررسي ها ي آماري درسطوح وسيع ابتدا درقالب پرسش نامه پايه گذاري مي شوند، پس مي بايست ملاکي براي نظارت  بر قابليت  اعتماد  آنها  وجود داشته باشد.

در اين مقاله، ابتدا به مفهوم ضريب آلفاي کرونباخ و کارکرد آن، شيوه محاسبه آن با استفاده از نرم افزارهاي آماري مي پردازد. نهايتا به معرفي تتاي ترتيبي  و ارائه برنامه ای جهت محاسبه آن (با استفاده از نرم افزار R)خواهيم پرداخت.

مفهوم ضريب آلفاي کرونباخ:

ضريب آلفاي کرونباخ توسط کرونباخ ابداع شده و يکي ازمتداولترين روشهاي اندازه گيري اعتماد پذيري و يا پايائي پرسش نامه هاست. منظور از اعتبار يا پايايي پرسش نامه اين است که اگر صفت هاي مورد سنجش با همان وسيله و تحت شرايط مشابه و در زمانهاي مختلف مجددا اندازه گيري شوند، نتايج تقريبا يکسان حاصله شود.

 ضريب آلفاي کرونباخ، براي سنجش ميزان تک بعدي بودن نگرشها، عقايد و ... بکار مي رود. در واقع مي خواهيم ببينيم تا چه حد برداشت پاسخگويان از سوالات يکسان بوده است. اساس اين ضريب بر پايه مقياسهاست. مقياس عبارتند از دسته اي از اعداد که بر روي يک پيوستار به افراد، اشيا يا رفتارها در جهت به کميت کشاندن کيفيت ها اختصاص داده مي شود. رايج ترين مقياس که در تحقيقات اجتماعي بکار مي رود مقياس ليکرت است. در مقياس ليکرت اساس کار بر فرض هم وزن بودن گويه ها استوار است. بدين ترتيب به هر گويه نمراتي (مثلا از1 تا 5 براي مقياس ليکرت 5 گويه اي) داده مي شود که مجموع نمراتي که هر فرد از گويه ها مي گيرد نمايانگر گرايش او خواهد بود. 

آلفاي کرونباخ بطورکلي با استفاده از يکي روابط  زيرمحاسبه مي شود.

  يا   

که دراين روابط  k تعداد سوالات،   واريانس سوال i ام،   واريانس مجموع کلي سوالات،  ميانگين کواريانس بين سوالات، و   واريانس ميانگين سوالات مي باشند (برگرفته شده از آلن و ين، 2002). 

با استفاده از تعريف آلفاي کرونباخ مي توان نتيجه گرفت: (1) هرقدرهمبستگي مثبت بين سوالات بيشتر شود، ميزان آلفاي کرونباخ بيشتر خواهد شدو بالعکس، (2) هر قدر واريانس ميانگين سوالات بيشتر شود آلفاي کرونباخ کاهش پيدا خواهد کرد، (3) افزايش تعداد سوالات تاثيرمثبت و يا منفي (بسته به نوع همبستگي بين سوالات) بر ميزان آلفاي کرونباخ خواهد گذاشت، (4) افزايش حجم نمونه باعث کاهش واريانس ميانگين سوالات در نتيجه باعث افزايش آلفاي کرونباخ خواهد شد. 

بديهي است هرقدر شاخص آلفاي کرونباخ به 1نزديکترباشد، همبستگي دروني بين سوالات بيشتر و در نتيجه پرسشها همگن ترخواهند بود. کرونباخ ضريب پايايي %45 را کم، %75 را متوسطو قابل قبول، و ضريب %95 را زياد پيشنهاد کرده (کرونباخ، 1951). بديهي است درصورت پايين بودن مقدارآلفا، بايستي بررسي شود که با حذف کدام پرسشها مقدارآن را مي توان افزايش داد. 

تتاي ترتيبي:

در سال 1974 آمارداني به نام آمور در مورد استفاده از آلفاي کرونباخ آماردانان ديگر را به چالش کشيد. استدلال او اين بود که آلفاي کرونباخ بر علاوه بر نارايب بوده (نارايبي مثبت)، بر اساس شاخص هاي تعريف و محاسبه مي گردنند که مربوط به داده هاي با مقياس فاصله اي و يا نسبتي هستند، بنابراين استفاده از آلفاي کرونباخ براي محاسبه اي ميزان پايائي پرسش نامه هاي که حاوي سوالات ترتيبي هستند دقيق به نظر نمي رسد. او براي رفع اين مشکل شاخص جديدي تحت عنوان تتاي ترتيبي به صورت زير ارائه داد.

 

که   بيشترين مقدار ويژه در تحليل مولفه اي اصلي مي باشد. اخيرا زامبو، گادرومن، و زيسر (2007) به مطالعه اين شاخص پرداخته و با چندين مثال شبيه سازي شده نشان دادند که ضريب آلفاي کرونباخ هميشه مقدار پاياي را کم برآورد مي کند. بنابراين توصيه مي شود که در هنگامي که داده ها ترتيبي هستنند به جاي آلفاي کرونباخ از تتاي ترتيبي استفاده شود.

چگونگي محاسبه به همراه مثال عملي:

بسياري از نرم افزارهاي آماري قادر به محاسبه آلفاي کرونباخ هستند. در اين قسمت از مقاله چگونگي محاسبه ي آلفاي کرونباخ را توسط دو نرم افزار SPSS و SAS شرح داده، سپس با ارائه يک برنامه به زبان R  چگونگي محاسبه ي آلفاي کرونباخ و تتاي ترتيبي را توسط نرم افزار R نشان مي دهيم. در ادامه با استفاده از سوالات نمونه گيري مقدماتي اميدي (1387) چگونگي سنجش آلفاي کرونباخ و تتاي ترتيبي را نشان مي دهيم.

براي محاسبه آلفاي کرونباخ  به کمک نرم افزار SPSS مسير زيررا دنبال مي کنيم :

Analyze> Scale> Reliability Analysis…

چنانچه مايل باشيم بررسي کنيم که حذف هرسوال چه ميزان روي ضريب آلفاي کرونباخ تاثير مي گذارد، بعد از باز شدن پنجره “Reliability Analysis Reliability Analysis” روي گزينه Statistics کليک کرده و در قسمت “Descriptive for” گزينه “Scale if item deleted”  را انتخاب کنيم.

خروجي نرم افزارSPSS براي داده هاي اميدي (1387) به صورت زيرخواهد بود:

جدول1) خروجی نرم افزار شامل ضريب آلفا و تعداد سوالات

Reliability Statistics

Cronbach's Alpha N of Items

.855 13





جدول2) خروجی نرم افزار

Item-Total Statistics

Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item-Total Correlation Cronbach's Alpha if Item Deleted

V1 48.159 45.067 .470 .848

V2 48.500 44.488 .517 .845

V3 47.977 46.162 .484 .847

V4 48.318 43.989 .660 .838

V5 48.045 44.230 .495 .846

V6 49.227 45.808 .147 .890

V7 47.864 44.074 .690 .837

V8 48.136 43.283 .653 .837

V9 48.000 45.442 .515 .846

V10 48.068 43.646 .616 .839

V11 47.841 43.532 .680 .836

V12 48.318 43.106 .597 .840

V13 48.545 41.323 .671 .834


همانطوريکه ملاحظه مي شود مقدارآلفاي محاسبه شده برابر85 درصد است، که مقدار قابل قبولي است. همانطور که جدول شماره 2 نشان مي دهد حذف سوال ششم (v6) باعث افزايش آلفاي کرونباخ به 89 درصد خواهد شد.   

آلفاي کرونباخ در نرم افزار SAS با استفاده از دستور 

proc corr alpha nocorr nomiss; Variables; run;

محاسبه مي گردد. که به دلايل مشابه بودن خروجي با نرم افزار SPSS از ذکر جزئيات آن خوداري مي کنيم. 

دو نرم افزار SPSS  و SAS قادر به محاسبه ي تتاي ترتيبي نمي باشند و نرم افزار S-plus و R توانائي محاسبه آلفاي کرونباخ را ندارند.

در ادامه با ارائه تابعي (پيوست الف) چگونگي محاسبه آلفاي کرونباخ و تتاي ترتتيبي را توسط R  نشان مي دهيم. 

خروجي برنامه بالا تحت نرم افزار R  براي داده هاي اميدي (1387) در جدول 3 خلاصه شده است.

جدول 3) خروجی برنامه پيوست الف

New_Theta $` Ordinal Theta if a Question Deleted` New_Alpha $`Alpha if a Question Deleted`

0.8849911 Without Question 1 0.8476305 Without Question 1

0.8840719 Without Question 2 0.8448156 Without Question 2

0.8867511 Without Question 3 0.8474065 Without Question 3

0.8765560 Without Question 4 0.8377251 Without Question 4

0.8854676 Without Question 5 0.8461963 Without Question 5

0.8949432 Without Question 6 0.8899667 Without Question 6

0.8737700 Without Question 7 0.8368503 Without Question 7

0.8754874 Without Question 8 0.8368983 Without Question 8

0.8834650 Without Question 9 0.8455129 Without Question 9

0.8782972 Without Question 10 0.8390775 Without Question 10

0.8741109 Without Question 11 0.8361389 Without Question 11

0.8814010 Without Question 12 0.8395971 Without Question 12

0.8775920 Without Question 13 0.8338930 Without Question 13

$`Ordinal Theta for all Question=`  0.8895967 $`Cronbach's Alpha for all Question=` 0.8551825


نتيجه آلفاي کرونباخ جدول بالا مشابه با نرم افزار SPSS مي باشد. همچنين تتاي ترتيبي نيز نتيجه مشابه با آلفاي کرونباخ ارائه مي دهد با اين تفاوت که تتاي ترتيبي برآوردگر دقيق تر نسبت به آلفاي کرونباخ براي پايائي سوالات ارائه مي کند.

نتيجه گيري:

با توجه به کم برآورد پايائي توسط آلفاي کرونباخ توصيه مي شود پايائي سوالات ترتيبي با استفاده از تتاي ترتيبي سنجيده شود.


منابع :

1- Armor, D. J. (1974). Theta reliability and factor scaling. Sociological methodology, 17-50.

2- Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika. 16, 297-334.

3- Diener, E , Emmons, R. A., Larsen, R. J., & Griffin, S. (1985). The satisfaction with life scale. Journal of Personality Assessment, 49, 71-75 .

4- Lord, F. M. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading MA: Addison-Wesley Publishing Company.

5- Zumbo, D. B., Gadermann, A. M., and Zeisser, C. (2007). Ordinal versions of coefficient alpha and theta for Likert rating scales. Journal of modern applied statistical methods, 6, 21-29.

6- اميدي، م. (1387). طراحی نظام فناوری اطلاعات و ارتباطات به منظور آموزش کارگزاران خصوصی بيمه کشاورزی ايران. رساله دکتری واحد علوم و تحقيقات دانشگاه آزاد اسلامی. 

  

پيوست الف  (برنامه محاسباتي آلفاي کرونباخ و تتاي ترتيبي توسط نرم افزار R)

Alpha<-function(all_data){

N<-ncol(all_data)

  D<-c()  

Q<-c()

# Cronbach’s alpha calculation

Alpha_Cronbach<-function(data){

k<-ncol(data)  

s<-cov(data)  

A<-c()

sumcov<-sum(s) 

for(i in 1:k){

A<-c(A,s[i,i]) }

sumcov<-sumcov-sum(A)

alpha<-1/((k-1)*mean(A)/sumcov+(1-1/k))

return(alpha) }

 # Ordinal’s theta calculation

theta_ordinal<-function(data){

p<-ncol(data)

p/(p-1)*(1-1/max(eigen(cor(data))$value)) }

for (j in 1: N){

D<-c(D,Alpha_Cronbach(all_data[-j]))

Q<-c(Q,theta_ordinal(all_data[-j])) }

D<-c(D)

list("Alpha if a Question Deleted" = data.frame("New "=""," Alpha"=D, row.names=paste("Without Question.",1:N))

,"Cronbach's Alpha for all Question="=Alpha_Cronbach(all_data),

"Ordinal Theta if a Question Deleted"=data.frame("New "="","Theta"=Q, row.names=paste("Without Question.",1:N))

,"Ordinal Theta for all Question="=theta_ordinal(all_data)) }


+ نوشته شده در  چهارشنبه 7 تیر1391ساعت   توسط محمد حسین ضرغامی  | 

دارای بودن سواد آماری

 

سواد آماري بر تصميم گيريها با استفاده از آمار به عنوان سند و مدرک متمرکز شده است، همانگونه که سوادخواندن و نوشتن بر استفاده از کلمات متمرکز شده است.

 

سواد آماري به ما کمک مي کند تا داده هاي زندگي خود را به اطلاعاتي قابل اعتماد و درست تبديل کنيم و توسط آن برنامه ريزي صحيحي در زندگي داشته باشيم

 

با سواد آماري کسي است که علاوه بر استفاده صحيح از اطلاعات پيرامون خود بتواند اطلاعات صحيح را از اطلاعات نادرست تشخيص دهد

 

با سواد آماري کسي است که با ترفندهاي جمع آوري و تجزيه و تحليل اطلاعات آماري آشنايي داشته و به راحتي تحت تاثير اطلاعات نادرست قرار نگيرد. اهميت اين مطلب تا آنجا است که در حال حاضر در کشورهاي توسعه يافته داشتن سواد آماري همتراز سواد خواندن و نوشتن تلقي شده و علم آمار را در رده بيست تحول اول زندگي بشر در هزاره قبل قرار داده است. سوال اينجاست که سواد آماري ما تا چه اندازه است

منبع:

http://www.savadeamari.com/index-2.html

+ نوشته شده در  سه شنبه 23 خرداد1391ساعت   توسط محمد حسین ضرغامی  | 

محاسبه حجم نمونه با استفاده از فرمول

"یکی از متداول ترین سوالات محققان. محاسبه اندازه نمونه برای مطالعه برآورد شیوع موضوع مورد نظر در جمعیت هدف است در بسیاری از کتاب ها (دانیل، 1999، Lwanga و Lemeshow،

1991) این موضوع بحث شده است. هدف از انجام محاسبات مربوطه، تعیین حجم نمونه مناسب به منظور برآورد شیوع جمعیت با دقت خوب است. اما محاسبه آن با استفاده از فرمول ساده است و شامل چند مرحله ساده است. با این حال ، تصمیم گیری برای انتخاب مقادیر مناسب از پارامترهای مورد نیاز در فرمول در برخی شرایط چندان ساده نیست. در این مقاله ، مشکلاتی که پژوهشگران مواجه می شوند و راه حل رسیدگی به این مشکلات مطرح شده است.


نحوه محاسبه حجم نمونه


از فرمول ساده زیر (دانیل، 1999) می توان استفاده کرد:




 


 


 


 


 


که در آن n حجم نمونه،


Z = Z برای سطح اطمینان


P = میزان شیوع انتظار و یا نسبت ابتلا به بیماری یا شرایط موردنظر )یعنی اگر 20 ٪، P= عدد 0.2وارد شود)


d = دقت (به نسبت یک اگر 5% بود عدد d=0.05 وارد شود)


آماره Z (:در سطح اطمینان 95 درصد، که در مطالعات علوم پزشکی مقداری مرسوم است، ارزش Z 1.96 است. در این مطالعات ، محققان نتایج خود را با فاصله اطمینان 95 ٪ (CI). اعلام می کنند. محققانی که می خواهید به فاصله اطمینان بیشتری داشته باشند از مقدار 99 ٪ در مورد تخمین خود استفاده می کنند، ارزش Z در در فاصله اطمینان برابر با 2.58 است.


نسبت P مورد انتظار : این نسبت (شیوعی مساله ای مانند بیماری یا مشکلی است که محققان قصد دارند در مطالعه میزان آن را برآورد کنند. گاهی اوقات، پژوهشگران متعجب و متحیر اند که این مدارا را ما نمی دانیم. و اصلا به همین دلیل است که قصد انجام این مطالعه را داریم. پژوهشگران باید درک کنند که مقیاس P از عدد صفر تا یک متغیر است، حجم نمونه بسته به مقدار P (شکل 1) تغییر می کند. بنابراین، ما باید برای بدست آوردن تخمینی از میزان شیوع یا همان P به منظور محاسبه حجم نمونه در بسیاری از از مطالعات قبلی استفاده کنیم. در این مقاله ، P به صورت کسری از یک، برای استفاده فرمول.بیان می شود برای مثال ، اگر شیوع یک بیماری 20 ٪، سپس P برابر است با 0.2.


دقت (d) برای محققان درک این مقدار خیلی مهم است .از فرمول ، بالا می توان درک کرد حجم نمونه به طور معکوس با مربع (d2)ارتباط دارد.


در پایان مطالعه ، ما نیاز بیان شیوع بیماری با فاصله اطمینان 95 ٪ داریم. به عنوان مثال ، شیوع در نمونه 40 ٪ و فاصله اطمینان 95 ٪ است. 30 ٪ تا 50 ٪. این بدان معنی است که مطالعه شیوع جمعیت مساله را بین 30 ٪ و 50 ٪ برآورد کرده است. لطفا توجه کنید که دقت (d) برای این تخمین 10 ٪ (یعنی 40 ٪ ± 10 ٪ = 30 ٪ ~ 50 ٪) می باشد. این نشان می دهد که عرض CI دو برابر دقت CI = 2d است.


اما این فاصله CI بسیار گسترده است (30 ٪ تا 50 ٪ ، میزان فاصله 20 ٪ است) ، ممکن است به عنوان یک برآورد ضعیف در نظر گرفته. شود و اکثر محققان می خواهند CI باریک تری را در نظر بگیرند تا دقت مطالعه برای براورد شیوع بهتر شود. برای بدست آوردن CI دقیقتر ، ما نیاز به طراحی یک مطالعه با d کوچکتر (دقت بهتر یا خطای کوچکتر) داریم.). برای مثال ، اگر محققان بخواهند به عنوان CI ٪10 باشد (0.1) ،مقدار d باید در 0.05در نظر گرفت شود.


نکات عملی برای تعیین پارامترهای اندازه نمونه



تعیین دقیق d: دقت مناسب برای مطالعات شیوع چیست؟ بسیاری از کتابها و راهنماهای محاسبه حجم نمونه تهیه شده است، اما هیچ توصیه قطعی وجود ندارد. محققان به طور کلی در نهایت همه اعداد و ارقام محاسبتای برای اندازه مطالعه معمولا در محدودیت های خود از قبیل منابع مالی ، زمان و یا در دسترس بودن افراد گرفتار می شوند و ناچار به تغییر در حجم نمونه می شوند. . با این حال ، ما باید در ابتدا حجم نمونه را با دقت معقول یا حداقل قابل قبول محاسبه کنیم و سپس منتظر دیگر محدودیت ها باشیم.


براساس تجربه ، دقت یا d معادل 5 ٪ در صورتی که شیوع یک بیماری ، بین 10 ٪ و 90 ٪ می باشد. مقداری مناسب است.



این دقت عرض فاصله اطمینان 95 ٪ را به 10 ٪ می رساند (به عنوان مثال 30 ٪ تا 40 ٪ یا 60 ٪ تا 70 ٪) با این حال ، گاهی اوقات شیوع یک بیماری ، به کمتر از 10 ٪ یا بیشتر از 90 ٪ می رسد و در این شرایط دقت 5 ٪ نامناسب به نظر می رسد. برای مثال ، اگر شیوع 1 ٪ باشد (در یک بیماری نادر است) و دقت همچنان 5 درصد باشد؛ براساس جدول زیر مقادیر فاصله اطمینان به مقادیر حد بالا و پایین نامناسبی سوق داده می شود که منجر به خطا در برآورد صحیح میگردد.


بنابراین ، توصیه می کنیم d به عنوان نیمی از P اگر شیوع زیر 0.1 (10 ٪) و یا بالای 0.9 (90 ٪) است محاسبه شود، d می تواند به صورت (0.5 (1-P)) محاسبه شود. برای مثال ، اگر P 0.04 است، محققان می توانند d = 0.02 در نظرگرفته، و اگر P 0.98 باشد، توصیه می کنیم d = 0.01.در نظر گرفته شود.. محققان همچنین ممکن است دقت را کوچکتر از چیزی که محاسبات نشان می دهد در نظر بگیرند مثلا اگر محدودیت منابع وجود دارد ، محققان ممکن است از d بررگتری در مطالعه مقدماتی استفاده کنند، محققان ممکن است استفاده از یک d بزرگتر (به عنوان مثال> 10 ٪( با این حال ، برای توجیه انتخاب d باید به وضوح در انتشار مقاله خود موضوع را اعلام کنند (به عنوان مثال به علت محدودیت منابع) علاوه بر این ، d بزرگتر باید با فرض وجود توزیع نرمال باشد که در ادامه درباره آن صحبت خواهد شد.




 


برآورد P

`انتخاب P یا مقدر شیوع از مطالعات امری پیچیده است. محققان در بررسی متون به اعداد و ارقام مختلفی برخورد میکنند.. استخراج ، P از مطالعات با طرح مطالعه مشابه و جامعه مورد مطالعه شبیه تر و از مطالعات اخیر بیشتر ترجیح داده می شود.


اما اگر ما یک طیف وسیعی از P یافتیم، به عنوان مثال ، 20 ٪ تا 30 ٪ ، ما باید مقدار 30 ٪ را به عنوان P در نظر گیریم تا براساس فرمول به اندازه بزرگتر نمونه منجر می شود.. اگر محدوده 60 ٪ تا 80 ٪ ،بود مقدار 60 ٪ باید انتخاب شود تا یک اندازه نمونه بزرگتر به دست آید.. اگر محدوده 40 ٪ تا 60 ٪ ،عدد 50 ٪ انتخاب خواهد شد که حجم نمونه بزرگتری به دست خواهد داد. Macfarlane (1997) همچنین پیشنهاد کرد که اگر شک در مورد مقدار P وجود داشت ، بهتر است به مقدار 50 ٪ به دلیل احتمال آن برای اندازه نمونه بزرگتر متمایل شد.


تنظیم P = 0.5 لزوما به ارائه بزرگترین اندازه نمونه منجر نمی شود


بعضی از کتابها و راهنماهای نشان می دهد که اگر تخمین خوبی برای P غیر ممکن است به P مقدار برابر 0.5 بدهید تا حجم نمونه حداکثر محاسبه شود(دانیل ، 1999 ، Lwanga و Lemeshow ، 1991) . به نظر ما ، این پیشنهاد را باید با احتیاط نگاه کرد. اگر P بین 10 ٪ و 90 ٪ باشد این راهنمایی خوبی است که P را 0.5 در نظر گیریم(در صورتی که برآورد بهتر غیر ممکن است) به زیرا بزرگترین حجم نمونه محاسب می شود.


با این حال ، اگر P بسیار کوچک (<10 ٪) و یا بسیار بزرگ (> 90 ، باشد ، ما ممکن است یک نمونه اندازه بزرگتر از آن که با استفاده از فسفر = 0.5 محاسبه شده است داشته باشیم.(شکل 1)


استدلال های ما به شرح زیر است. در مرحله اول ، به عنوان مثال ، اگر محاسبه با استفاده از P = 0.5 و d = 0.05 انجام شود ، به دلیل اینکه محقق نمیتواند P را برآورد کند حجم نمونه 385 محاسبه می شود. با این حال ، اگر P واقعی متاسفانه 1 ٪ باشد، محقق ممکن است ، به طور متوسط ​​، 3 یا 4 مورد (بیماری) از 385 نفر و یا حتی ممکن است هیچ مورد بیماری را در مطلعه پیدا نکند


. ثانیا ، با این تعداد کم از موارد (بیماری) ، شرط توزیع نرمال که پیشفرض لازم برای درنظرگرفتن این مقدار برای P که در این محاسبه حجم نمونه استفاده شده است، نیز رعایت نخواهد شد.یه طور مشابه ، اگر P یا همان شیوع بیش از حد بزرگ (به عنوان مثال 99 ٪) باشد، با حجم نمونه از 385 ، محققان ممکن است تنها چند غیر مورد بیمار (nondiseases) شناسایی کنید یا شاید هم همه نمونه ها بیمار باشند. ، و دوباره ،شرط وجود توزیع نرمال در مطالعه رعایت نخواهد شد.


در عمل ، محققان قبل از اعمال این P = 0.5' باید کمی محتاط عمل نمایند. خیلی سخت نیست برای محققان که به مدد تجربه خود، که برآورد کنند که آیا شیوع یا P کمتر از 10 ٪ ، بین 10 ٪ و 90 ٪ یا بالاتر 90 ٪ است. در غیر این صورت ، یک مطالعه مقدماتی (به عنوان مثال با حجم نمونه از 20 ~ 30) می تواند به راحتی به کشف اینکه P. بین 10 ٪ -90 ٪ است کمک کند.،پس از آن انتخاب P = 0.5' بی خطر و قابل استفاده است.


فرض توزیع نرمال


روش محاسبه حجم نمونه که در بالا گفته شد به شرط وجود توزیع نرمال است. یعنی فراوانی هر دو گروه مورد و غیر مورد در نمونه انتخاب شده باید بزرگتر از 5 باشد. در اندازه های نمونه کوچک ممکن است این فرض تحقق پیدا نکند ، و محقق باید این مساله را بررسی کند که حتما توزیع نرمال باشد. این فرض پس از محاسبه نمونه در روش انتخاب مقدار d به میزان نصف P صادق است.


اصلاح جمعیت محدود


فرمولی که در این مقاله تا اینجا گفته شد زمانی معتبر است که حجم نمونه محاسبه شده کوچکتر از یا برابر با 5 ٪ از اندازه جمعیت (N / n ≤ 0.05) (دانیل ، 1999). اگر این نسبت بزرگتر از 5 درصد باشد باید از فرمول زیر استفاده شود.


فرمول اصلاح شده برای جمعیت محدود (دانیل ، 1999) به شرح زیر است:






 


نمونه برداری چند مرحله ای یا خوشه ای

دو فرمول گفته شده تا اینجا تا زمانی معتبر هستند که نمونه گیری تصادفی ساده و یا روش نمونه گیری تصادفی سیستماتیک.استفاده شود. نمونه گیری خوشه ای یا چند مرحله ای نیاز به حجم نمونه بزرگتر برای رسیدن به همان دقت دارد. بنابراین، محاسبه حجم نمونه با استفاده از فرمول های فوق نیاز به چند برابر شدن بر اساس نوع مطالعه دارند (deff) (کوکران ، 1977) شده. برای مثال ، در بررسی خوشه ای پوشش ایمن سازی ، اثر مطالعه (Design effect) معادل دو می شود ((Macfarlane ، 1997) این بدان معنی است که به روش نمونه گیری خوشه ای نیاز به دو برابر حجم نمونه براساس فرمولهای بالا می باشد.


با این حال ، در عمل ، به ندرت محققان اثر مطالعه خود را در مقالات منتشره گزارش می کنند. چه کسی ممکن است انجام دهیم این است تا با نویسندگانی که در چاپ این مقالات و درخواست برای اثر طراحی کنند. قویا توصیه میشود که اثر مطالعه توسط محققان درخواست گزارش شود.. اگر اثر مطالعه شده، در پایان در دسترس نباشد ، مطالعه پایلوت می تواند به منظور برآورد اثر مطالعه انجام شود. به طور معمول ، نمونه برداری خوشه ای چند مرحله ای در مقیاس وسیع به کار میروند ، و انجام یک مطالعه مقدماتی به چند دلیل در مرحله اول کار با ارزشی است. محققان باید با متخصص آمار قبل از انجام چنین مطالعه مشورت کنند.


" حجم نمونه مطالعه" بزرگتر بهتر است همیشه درست نیست


یکی از اهداف استفاده از فرمول مناسب محاسبه حجم نمونه است اما نه برای به دست آوردن بزرگترین اندازه نمونه ممکن. هدف بدست آوردن اندازه نمونه مطلوب و یا مناسب است. نمونه های بزرگ بی هدف، بی ارزش بوده و مقرون به صرفه نیست و حتی در برخی از شرایط غیراخلاقی است. به عنوان مثال، در یک آزمایش یک داروی جدید، یک نمونه بسیار بزرگ ممکن است به این نتیجه گیری منجر شود که داروی جدید به طور قابل توجهی بهتر از داروی قدیمی به لحاظ آماری است هر چند اختلاف بالینی ممکن است ناچیز باشد. جدول زیر نشان می دهد که اگرچه در حجم نمونه صحیح اختلاف ناچیز است اما چهار برابر کردن حجم نمونه به ایجاد اختلاف آماری معنی دار حدود پنجاه درصدی منجر می شود.

منبع

http://www.telehealth.ir/fa/index.php/1389-01-28-15-52-44/samplesize.html?showall=1

+ نوشته شده در  دوشنبه 8 خرداد1391ساعت   توسط محمد حسین ضرغامی  | 

سواد آماري

سواد آماري بر تصميم گيريها با استفاده از آمار به عنوان سند و مدرک متمرکز شده است، همانگونه که سوادخواندن و نوشتن بر استفاده از کلمات متمرکز شده است. سواد آماري به ما کمک مي کند تا داده هاي زندگي خود را به اطلاعاتي قابل اعتماد و درست تبديل کنيم و توسط آن برنامه ريزي صحيحي در زندگي داشته باشيم با سواد آماري کسي است که علاوه بر استفاده صحيح از اطلاعات پيرامون خود بتواند اطلاعات صحيح را از اطلاعات نادرست تشخيص دهد با سواد آماري کسي است که با ترفندهاي جمع آوري و تجزيه و تحليل اطلاعات آماري آشنايي داشته و به راحتي تحت تاثير اطلاعات نادرست قرار نگيرد. اهميت اين مطلب تا آنجا است که در حال حاضر در کشورهاي توسعه يافته داشتن سواد آماري همتراز سواد خواندن و نوشتن تلقي شده و علم آمار را در رده بيست تحول اول زندگي بشر در هزاره قبل قرار داده است. سوال اينجاست که سواد آماري ما تا چه اندازه است؟

ثلث آمار, آماردان و آمارخوان 

ما معمولا آمارخوان هستيم و برخي آماردان. آنچه که بايد ارزيابي شود کيفيت اين دو است وگرنه علم آمار به عنوان يک روش علمي شناخته شده در دنيا بر پايه علم رياضي است که صحت و دقت آن باعث شده است تا در مقالات علمي به عنوان اجبار در بکارگيري و اثبات مطلب توسط آن مطرح باشد 
دو ضربدر دو چند مي شود
پ آماردان : چهار
پ رياضي دان: حد چهار بعلاوه و منهاي مقداري کوچک که به صفر ميل مي کند
پ مهندس: طبق جداول محاسباتي تقريبا چهار است
پ کارگر: بستگي به نظر کارفرما و نوع قرارداد دارد
پ کارمند: اگر فردا تشريف بياوريد عرض مي کنم
پ سياستمدار: بستگي دارد
پ آمارندان: چند مي خواي باشه

+ نوشته شده در  پنجشنبه 31 فروردین1391ساعت   توسط محمد حسین ضرغامی  | 

کاربرد آمار در رشته های مختلف

کاربرد آمار در رشته های مختلف

احتمال احتمال کلاسیک یا پیشین احتمال پسین مدل های احتمال فضای نمونه احتمال شرطی و استقلال پیشامدها پیشامدهای مستقل احتمال پیشین و احتمال پسین توزیع های احتمال متغیرهای تصادفی گسسته توزیع احتمال متغیرهای تصادفی پیوسته توزیع احتمال توام دو متغیر تصادفی گسسته توزیع احتمال توام دو متغیر تصادفی پیوسته قضایای حدی نابرابری مارکوف قضیه حد مرکزی قضیه حدمرکزی برای متغیرهای تصادفی مستقل با توزیع های مختلف قانون قوی اعداد بزرگ


 

طرح آزمایشها کاربرد طرح آزمایشها در کشاورزی آزمایشهای عاملی طرح های عاملی دو به توان کا طرح های عاملی سه به توان کا طرح های تو در تو طرح های عاملی تو در تو آزمایشهای با محدودیت های تصادفی کردن آزمایش های عاملی طرح کرتهای خرد شده آزمایشهای عاملی مخلوط کردن با بلوک طرح های عاملی کسری طرح های بلوکی طرح های بلوکی کامل تصادفی شده طرح های مربع لاتین


متغیرهای تصادفی توابع توزیع توابع چگالی متغیرهای تصادفی گسسته متغیرهای تصادفی پیوسته امیدریاضی و گشتاورها نامساوی چبیشف نامساوی جنسن گشتاورها و توابع مولد گشتاورها


فرآیندهای تصادفی متغیرهای تصادفی امیدریاضی امید شرطی فرایند پواسون فرآیند حرکت براونی فرآیندهای تصادفی و زنجیرهای مارکف برابری چپمن کلموگروف حالتهای گذرا و بازگشتی توزیع های مانا زنجیر مارکف جهشی فرآیند زاد و مرگ زنجیرهای مارکف زمان پیوسته


توزیع های مختلف آماری توزیع پواسون توزیع هندسی توزیع فوق هندسی توزیع دوجمله ای توزیع نرمال توزیع گاما توزیع بتا توزیع نمایی توزیع های توام توزیع های چوله توزیع یکنواخت گسسته توزیع دوجمله ای منفی سایر توزیع های گسسته توزیع نرمال توزیع نمایی و گاما سایر توزیع های پیوسته توزیع نرمال دومتغیره توزیع کی دو توزیع F توزیع t استودنت


سری زمانی سری زمانی پیشرو سری زمانی تاخیری سری زمانی همزمان سری گره خورده سری وابسته های قیمت تغییرات دوره ای در سری زمانی تغییرات فصلی در سری زمانی پیش بینی و سری زمانی روند خطی روند نمای محاسبه شاخص های فصلی تحلیل دوره ای و پیش بینی کوتاه مدت در سری زمانی بررسی روند سری زمانی مانا هموارسازی سری های زمانی مدلهای اتورگرسیو شاخص قیمت


شبیه سازی


روشهای ناپارامتری صدک ها دهک ها چندک ها میانه مد میانگین فراوانی ها  فراوانی تجمعی فراوانی نسبی فرصت از دست رفته فضای نمونه ای همبستگی ضریب همبستگی ضریب تعیین جزئی ضریب تعیین تعدیل شده ضریب تغییرات ضریب اطمینان همبستگی پیرسون ضریب همبستگی اسپیرمن ضریب تعیین کوواریانس و ضریب همبستگی نامساوی کشی شوارتز آزمون نیکویی برازش کلموگروف اسمیرنف نوارهای اطمینان برای تابع توزیع تجمعی استنباط درباره چندک ها آزمون فرض برای چندک ها آزمون علامت نیکویی شیوه های ناپارامتری نیکویی برازش آزمون توان دوم خی جامعه های چندجمله ای رگرسیون خطی ساده رگرسیون چندگانه مدل های رگرسیونی چندگانه تحلیل مانده ها آماره های ترتیبی چندک ها و پوشش ها فاصله تحمل در روشهای ناپارامتری آماره های رتبه ای آزمون جمعی رتبه ای ویلکاکسون آزمون من ویتنی آزمون های ناپارامتری همبستگی دو متغیر تصادفی آزمونهای خوبی برازندگی توزیع توزیع تجبری و آزمونهای مربوط به آن


 


رگرسیون خط رگرسیون رگرسیون لجستیک همبستگی و وابستگی بهترین تابع پیش بینی کننده رگرسیون خطی ساده ضریب تعیین مدل های غیر خطی رگرسیون فضای برداری برآورد پارامترها در مدل های خطی چندمتغیری ضریب همبستگی جزئی و چندگانه رگرسیون با کمترین مجموع قدرمطلق خطا


نمونه گیری سرشماری و نمونه گیری و توزیع های نمونه گیری جامعه آماری توزیع نمونه قانون اعداد بزرگ قضیه حد مرکزی توزیع های برنولی و پواسن توزیع کشی نمونه گیری از توزیع های نرمال میانگین نمونه آمارها ترتیبی توزیع های مجانبی تابع توزیع تجمعی نمونه ای نمونه گیری تصادفی بدون جایگذاری نمونه گیری تصادفی با جایگذاری واریانس میانگین نمونه های مختلف برآورد حجم نمونه محاسبه و برآورد واریانس محاسبه حجم نمونه برای داده های پیوسته محاسبه حجم نمونه در نمونه گیری برای نسبت ها نمونه گیری تصادفی با طبقه بندی و نمونه گیری طبقه ای تخصیص اپتیمم تخصیص نیمن نمونه گیری با طبقه بندی برای نسبتها ساختن طبقات نمونه گیری با احتمال متغیر روش لاهیری روش خرد کردن


 


برآوردها برآورد درستنمایی ماکسیمم سازگاری و BAN میانگین توان دوم خطا بسندگی آماره های بسنده آماره های بسنده مینیمال خانواده نمایی برآورد نااریب بسندگی و کامل بودن پایایی پایایی مکان پایایی مقیاس برآوردگرهای بیزی توزیع پسین تابع زیان برآوردگر مینیماکس


برآورد بازه ای و بازه های اطمینان کمیت محوری بازه اطمینان برای میانگین بازه اطمینان برای واریانس بازه اطمینان برای اختلاف میانگین ها ناحیه اطمینان مشترک برای میانگین و واریانس روش کمیت محوری روش آماری بازه های اطمینان بزرگ نمونه ای برآوردهای بازه ای بیزی


آزمون فرض ها فرض ساده تواناترین آزمون آزمونهای UMP بطور یکنواخت تواناترین آزمون ها تابع زیان فرض های مرکب آزمون نسبت درستنمایی تعمیم یافته آزمون فرض ها آزمون های کی دو آزمون های استقلال در جدولهای توافقی آزمون فرض و بازه های اطمینان تعریف آزمون نسبت احتمال دنباله ای آزمون ها آزمون های دو طرفه آزمون های رتبه علامت دار آماره آزمون

منبع: http://appliedstatistics.mihanblog.com/post/author/411497

+ نوشته شده در  پنجشنبه 18 اسفند1390ساعت   توسط محمد حسین ضرغامی  | 

خلاصه اي از آمار مقدماتي براي دانشجويان حوزه هاي انساني

   انسان‌ها در زندگی به دنبال شناخت‌اند تا از این طریق بتوانند کنترل پدیده‌ها را در دست گیرند و روشی که از طریق آن به شناخت می‌رسیم، پژوهش است که منجر به تولید نظریه می‌شود؛ پس نظریه‌ها ابزار شناخت‌اند؛ (منظور از شناخت، شناخت علمی است).

  در علم به پدیده‌ها متغیر می‌گویند. متغیر در برابر ثابت است، که به معنی مطالعه منابع واریانس است. 

  سطوح یا مقیاس‌های اندازه‌گیری: 1. اسمی: اعدادی به متغیر می‌دهیم که برای نامیدن است؛ 2. ترتیبی: اعداد در این مقیاس مرتب شده و نظم دارند؛ 3. فاصله‌ای: در این مقیاس اعداد یا ارزش ها دارای فواصل مساوی می‌باشند؛ 4. نسبتی: تمام ویژگی‌های مقیاس‌ها را دارد، صفر مطلق هم دارد؛ و مقیاس جدیدی به نام مقیاس مطلق.

   متغیرها براساس دو ملاک تقسیم بندی می‌شوند: 1. ارزشی که می‌پذیرند، که به مقوله ای و کمی تقسیم می‌شود. . 2. از حیث نقشی که در تحقیق دارند، که به اطلاعاتی (مستقل، وابسته، تعدیل کننده، واسطه‌ای) و مزاحم (کنترل، مداخله‌گر و تصادفی) تقسیم می شود.

  آمار به طور کلی به دو دسته نظری و کاربردی تقسیم می‌شود. در آمار کاربردی ما آمار توصیفی و استنباطی را داریم. در اینجا بحث را با آمار توصیفی تک متغیری آغاز می کنیم که شامل نمایش گرافیکی (جدول، نمودار) و شاخص‌های عددی است که شامل شاخص‌های مرکزی، شاخص‌های پراکندگی و شکل توزیع (متقارن، کجی و کشیدگی) است.  

شاخص‌های مرکزی عبارتند از:  نما، میانه، میانگین.

- نما عددی است که بیشترین فراوانی را دارد. میانه نقطه پنجاه درصدی داده‌ها و میانگین مرکز ثقل داده‌هاست. میانگین سه ویژگی دارد:                                                       N=∑X* .1

2. ∑(X- )=0       3. ∑(X- )2 ≤ ∑(X-A)2

o مهم‌ترین کمیت در آمار SS (مجموع مجذورات) است.

شاخص‌های پراکندگی عبارتند از: دامنه تغییرات R=XH-XL+1))؛ انحراف چارکی (Q=Q3-Q1/2)؛ انحراف متوسط (AD=∑|X-X|/N)؛ واریانس (S2=∑(X-X)2/N) و انحراف استاندارد (مجذور واریانس).

شکل توزیع به سه صورت است:

تقارن: در منحنی نرمال در حالت تقارن مد، میانه و میانگین برابر است.

کجی: در حالت کجی منفی مد بزرگتر از میانه و میانه بزرگتر از میانگین است. و در حالت کجی مثبت میانگین بزرگتر از میانه و میانه بزرگتر از مد است.

کشیدگی: در شکل توزیع که بلند و رو به بالاست، نمرات نزدیک به هم یا یکسان اند و منابع واریانس کم است که کشیدگی مثبت دارد. در شکل توزیع مسطح که کشیدگی منفی دارد، نمرات دور از هم‌اند و منابع واریانس زیادند.

نمره استاندارد Z را زمانی استفاده می‌کنیم که 2 نمره خام را قابل مقایسه کنیم. یعنی مبدا و مقیاس را یکی می‌کنیم. نمره Z را از طریق این فرمول بدست می‌آوریم: Z=X- /S 

  آمار توصیفی برای توزیع‌های چند‌متغیری شامل جدول (جدول فراوانی دو بعدی، و توافقی برای فراوانی‌هاست)، نمودار (پراکنش، ون)و شاخص‌های عددی است. شاخص‌های عددی شامل کواریانس، همبستگی و رگرسیون می‌شود.

ارتباط زمانی است که تغییرات دو متغیر هم گام‌اند، یا تغییر یک متغیر با تغییر متغیر دیگری همراه است. ارتباط را کوواریانس نشان می‌دهد. عیب آن این است که با تغییر واحد مقدار آن تغییر می‌کند. 

برای حل مشکل کواریانس از همبستگی استفاده می‌کنیم. ضریب همبستگی مقدار ارتباط همزمان و همگام بین دو متغیر را نشان می‌دهد؛ که آن را با r نشان می دهیم. R2 ضریب تعیین است که نسبتی از واریانس مشترک به کل واریانس دو متغیر است. ضریب همبستگی، شدت (1 تا0) و جهت (- تا+) را نشان می‌دهد. انواع ضریب همبستگی براساس تقارن و خطی بودن متفاوت است.

رگرسیون تکنیکی است مشابه همبستگی که نشان می‌دهد تغییرات یک متغیر به چه اندازه با تغییرات متغیر دیگر همراه است. در واقع هدف رگرسیون پیش‌بینی از طریق یک خط است، که به آن خط رگرسیون می‌گویند. خطی که با بهترین برازش از میان مجموعه نقاط پراکندگی می‌گذرد، به گونه‌ای که انحرافات حول خط کمینه است.  e2∑= 2(Y- Y/)∑

-  برای رسم خط به شیب خط و عرض از مبدا نیاز داریم. 

- معادله رگرسیون: y=a+ bx+e و معادله خط: y/=a+bx است.

      - خط رگرسیون یک نوع میانگین است که به آن میانگین متحرک می‌گوییم.


+ نوشته شده در  دوشنبه 24 بهمن1390ساعت   توسط محمد حسین ضرغامی  | 

نمودار راداری یا نمودار شبکه ای یا نمودار ستاره ای یا نمودار عنکبوتی

نمودار راداری که نمودار تار عنکبوتی یا گراف ستاره ای نیز گفته می شود، یک نوع نموداری است که از صفحه نمایش فلورسانت رادار الهام گرفته است که در آن تعداد زیادی متغیر بر روی نمودار با مختصات دو بعدی نمایش داده می شود. (Pavement Performance … YAO Hongyun)

در بین ابزارهای صفحه ای شناخته شده به منظور به نصویر کشیدن، نمودار راداری به عنوان یک کاندیدای امیدبخش به منظور نمایش مشاهدات چند متغیره پدیدار شده است.

یک نمودار راداری شامل مجموعه ای از پره (محور) های متساوی الزاویه بوده که هر یک بیان کننده یک متغیر می باشد. 

یک داده از یک متغیر بر روی محور مربوطه چنان نگاشته می شود که فاصله آن از مرکز نسبت به طول محور برابر با مقدار آن متغیر نسبت به بیشینه مقدار ممکن متغیر باشد.

خطوطی نقاط مجاور را به یکدیگر متصل کرده و نهایتاً یک چند ضلعی مشخصه حاصل از مشاهدات بدست می آید. بنابراین نمودار راداری تنها با یک چند ضلعی به محقق کمک کرده تا متغیر (متغیرهای) غالب را برای یک سری مشاهدات تشخیص دهد. یک نمودار راداری با چندین چندضلعی ضعف و قدرت مشاهدات را نسبت به هم مقایسه می کند. (Radar Chart: Scanning …  Yu-Chun Chang)

  


+ نوشته شده در  شنبه 3 دی1390ساعت   توسط محمد حسین ضرغامی  | 

نمودار باكس - ويسكر (جعبه‌اي)

نمودار باكس - ويسكر (جعبه‌اي)

نمودار باكس – ويسكر نموداري است كه به كمك معيارهاي مركزي و پراكندگي، موقعيت مجموعه داده ها را به شكلي بسيار گويا و مفيد ارائه مي دهد. اين نمودار ابتدا توسط آمار شناس معروف توكي ارائه گرديد و با استفاده از يك مستطيل (باكس) در دو خط در دو طرف مستطيل (ويسكر) و به وسيله ميانه، چاركهاي اول و سوم و كمترين و بيشترين اندازه مشاده شده رسم مي شود. با استفاده از اين نمودار مي توان مركزيت،‌ پراكندگي و چولگي داده ها را تفسير نمود.


چگونه یک نمودار باکس-ویسکر برای مجموعه داده های زیر رسم کنیم؟


4.3, 5.1, 3.9, 4.5, 4.4, 4.9, 5.0, 4.7, 4.1, 4.6, 4.4, 4.3, 4.8, 4.4, 4.2, 4.5, 4.4


گام اول: مرتب کردن داده ها به صورت صعودی، براي اين منظور مي توان از نمودار شاخه و برگ نيز استفاده نمود.:


3.9, 4.1, 4.2, 4.3, 4.3, 4.4, 4.4, 4.4, 4.4, 4.5, 4.5, 4.6, 4.7, 4.8, 4.9, 5.0, 5.1


گام دوم: مشخص کردن میانه داده ها:


به دلیل اینکه تعداد داده ها 17 است، بنابراین 9 امین مقدار در میان اعداد مرتب شده میانه داده ها خواهد بود


3.9, 4.1, 4.2, 4.3, 4.3, 4.4, 4.4, 4.4, 4.4, 4.5, 4.5, 4.6, 4.7, 4.8, 4.9, 5.0, 5.1


میانه عبارت است از: Q2 = 4.4


گام سوم: مشخص کردن میانه داده های هر یک از دو دسته زیر(چاركهاي اول و سوم داده ها):


3.9, 4.1, 4.2, 4.3, 4.3, 4.4, 4.4, 4.4


و

4.5, 4.5, 4.6, 4.7, 4.8, 4.9, 5.0, 5.1


دسته اول دارای 8 مقدار است، بنابراین میانه داده های دسته اول(چارک اول) برابر است با میانگین دو داده وسطی، یعنی:


Q1 = (4.3 + 4.3)/2 = 4.3


میانه داده های دسته دوم(چارک سوم) برابر است با


Q3 = (4.7 + 4.8)/2 = 4.75


گام چهارم: رسم يك خط افقي و مدرج کردن آن بطوری كه بتوان همه داده ها را روي آن نشان داد.


گام پنجم: مکان كوچكترين عدد مشاهده شده ، بزرگترين عدد مشاهده شده ، میانه Q2 ، چارک اول Q1 و چارک سوم Q3 را تعيين مي كنيم.

گام ششم: بالاي خط مدرج شده مستطيلي رسم مي كنيم كه طول آن برابر با Q3- Q1 (برد چاركها) بوده و از نقطه Q1 شروع و به Q3 ختم شود و عرض مستطيل به اندازه معقول در نظر گرفته مي شود. اين مستطيل را باكس مي ناميم. اندازه ميانه را به صورت خطي به موازات عرض مستطيل رسم نموده و مستطيل را به وسيله يك خط منقطع به موازات خط مدرج شده به دو قسمت تقسيم مي كنيم.

گام هفتم: مرزهاي داخلي و خارجي داده ها با توجه به روابط زير تعيين می کنیم.


مرز داخلی پایین= Q1 – 1.5 *( Q3- Q1) = 3.625

مرز داخلی بالا= Q3+ 1.5 *( Q3- Q1) = 5.425

مرز خارجی پایین= Q1 – 3 *( Q3- Q1) = 2.95

مرز خارجی بالا= Q3+ 3 *( Q3- Q1) = 6.1

گام هشتم: با استفاده از داده هاي مرتب شده، دو اندازه كوچكترين و بزرگترين داده را كه داخل مرزهاي داخلي قرار دارند، تعيين كرده و خط منقطع وسط مستطيل را تا اين دو نقطه به صورت خط پر ادامه مي دهيم. اين خطوط را ويسكر مي نامند كه از چاركها شروع و به نقاط فوق ختم مي شوند.


نکته

هر عددي كه خارج از مرزهاي داخلي قرار گرفته باشد را يك دادة پرت ناميه و چنانچه بين مرزهاي داخلي و خارجي قرار گيرد آن را داده پرت ضعيف ناميده و با علامت ○ نشان مي دهيم و چنانچه خارج از مرزهاي خارجي قرار گرد آن را داده پرت قوي ناميده و با علامت ● نشان مي دهيم.


با استفاده از نمودار باكس - ويسكر مي توان اطلاعات زير را در مورد داده ها كسب نمود.

الف) اگر ميانه نزديك وسط مستطيل (باكس) باشد توزيع داده ها تقريباً متقارن است.

ب) اگر ميانه در طرف چپ وسط مستطيل باشد توزيع چوله به راست و اگر ميانه در طرف راست وسط مستطيل قرار گيرد توزيع چوله به چپ است.

ج) اگر خطوط دو طرف مستطيل (ويسكرها) تقريباً برابر باشند توزيع داده ها به توزيع متقارن نزديك بوده و در صورت نامساوي بوده خطوط توزيع داراي چولگي است.

د) در مقايسه نمودار باكس - ويسكر دو مجموعه از داده ها مي توان پراكندگي آنها را با توجه به طول مستطيل هاي نمودار با يكديگر مقايسه نمود. مستطيلي كه طول بزرگتري دارد داراي پراكندگي بيشتر مي باشد.

ه) داده هاي پرت ضعيف و داده هاي پرت قوي را با استفاده از نمودار باكس - ويسكر مي توان تعيين نمود.

http://raji_riazi.persianblog.ir/post/38

+ نوشته شده در  چهارشنبه 30 آذر1390ساعت   توسط محمد حسین ضرغامی  | 

نمودار ساقه و برگ و نمودار جعبه ای BOXPLOT AND STEM AND LEAF DIAGRAMS

                                                                                                           

نمودار ساقه و برگ  Stem And Leaf Diagram

نمودار ساقه وبرگ نوعي نمودار براي نمايش فراواني مشاهدات می باشد و برای نمایش یک سری داده کمی گسسته و پیوسته بکار می رود. شکل و پراکندگی داده ها را نمایش می دهد. هر داده یک ساقه و یک برگ دارد. معمولا برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند . برای مثال در عدد 512 عدد 2 برگ و 51 ساقه است. يك‌ نمودار منعكس‌ كننده‌ توزيع‌ فراواني‌ و هيستوگرام‌ است‌ و ضمن‌ نشان‌ دادن‌ شكل‌ هيستوگرام‌،  داده‌ هاي‌ اصلي‌ را نيز نشان‌ مي دهد. در این نمودار بجاي رسم ميله‌ها، فراواني‌ها بشكل اعداد (با نمايش تعداد تكرار و بيان اعداد مشاهده شده) نشان داده می شوند.

برای رسم نمودار ساقه وبرگ این مراحل طی می شود:

1. هر داده  به دو قسمت تقسیم می شود. یک قسمت از داده  ساقه و قسمت دیگر برگ است. برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند. 

2. ساقه ها به ترتیب از کوچک به بزرگ مرتب می شوند. 

3. هر برگ به ساقه مناسب اضافه می شود.

برای درک بهتر، فرآیند تشکیل نمودار ساقه و برگ ارائه می شود. این مثال مربوط به داده های پزشکی است.

80, 85, 110, 95, 95, 100, 45, 95, 130, 75, 80, 70, 80, 100, 120, 110, 125, 75, 100, 40, 75, 110, 150, 75, 95

در داده های بالا عدد سمت راست برای هر داده برگ می باشد؛ مثلا برای عدد 110، 0 برگ است و 11 ساقه است. برای تمام اعداد بعد از اینکه ساقه  ها مشخص شد، باید ساقه ها از کوچک به بزرگ مرتب شوند و به صورت عمودی و یا افقی به ترتیب مشخص شده نوشت. سپس برگ ها در جلوی این ساقه ها نوشته می شوند. مناسب تر آن است که برگ ها نیز به ترتیب از کوچک تا بزرگ یعنی از صفر تا 9 مرتب شوند تا نمای بصری زیبا تر و اطلاعات در مورد داده ها با سرعت و سهولت بیشتری انتقال یابند. می توان بین ساقه ها و برگ ها خطی ترسیم نمود. این نمودار خیلی به نمودار میله ای نزدیک و شبیه است. این نمودار اطلاعات مربوط به نمودارهای میله ای و هیستوگرام را داراست ولی بیشتر از این نمودارها نیز اطلاعات می دهد و برای بررسی بیشتر داده ها نیز می توان از آن استفاده کرد. در زیر مثالی زده شده است که شکل نمودار ساقه و برگ را نشان می دهد.

 


با مقايسه نمودار فوق و نمودار هيستوگرام ديده مي‌شود كه در نمودار هيستوگرام با ايجاد طبقات ديگر دستيابي به مقادير انفرادي مشاهدات امكان پذير نيست اما در نمودار شاخه و برگ ضمن داشتن ايدة تصويري از نحوة توزيع داده ها به يكايك اطلاعات نيز دسترسي داريم.


برای رسم این نمودار در نرم افزار اس پی اس اس، به عنوان مثال، اگر بخواهيم نمودار ساقه و برگ متغير مقدار علوفه مصرفي را براساس متغير گروه‌هاي نژادي گوسفندان رسم كنيم، بعد از انتخاب گزينهDescriptive Statistics از منوي Analyze  و سپس كليك بر روي Explore…، وارد پنجره Explore مي‌شويم. حال متغير Hay را وارد جعبه Dependent List و متغير Ethnic group را وارد بخش  Factor List نموده و از قسمت Display گزينه Plots را انتخاب كرده و بر روي دكمه Plots… كليك مي‌نمائيم.

در ادامه، در پنجره Explore: Plots تنها گزينه Stem-and-Leaf را انتخاب و بترتيب بر روي كليدهاي Continue و  OK كليك مي‌كنيم.










نمودار جعبه ای (Box plot)

نمودار جعبه ای نموداري است كه به كمك معيارهاي مركزي و پراكندگي،  موقعيت مجموعه داده ها را به شكلي بسيار گويا و مفيد ارائه مي دهد. اين نمودار ابتدا توسط آمار شناس معروف توكي ارائه گرديد و  با استفاده از يك مستطيل (باكس)  در دو خط، در دو طرف مستطيل (ويسكر) و به وسيله ميانه، چاركهاي اول و سوم و كمترين و بيشترين اندازه مشاده شده رسم مي شود. با استفاده از اين نمودار مي توان مركزيت،‌ پراكندگي و چولگي داده ها را تفسير نمود.

برای رسم این نمودار:

1. داده ها را به صورت صعودی مرتب می کنیم.

2. میانه داده ها را مشخص می کنیم. 

3. (3) چارک اول و سوم را مشخص می کنیم. 

4. (4) یک خط افقی مدرج که بتوان همه داده ها را روی آن نشان داد رسم می کنیم. 

5. مکان کوچک ترین عدد مشاهده شده، بزرگ ترین عدد، میانه، چارک اول و چارک سوم را تعیین می کنیم. 

6. بالای خط مدرج رسم شده مستطیلی رسم می کنیم که طول آن برابر با Q3- Q1 (برد چارک ها) بوده و از نقطه Q1 شروع و به نقطه Q3 ختم شود و عرض این مستطیل به اندازه معقول در نظر گرفته می شود. اندازه میاننه را به صورت خطی به موازات عرض مستطیل رسم نموده و مستطیل را به وسیله یک خط منقطع به موازات خط مدرج شده به دو قسمت تقسیم می کنیم. 

7. مرزهای داخلی و خارجی داده ها را با توجه به روابطی خاص تعیین می کنیم.

8. با استفاده از داده های مرتب شده، دو اندازه کوچک ترین و بزرگ ترین داده را که داخل مرزهای داخلی قرار دارند، تعیین کرده و خط منقطع وسط مستطیل را تا این دو نقطه به صورت خط پر ادامه می دهیم. این خطوط را ویسکر می نامند که از چارک ها شروع و به نقاط فوق ختم می شوند.

نکته!

هر عددي كه خارج از مرزهاي داخلي قرار گرفته باشد را يك دادة پرت ناميده و چنانچه بين مرزهاي داخلي و خارجي قرار گيرد، آن را داده پرت ضعيف ناميده و با علامت ○ نشان مي دهيم و چنانچه خارج از مرزهاي خارجي قرار گیرد آن را داده پرت قوي که بعضی به آن داده ی انتهایی نیز می گویند ناميده و با علامت ● نشان مي دهيم.

با استفاده از نمودار جعبه ای مي توان اطلاعات زير را در مورد داده ها كسب نمود:

1. اگر ميانه نزديك وسط مستطيل باشد توزيع داده ها تقريباً متقارن است.

2. اگر ميانه در طرف چپ وسط مستطيل باشد، توزيع چوله به راست و اگر ميانه در طرف راست وسط مستطيل قرار گيرد توزيع چوله به چپ است. البته در بعضی از نرم افزارها مانند اس پی اس اس نمودار به صورت عمودی ترسیم می شود. 

3. اگر خطوط دو طرف مستطيل (ويسكرها) تقريباً برابر باشند، توزيع داده ها به توزيع متقارن نزديك بوده و در صورت نامساوي بودن خطوط توزيع داراي چولگي است.

4. در مقايسه نمودار جعبه ای دو مجموعه از داده ها مي توان پراكندگي آنها را با توجه به طول مستطيل هاي نمودار با يكديگر مقايسه نمود. مستطيلي كه طول بزرگتري دارد، داراي پراكندگي بيشتر مي باشد.

5. داده هاي پرت ضعيف و داده هاي پرت قوي را با استفاده از نمودار جعبه ای مي توان تعيين نمود.

نمودار جعبه ای برای داده های یک کلاس آمار بدین شرح است: 

2,2/25,3,3/5,4/25,5/5,6/25,6/5,7,7/25,7/5,8,8,8/5,8/5,10,10,10,10,10/5,10/75,11,11,

11/25,11/5,11/75,11/75,13,14/25,14/5,14/5,14/5,15,15,17/25,18/25     n=36


 


 

 

برای رسم این نمودار در نرم افزار اس پی اس اس، به‌عنوان مثال،  براي رسم نمودار جعبه‌اي مربوط به متغير وزن بدن گوسفندان براساس رده‌هاي مختلف گروه‌هاي نژادي و مقايسه آنها با يكديگر، بعد از انتخاب گزينه Boxplot… از منوي Graphs و سپس انتخاب حالت Simple و زدن Define، متغير Weight  را وارد قسمت Variable و متغير Ethnic group را وارد بخش  Category Axis نموده و بر روي OK كليك مي‌كنيم.


نمودار جعبه ای پهلو به پهلو

اگر براي مقايسه دو يا چند گروه مجزا نمودارجعبه‌اي را رسم و روي يك محور قرار دهيم، نمودار حاصل را نمودار جعبه‌اي پهلو به پهلو مي‌ناميم و ابزار مناسب، براي مقايسة خصوصيات اين گروهها براي صفت كمي مورد مطالعه در اختيار ما قرار مي‌دهد.


مثال : در مقايسه اثرات جانبي دارويي بر فشار خون افراد در دو گروه بيماري حاد و مزمن نمودارهاي زير از فشار خون آنها پس از مصرف دارو تهية شده است.




 



نمودار فوق نشان مي‌دهد، پراكندگي و تمركز هردو در فشار خون بيماران مبتلا به بيماري حاد بيشتر از گروه بيماران مبتلا به بيماري مزمن مي‌باشد. لذا اثر جانبي اين دارو براي بيماري حاد نامناسب‌تر به نظر مي‌رسد.




 



در نهایت این دو نمودار در یک نمایش تصویری از داده ها کاربرد دارند اما نمودار جعبه ای زمانی مورد استفاده قرار می گیرد که هدف، تاکید بر نقاط مشخصی از توزیع برای ارائه اطلاعات به صورت  خلاصه شده می باشد. همچنین این نمودار انجام‌ مقايسه‌ بين‌ چند مجموعه‌ داده‌ را به‌ آساني‌ امكان‌ پذيرمي‌سازد. 

 نمودار ساقه و برگ برای توصیف داده های کمی به کار برده می شود و رسم آن به دلیل از دست ندادن اطلاعات به دیگر نمودارهای فراوانی ترجیح داده می شود.




+ نوشته شده در  سه شنبه 29 آذر1390ساعت   توسط محمد حسین ضرغامی  | 

شاخص های پراكندگي

                                                                                                       

شاخص های  پراكندگي

مبنای علم پراکندگی یا همان تغییر است و در صورتی که تغییر وجود نداشته باشد، علم نیز بی معناست. علم به دنبال تبیین این پراکندگی ها و تغیرات است.

اندازه هاي مركزي مانند ميانگين، ميانه و نما توصيف كننده وضعيت كامل توزيع داده ها نيستند. به عبارت ديگر دو مجموعه داده كه داراي ميانگين هاي يكسان هستند ممكن است پراكندگي متفاوتي داشته باشند و زماني مي‌توان توزيع داده‌ها را دقيقاً توصيف نمود كه علاوه بر شناخت معيار مناسبي براي مركزيت آن، معياري را هم براي پراكندگي آنها تعيين نمود .کاربرد شاخص های پراکندگی تنها برای داده های فاصله ای و نسبتی است. مهمترین آنها عبارتند از:

دامنه تغییرات، واریانس، انحراف معیار، انحراف چارکی، انحراف متوسط،

دامنه تغییرات به شکل روبرو محاسبه می شود.                                                                        R= Xn-X1

كه Xn بزرگترين اندازه و X1 كوچكترين اندازه مشاهده شده است.

دامنه نيز همانند ميانگين تحت تأثير داده هاي پرت قرار مي گيرد و در چنين حالاتي يك معيار مناسب پراكندگي نيست. به علاوه، چون براي محاسبه دامنه فقط از دو اندازه بزرگترين مشاهده و كوچكترين مشاهده استفاده مي شود معمولاً معيار رضايت بخشي براي پراكندگي به حساب نمي آيد.

واریانس و انحراف معیار

مفديدترين اندازه پراكندگي واريانس و يا جذر آن، انحراف معيار داده ها است. اندازه انحراف معيار به ما مي گويد كه مشاهدات تا چه مقدار در اطراف ميانگين آنها قرار دارند، يك اندازه كم براي انحرف معيار مجموعه اي از داده ها نشان دهنده اين واقعيت است كه داده ها در دامنه كوچكي حول ميانگين پراكنده شده‌اند و بالعكس انحراف معيار بزرگ بيان كننده دامنه گسترده‌تري است كه داده ها در حول ميانگين پراكنده گرديده اند. انحراف معیار ریشه دوم مثبت واریانس است که برای جامعه آن را با   و برای نمونه آن را با s نشان می دهیم. نحوه محاسبه واریانس به این شکل است که جذر آن انحراف معیار را به ما می دهد.     

                                                                

اگر واريانس را از جدول توزيع فراواني به دست آوريم خواهيم داشت:





اگر همه ي داده هاي آماري با هم برابر باشند، واريانس و انحراف معيار برابر صفر خواهد بود.

دلیل استفاده از انحراف استاندارد این است که مقیاس2 S با مقیاس نمرات یکی نیست و راه حل استفاده از  Sاست.

 انحراف استاندارد یکی از مهم ترین شاخصه  های هر توزیع آماری است و در توزیع های مختلف به روش های مختلف محاسبه می شود. ممکن است این سوال پرسیده شود که داده های تجربی انطباق دقیق با توزیع های نظری آماری ندارد. برای تعیین شاخص های پراکندگی این توزیعات پژوهشگران چه می کنند؟ این موضوع یکی از دغدغه های پژوهشگران آماری است که از روش های پیچیده ای به محاسبه انحراف استاندارد می پردازند.

 

انحراف متوسط: (که به آن میانگین قدر مطلق انحراف ها هم می گویند)، فاصله داده Xi از میانگین را انحراف از میانگین  Xi  گویند که به صورت    محاسبه می شود. اگر این مقدار را برای تمامی داده ها محاسبه کنیم و از نتیجه میانگین بگیریم، میانگین انحرافات بدست خواهد آمد که عبارت است از:

                                                                                            

از آنجا که میانگین انحرافات به تمام داده ها وابسته است معیار مناسبی برای سنجش پراکندگی داده ها محسوب می شود اما به دلیل وجود قدر مطلق در فرمول، محاسبه آن مشکل است و نمی توان آن را ساده نمود، بنابراین واریانس و انحراف استاندارد شاخص های مناسب تری هستند.

انحراف چارکی

انحراف چارکی عبارت است از: نصف فاصله بین چارکهای اول و سوم و از طریق فرمول زیر بدست می آید:

ابتدا اعداد را از کوچک به بزرگ مرتب می کنیم. 

محاسبه میانه یا چارک دوم اعداد

محاسبه میانه اعداد سمت چپ

محاسبه میانه اعداد سمت راست

ویژگیهای انحراف چارک:

انحراف چارکی خیلی کم تحت تأثیر اختلافهای تصادفی بین نمونه های انتخاب شده قرار می گیرد چون همانند میانه تحت تأثیر نمره های خیلی بزرگ یا خیلی کوچک قرار نمی گیرد. شرایط استفاده آن همانند میانه است و هر دو یک خانوادة آماری را تشکیل می دهند. در زمانی مورد استفاده قرار می گیرند که مقیاس حداقل فاصله ای باشد.

توزیع نرمال و شکل آن

توزیع نرمال یکی از توزیع‌های احتمالاتی پیوستهٔ مهم است. توزیع نرمال استاندارد توزیعی با میانگین صفرو انحراف استاندارد واحد است. به علت شباهت این شکل به زنگوله به آن انحنای زنگوله‌ای نیز گفته می‌شود.

دلیل اهمیت توزیع نرمال از وجود قضیه حد مرکزی ناشی می‌شود. این قضیه می‌گوید هنگامی که تعداد بسیار زیادی متغیر تصادفی با توزیع دل‌خواه و با واریانس محدود را با هم جمع کنیم و میانگین بگیریم، توزیع نهایی به توزیع نرمال میل می‌کند. به همین خاطر

هنگامی که شاهد تأثیر جمعی‌ بسیاری از پدیده‌های تصادفی هستیم، نتیجهٔ نهایی با توزیع نرمال قابل  توصیف است.

این منحنی دارای خواص بسیار جالبی است از آن جمله که نسبت به محور عمودی متقارن می باشد، نیمی از مساحت زیر منحنی بالای مقدار متوسط و نیمه دیگر در پایین مقدار متوسط قرار دارد و اینکه هرچه از طرفین به مرکز مختصات نزدیک می شویم، ارتفاع منحنی بیشتر می شود.

شاخص های نماینده توزیع نرمال:

میانگین (µ): نشان دهنده تراکم داده ها حول یک مقدار

انحراف معیار (σ): نشان دهنده میزان پراکندگی داده ها از میانگین

مثال کاربرد µ و σ:  

با رسم نمودار فراوانی داده های پیوسته عموما یکی از اشکال زیر بدست می آید؛ که چگونگی قرار گرفتن میانگین و میانه ومد را در اشکال زیر مشاهده می شود.


 


 

کجی به 2 دلیل ایجاد می شود:

متغیر ماهیتا کجی دارد: مثل بزهکاری که در این موارد باید از آزمون های ناپارامتری استفاده کنیم مثلا به جای مقایسه میانگین ها از میانه استفاده می کنیم.

داده های پرت باعث کجی شده اند.

راه حل این مشکل این 3 راهکار است: حذف(برای مقادیر پرت)، وینزوری کردن (آرایش کردن)، Trimned (پیرایش کردن) 

در تحلیل داده ها اولین قدم تمییز کردن داده هاست. روش هایی  که برای برخورد با داده های گمشده وجود دارد می تواند برای برخورد با داده های پرت نیز استفاده شود. این روش ها گستره ای از حذف تا شبیه سازی کردن داده ها را در بر می گیرد. نرم افزار SPSS ورژن 19 که متعلق به شرکت آی بی ام است، فرمان  های اشاره شده را داراست.

ضریب کشیدگی: نشان دهنده میزان کشیدگی منحنی می باشد و به صورت زیر تعریف می شود: 

                                                                                                                        

دو منحنی زیر متقارن می باشند اما ضریب کشیدگی در آنها متفاوت است:

 



یکی از کاربرد های مهم منحنی نرمال سطوح زیر منحنی آن می باشد. کاربرد این سطوح را می توان در تعیین فاصله ی اطمینان و همچنین تعیین نقاط برش برای متغیرهای دارای توزیع نرمال مشاهده کرد. 

  

سطح زیر منحنی نرمال برای مقادیر متفاوت  و 



یکی دیگر از مهمترین منحنی های وابسته به منحنی نرمال منحنی اجایو نرمال یا همان منحنی تراکمی نرمال است. این منحنی یکی از پرکاربرد ترین منحنی ها در علوم مختلف و مخصوصا علوم انسانی است. این منحنی در روانسنجی و مخصوصا نظریه ی جدید روانسنجی یعنی نظریه ی سوال پاسخ استفاده می شود. با توجه به اینگه بسیاری از فرایندهای موجود در طبیعت و در علوم مختلف مانند مدیریت, کنترل پروژه از این منحنی پیروی می کنند در برآورد پارامترهای مختلف یا برنامه ریزی به فراوانی مورد استفاده قرار می گیرد. یکی از کاربردهای مهم این منحنی در روانشناسی بالینی استفاده از آن برای پیدا کردن الگوهای رشد است. از آنجا که رشد دارای الگویی مانند منحنی نرمال تراکمی است می توان از آن در روانشناسی رشد و یا در شبیه سازی ها استفاده نمود. کاربرد این منحنی را می توان در آی تی و در هوش مصنوعی و داده کاوی مشاهده کرد. در زیر شکلی از این منحنی ارائه شده است.

 


از آنجا که تابع اجایو نرمال شناخته شده است و همچنین به دلیل شباهتی که بین این تابع با تابع لجستیک دارد با اضافه کردن مقدار ثابت در فرمول های مربوط به تابع لجستک آنها را به تابع نرمال تراکمی تبدیل می کنند. بنابراین کارکردهای زیادی که برای تابع لجستیک متصور است برای تابع اجایو نرمال نیز قابل تصور خواهد بود. 

بسیاری از توابع دیگر مانند دوجمله به تابع نرمال تقریب زده می شوند و در ضمن بسیاری از توابع قابل تبدیل به تابع نرمال اند مانند تابع فیشر یا همان تابع معروف F و یا تابع خی دو.

گاهی در مطالعاتی که انجام می شود، نیاز است علاوه بر اینکه تک تک متغیرها نرمال باشند، ترکیب آنها نیز نرمال باشد. به این حالت نرمال بودن چندگانه می گویند. شکل زیر نرمال بودن دو متغیر را به صورت هم زمان نشان می دهد. 

 

                                                                                                                                       


+ نوشته شده در  دوشنبه 21 آذر1390ساعت   توسط محمد حسین ضرغامی  | 

آمار


آمار (به انگلیسی: statistics) به مجموعه‌ی داده‌های عددی مربوط به یک موضوع (معمولا مهم)، مانند جمعیت، متوفیات، میزان تجارت داخلی یا خارجی، دما یا بارش ماهیانه و غیر گفته می‌شود. آمار را باید علم و عمل استخراج، بسط، و توسعهٔ دانشهای تجربی انسانی با استفاده از روش‌های گردآوری، تنظیم، پرورش، و تحلیل داده‌های تجربی (حاصل از اندازه گیری و آزمایش) دانست. زمینه‌های محاسباتی و رایانه‌ای جدیدتری همچون یادگیری ماشینی، و کاوش‌های ماشینی در داده‌ها، در واقع، امتداد و گسترش دانش گسترده و کهن از آمار به عهد محاسبات نو و دوران اعمال شیوه‌های ماشینی در همه‌جا می‌باشد. علم آمار، علم فن فراهم کردن داده‌های کمّی و تحلیل آن‌ها به منظور به دست آورن نتیایجی که اگرچه احتمالی است، اما در خور اعتماد است.


محتویات  [نهفتن] 

۱ مقدمه

۲ علم آمار

۳ عمل آماری

۴ روش‌های آماری

۵ احتمالات

۶ نرم‌افزارها

۷ سطوح اندازه گیری

۸ پانویس

۹ منابع

۱۰ جستارهای وابسته

۱۱ پیوند به بیرون

مقدمه [ویرایش]


در صورتی که شاخه‌ای علمی مد نظر نباشد، معنای آن، داده‌هایی به‌شکل ارقام و اعداد واقعی یا تقریبی است که با استفاده از علم آمار می‌توان با آن‌ها رفتار کرد و عملیات ذکر شده در بالا را بر آن‌ها انجام داد. بیشتر مردم با کلمة آمار به مفهومی که برای ثبت و نمایش اطلاعات عددی به کار می‌رود آشنا هستند . ولی این مفهوم منطبق با موضوع اصلی مورد بحث آمار نیست. آمار عمدتاً با وضعیتهایی سر و کار دارد که در آنها وقوع یک پیشامد به طور حتمی قابل پیش بینی نیست. اسنتاجهای آماری غالباً غیر حتمی اند، زیرا مبتنی بر اطلاعات ناکاملی هستند. در طول چندین دهه آمار فقط با بیان اطلاعات و مقادیر عددی در باره اقتصاد، جمعیت‌شناسی و اوضاع سیاسی حاکم در یک کشور سر و کار داشت. حتی امروز بسیاری از نشریات و گزارشهای دولتی که توده‌ای از آمار و ارقام را در بردارند معنی اولیه کلمه آمار را در ذهن زنده می‌کنند. اکثر افراد معمولی هنوز این تصویر غلط را در باره آمار دارند که آن را منحصر به ستونهای عددی سرگیجه آور و گاهی یک سری شکلهای مبهوت کننده می‌دانند .بنابراین، یادآوری این نکته ضروری است که نظریه و روشهای جدید آماری از حد ساختن جدولهای اعداد و نمودارها بسیار فراتر رفته‌اند. آمار به عنوان یک موضوع علمی، امروزه شامل مفاهیم و روشهایی است که در تمام پژوهشهایی که مستلزم جمع آوری داده‌ها به وسیله یک فرایند آزمایش و مشاهده و انجام استنباط و نتیجه گیری به وسیله تجزیه و تحلیل این داده‌ها هستند اهمیت بسیار دارند.


علم آمار [ویرایش]


علم آمار، خود مبتنی است بر نظریه آمار که شاخه‌ای از ریاضیات کاربردی به حساب می‌آید. در نظریهٔ آمار، اتفاقات تصادفی و عدم قطعیت توسط نظریهٔ احتمالات مدل‌سازی می‌شوند. در این علم، مطالعه و قضاوت معقول در بارهٔ موضوع‌های گوناگون، بر مبنای یک جمع انجام می‌شود و قضاوت در مورد یک فرد خاص، اصلاً مطرح نیست.


از جملهٔ مهم‌ترین اهداف آمار، می‌توان تولید «بهترین» اطّلاعات از داده‌های موجود و سپس استخراج دانش از آن اطّلاعات را ذکر کرد. به همین سبب است که برخی از منابع، آمار را شاخه‌ای از نظریه تصمیم‌ها به شمار می‌آورند.


این علم به بخش‌های آمار توصیفی و آمار استنباطی تقسیم می‌شود. از طرف دیگر می‌توان آن را به دو بخش آمار کلاسیک و آمار بیز تقسیم بندی کرد. در آمار کلاسیک، که امروزه در دانشگاه‌ها و دبیرستان‌ها تدریس می‌گردد، ابتدا آزمایش و نتیجه را داریم و بعد بر اساس آن‌ها فرض‌ها را آزمون می‌کنیم. به عبارت دیگر ابتدا آزمایش انجام می‌شود و بعد فرض آزمون می‌گردد. در آمار بیزی ابتدا فرض در نظر گرفته می‌شود و داده‌ها با آن مطابقت داده می‌شوند به عبارت دیگر در آمار بیزی یک پیش توزیع داریم-توزیع پیشین- و بعد از مطالعه داده‌ها و برای رسیدن به آن تئزیع پیشین توزیع پسین را در نظر می‌گیریم.


عمل آماری [ویرایش]


شامل برنامه‌ریزی و جمع‌بندی و تفسیر مشاهدات غیر قطعی است به‌شکلی که∗ :


اعداد نمایندهٔ واقعی مشاهدات بوده، غیر واقعی یا غلط نباشند.

به‌نحو مفیدی تهیه و تنظیم شوند.

به‌نحو صحیح تحلیل شوند.

قابل نتیجه‌گیری صحیح باشند.

روش‌های آماری [ویرایش]


مطالعات تجربی و مشاهداتی هدف کلی برای یک پروژه تحقیقی آماری، بررسی حوادث اتفاقی بوده و به ویژه نتیجه گیری روی تأثیر تغییرات در ارزش شاخص‌ها یا متغیرهای غیر وابسته روی یک پاسخ یا متغیر وابسته‌است. دو شیوه اصلی از مطالعات آماری تصادفی وجود دارد: مطالعات تجربی و مطالعات مشاهداتی. در هر دو نوع از این مطالعات، اثر تغییرات در یک متغیر (یا متغیرهای) غیر وابسته روی رفتار متغیرهای وابسته مشاهده می‌شود. اختلاف بین این دو شیوه درچگونگی مطالعه‌ای است که عملاً هدایت می‌شود. یک مطالعه تجربی در بردارنده روش‌های اندازه گیری سیستم تحت مطالعه‌است که سیستم را تغییر می‌دهد و سپس با استفاده از روش مشابه اندازه گیری‌های اضافی انجام می‌دهد تا مشخص سازد که آیا تغییرات انجام شده، مقادیر شاخص‌ها را تغییر می‌دهد یا خیر. در مقابل یک مطالعه نظری، مداخلات تجربی را در بر نمی‌گیرد. در عوض داده‌ها جمع آوری می‌شوند و روابط بین پیش بینی‌ها و جواب بررسی می‌شوند.


یک نمونه از مطالعه تجربی، مطالعات Hawthorne مشهور است که تلاش کرد تا تغییرات در محیط کار را در کمپانی الکتریک غربی Howthorne بیازماید. محققان علاقه مند بودند که آیا افزایش نور می‌تواند کارایی را در کارگران خط تولید افزایش دهد. محققان ابتدا کارایی را در کارخانه اندازه گیری کردند و سپس میزان نور را در یک قسمت از کارخانه تغییر دادند تا مشاهده کنند که آیا تغییر در نور می‌تواند کارایی را تغییر دهد. به واسطه خطا در اقدامات تجربی، به ویژه فقدان یک گروه کنترل محققاتی در حالی که قادر نبودند آنچه را که طراحی کرده بودند، انجام دهند قادر شدند تا محیط را با شیوه Hawthorne آماده سازند. یک نمونه از مطالعه مشاهداتی، مطالعه ایست که رابطه بین سیگار کشیدن و سرطان ریه را بررسی می‌کند. این نوع از مطالعه به طور اختصاصی از شیوه‌ای استفاده می‌کند تا مشاهدات مورد علاقه را جمع آوری کند و سپس تجزیه و تحلیل آماری انجام دهد. در این مورد، محققان مشاهدات افراد سیگاری و غیر سیگاری را جمع آوری می‌کنند و سپس به تعداد موارد سرطان ریه در هر دو گروه توجه می‌کنند.


احتمالات [ویرایش]


مقالهٔ اصلی: احتمالات

در زبان محاوره، احتمال یکی از چندین واژه‌ای است که برای دانسته یا پیشامدهای غیر مطمئن به کار می‌رود و کم و بیش با واژه‌هایی مانند ریسک، خطرناک، نامطمئن، مشکوک و بسته به متن قابل معاوضه‌است. شانس، بخت، امتیاز و شرط بندی از لغات دیگری است که نشان دهنده برداشت‌های مشابهی است. همانگونه که نظریه مکانیک به تعاریف دقیق ریاضی از عبارات متداولی مثل کار و نیرو می‌پردازد، نظریه احتمالات نیز تلاش دارد تا مفاهیم و برداشت‌های مربوط به احتمالات را کمّی سازی کند.


نرم‌افزارها [ویرایش]


آمار مدرن برای انجام بعضی از محاسبات خیلی پیچیده و بزرگ به وسیله رایانه‌ها استفاده می‌شود. کل شاخه‌های آمار با استفاده از محاسبات کامپیوتری انجام‌پذیر شده‌اند، برای مثال شبکه‌های عصبی. انقلاب کامپیوتری با یک توجه نو به آمار «آزمایشی» و «شناختیک» رویکردهایی برای آینده آمار داشته‌است.


یکی از مهم‌ترین کاربردهای آمار و احتمال با استفاده از رایانه شبیه سازی است .


شبیه سازی نسخه‌ای از بعضی وسایل حقیقی یا موقعیت‌های کاری است. شبیه سازی تلاش دارد تا بعضی جنبه‌های رفتاری یک سیستم فیزیکی یا انتزاعی را به وسیله رفتار سیستم دیگری نمایش دهد. شبیه سازی در بسیاری از متون شامل مدل سازی سیستم‌های طبیعی و سیتم‌های انسانی استفاده می‌شود. برای به دست آوردن بینش نسبت به کارکرد این سیستم‌ها در تکنولوژی و مهندسی ایمنی که هدف، آزمون بعضی سناریوهای عملی در دنیای واقعی است از شبیه سازی استفاده می‌شود. در شبیه سازی با استفاده از یک شبیه ساز یا وسیله دیگری در یک موقعیت ساختگی می‌توان آثار واقعی بعضی شرایط احتمالی را بازسازی کرد.


۱- شبیه سازی فیزیکی و متقابل (شبیه سازی فیزیکی، به شبیه سازی اطلاق می‌شود که در آن اشیای فیزیکی به جای شی واقعی جایگزین می‌شوند و این اجسام فیزیکی اغلب به این خاطر استفاده می‌شوند که کوچک‌تر و ارزان تر از شی یا سیستم حقیقی هستند. شبیه سازی متقابل (تعاملی) که شکل خاصی از شبیه سازی فیزیکی است و غالباً به انسان در شبیه سازی‌های حلقه‌ای اطلاق می‌شود یعنی شبیه سازی‌های فیزیکی که شامل انسان می‌شوند مثل مدل استفاده شده در شبیه ساز پرواز.)


۲- شبیه سازی در آموزش (شبیه سازی اغلب در آموزش پرسنل شهری و نظامی استفاده می‌شود. معمولاً هنگامی رخ می‌دهد که استفاده از تجهیزات در دنیای واقعی از لحاظ هزینه کمرشکن یا بسیار خطرناک است تا بتوان به کارآموزان اجازه استفاده از آن‌ها را داده. در چنین موقعیت‌هایی کارآموزان وقت خود را با آموزش دروس ارزشمند در یک محیط واقعی «ایمن» می‌گذرانند. غالباً این اطمینان وجود دارد تا اجازه خطا را به کارآموزان در طی آموزش داد تا ارزیابی سیستم ایمنی– بحران صورت گیرد.)


شبیه سازی‌های آموزشی به طور خاص در یکی از چهار گروه زیر قرار می‌گیرند :


الف - شبیه سازی زنده (جایی که افراد واقعی از تجهیزات شبیه سازی شده (یا آدمک) در دنیای واقعی استفاده می‌کنند.)


ب - شبیه سازی مجازی (جایی که افراد واقعی از تجهیزات شبیه سازی شده در دنیای شبیه سازی شده (یا محیط واقعی) استفاده می‌کنند.) یا


ج - شبیه سازی ساختاری (جایی که افراد شبیه سازی شده از تجهیزات شبیه سازی شده در یک محیط شبیه سازی شده استفاده می‌کنند. اغلب به عنوان بازی جنگی نامیده می‌شود زیرا که شباهتهایی با بازی‌های جنگی رومیزی دارد که در آن‌ها بازیکنان، سربازان و تجهیزات را اطراف یک میز هدایت می‌کنند .)


د - شبیه سازی ایفای نقش (جایی که افراد واقعی نقش یک کار واقعی را بازی می‌کنند.)


۳ - شبیه سازی‌های پزشکی (شبیه سازهای پزشکی به طور فزاینده‌ای در حال توسعه و کاربرد هستند تا روشهای درمانی و تشخیص و همچنین اصول پزشکی و تصمیم گیری به پرسنل بهداشتی آموزش داده شود. طیف شبیه سازها برای آموزش روش‌ها از پایه مثل خونگیری تا جراحی لاپاراسکوپی و مراقبت از بیمار دچار ضربه، وسیع و گسترده‌است. بسیاری از شبیه سازهای پزشکی دارای یک رایانه هستند که به یک ماکت پلاستیکی با آناتومی مشابه واقعی متصل است. در بعضی از آنها، ترسیم‌های کامپیوتری تمام اجزای قابل رؤیت را به دست می‌دهد و با دستکاری در دستگاه می‌توان جنبه‌های شبیه سازی شده کار را تولید کرد. بعضی از این دستگاه‌ها دارای شبیه سازهای گرافیکی رایانه‌ای برای تصویربرداری هستند مانند پرتو ایکس یا سایر تصاویر پزشکی. بعضی از شبیه سازهای بیمار، دارای یک مانکن انسان نما هستند که به داروهای تزریق شده واکنش می‌دهد و می‌توان آن را برای خلق صحنه‌های مشابه فوریت‌های پزشکی خطرناک برنامه ریزی کرد. بعضی از شبیه سازهای پزشکی از طریق شبکه اینترنت قابل گسترش هستند و با استفاده از جستجوگرهای استاندارد شبکه به تغییرات جواب می‌دهند. در حال حاضر، شبیه سازی‌ها به موارد غربال گری پایه محدود شده‌اند به نحوی که استفاده کنندگان از طریق وسایل امتیازدهی استاندارد با شبیه سازی در ارتباط هستند.)


۴ - شبیه سازهای پرواز (یک شبیه ساز پرواز برای آموزش خلبانان روی زمین مورد استفاده قرار می‌گیرد. به خلبان اجازه داده می‌شود تا به هواپیمای شبیه سازی شده اش آسیب برساند بدون آن که خود دچار آسیب شود. شبیه سازهای پرواز اغلب برای آموزش خلبانان استفاه می‌شوند تا هواپیما را در موقعیت‌های بسیار خطرناک مثل زمین نشستن بدون داشتن موتور یا نقص کامل الکتریکی یا هیدرولیکی هدایت کنند. پیشرفته‌ترین شبیه سازها دارای سیستم بصری با کیفیت بالا و سیستم حرکت هیدرولیک هستند. کار با شبیه ساز به طور معمول نسبت به هواپیمای واقعی ارزان تر است.)


۵ - شبیه سازی و بازی‌ها(هم چنین بسیاری از بازی‌های ویدئویی شبیه ساز هستند که به طور ارزان تر آماده سازی شده‌اند. بعضی اوقات از این‌ها به عنوان بازیهای شبیه سازی (sim) نامبرده می‌شود. چنین بازیهایی جنبه‌های گوناگون واقعی را شبیه سازی می‌کنند از اقتصاد گرفته تا وسایل هوانوردی مثل شبیه سازهای پرواز.)


۶ - شبیه سازی مهندسی (شبیه سازی یک مشخصه مهم در سیستم‌های مهندسی است. برای مثال در مهندسی برق، از خطوط تأخیری استفاده می‌شود تا تأخیر تشدید شده و شیفت فاز ناشی از خط انتقال واقعی را شبیه سازی کنند. مشابهاً، از بارهای ظاهری می‌توان برای شبیه سازی مقاومت بدون شبیه سازی تشدید استفاده کرد و از این حالت در مواقعی استفاده می‌شود که تشدید ناخواسته باشد. یک شبیه ساز ممکن است تنها چند تا از کارکردهای واحد را شبیه سازی کند که در مقابل با عملی است که تقلید نامیده می‌شود. ۷ - اغلب شبیه سازی‌های مهندسی مستلزم مدل سازی ریاضی و بررسی‌های کامپیوتری هستند. به هر حال موارد زیادی وجود دارد که مدل سازی ریاضی قابل اعتماد نیست. شبیه سازی مشکلات مکانیک سیالات اغلب مستلزم شبیه سازی‌های ریاضی و فیزیکی است. در این موارد، مدل‌های فیزیکی نیاز به شبیه سازی دینامیک دارند.)

منبع ویکی پدیا


۸ - شبیه سازی کامپیوتری (شبیه سازی رایانه، جزو مفیدی برای بسیاری از سیستم‌های طبیعی در فیزیک، شیمی و زیست‌شناسی و نیز برای سیستم‌های انسانی در اقتصاد و علوم اجتماعی (جامعه‌شناسی کامپیوتری) و همچنین در مهندسی برای به دست آوردن بینش نسبت به عمل این سیستم‌ها شده‌است. یک نمونه خوب از سودمندی استفاده از رایانه‌ها در شبیه سازی را می‌توان در حیطه شبیه سازی ترافیک شبکه جستجو کرد. در چنین شبیه سازی‌هایی رفتار مدل هر شبیه سازی را مطابق با مجموعه پارامترهای اولیه منظور شده برای محیط تغییر خواهد داد.شبیه سازی‌های کامپیوتری] اغلب به این منظور به کار گرفته می‌شوند تا انسان از شبیه سازی‌های حلقه‌ای در امان باشد. به طور سنتی، مدل برداری رسمی سیستم‌ها از طریق یک مدل ریاضی بوده‌است به نحوی که تلاش در جهت یافتن راه حل تحلیلی برای مشکلات بوده‌است که پیش بینی رفتار سیستم را با استفاده از یک سری پارامترها و شرایط اولیه ممکن ساخته‌است. شبیه سازی کامپیوتری اغلب به عنوان یک ضمیمه یا جانشین برای سیستم‌های مدل سازی است که در آن‌ها راه حل‌های تحلیلی بسته ساده ممکن نیست. انواع مختلفی از شبیه سازی کامپیوتری وجود دارد که وجه مشترک همه آن‌ها در این است که تلاش می‌کند تا یک نمونه از برنامه‌ای برای یک مدل تولید کنند که در آن امکان محاسبه کامل تمام حالات ممکن مدل مشکل یا غیر ممکن است.)


به طور رو به افزونی معمول شده‌است که نام انواع مختلفی از شبیه سازی شنیده می‌شود که به عنوان «محیط‌های صناعی» اطلاق می‌شوند. این عنوان اتخاذ شده‌است تا تعریف شبیه سازی عملاً به تمام دستاوردهای حاصل از رایانه تعمیم داده شود.



۹ - شبیه سازی در علم رایانه (در برنامه نویسی کامپیوتری، یک شبیه ساز اغلب برای اجرای برنامه‌ای مورد استفاده قرار می‌گیرد که انجام آن برای رایانه با مقداری دشواری همراه است. برای مثال، شبیه سازها معمولاً برای رفع عیب یک ریزبرنامه استفاده می‌شوند. از آن جایی که کار کامپیوتر شبیه سازی شده‌است، تمام اطلاعات در مورد کار رایانه مستقیماً در دسترس برنامه دهنده‌است و سرعت و اجرای شبیه سازی را می‌توان تغییر داد. همچنین شبیه سازها برای تفسیر درخت‌های عیب یا تست کردن طراحی‌های منطقی VLSI قبل از ساخت مورد استفاده قرار می‌گیرند. در علم رایانه نظریه، عبارت شبیه سازی نشان دهنده یک رابطه بین سیستم‌های انتقال وضعیت است که این در مطالعه مفاهیم اجرایی سودمند است.)


۱۰ - شبیه سازی در تعلیم و تربیت (شبیه سازی‌ها در تعلیم و تربیت گاهی مثل شبیه سازی‌های آموزشی هستند. آن‌ها روی وظایف خاص متمرکز می‌شوند. در گذشته از ویدئو برای معلمین و دانش آموزان استفاده می‌شود تا مشاهده کنند، مسائل را حل کنند و نقش بازی کنند؛ هرچند، یک استفاده جدید تر از شبیه سازی‌ها در تعلیم و تربیت شامل فیلم‌های انیمیشن است (ANV .(ANVها نوعی فیلم ویدئویی کارتون مانند با داستان‌های تخیلی یا واقعی هستند که برای آموزش و یادگیری کلاس استفاده می‌شوند.ANVها برای ارزیابی آگاهی، مهارت‌های حل مسئله و نظم بچه‌ها و معلمین قبل و حین اشتغال کارایی دارند.)


شکل دیگری از شبیه سازی در سال‌های اخیر با اقبال در آموزش بازرگانی مواجه شده‌است. شبیه سازی بازرگانی که دارای یک مدل پویا است که آزمون استراتژی‌های بازرگانی را در محیط فاقد خطر مهیا می‌سازد و محیط مساعدی برای مباحث مطالعه موارد ارائه می‌دهد.



واژگانی که درک مفهوم آن‌ها در علم آمار مهم است عبارت‌اند از∗ :


جمعیت

نمونه

متغیّر

مقیاس‌های اندازه‌گیری :

مقیاس اسمی

مقیاس ترتیبی

مقیاس فاصله‌ای

مقیاس نسبتی

آمار رشته وسیعی از ریاضی است که راههای جمع آوری، خلاصه سازی و نتیجه گیری از داده‌ها را مطالعه می‌کند. این علم برای طیف وسیعی از علوم دانشگاهی از فیزیک و علوم اجتماعی گرفته تا انسان‌شناسی و همچنین تجارت، حکومت داری و صنعت کاربرد دارد.


هنگامی که داده‌ها جمع آوری شدند چه از طریق یک روش نمونه برداری خاص یا به وسیله ثبت پاسخ‌ها در قبال رفتارها در یک مجموعه آزمایشی (طرح آزمایش) یا به وسیله مشاهده مکرر یک فرایند در طی زمان (سری‌های زمانی) خلاصه‌های گرافیکی یا عددی را می‌توان با استفاده از آمار توصیفی به دست آورد.


الگوهای موجه در داده‌ها سازمان بندی می‌شوند تا نتیجه گیری در مورد جمعیت‌های بزرگ‌تر به دست آید که این کار با استفاده از آمار استنباطی صورت می‌گیرد و تصادفی بودن و عدم قاطعیت در مشاهدات را شناسایی می‌کند. این استنباط‌ها ممکن است به شکل جوابهای بله یا خیر به سؤالات باشد (آزمون فرض)، خصوصیات عددی را برآورد کند(تخمین)، پیش گویی مشاهدات آتی باشد، توصیف ارتباط‌ها باشد (همبستگی) و یا مدل سازی روابط باشد (رگرسیون).


شبکه توصیف شده در بالا گاهی اوقات به عنوان آمار کاربردی اطلاق می‌شود. در مقابل، آمار ریاضی (یا ساده تر نظریه آماری) زیر رشته‌ای از ریاضی کاربردی است که از نظریه احتمال و آنالیز برای به کارگیری آمار برروی یک پایه نظریه محکم استفاده می‌کند.


مراحل پایه برای انجام یک تجربه عبارت‌اند از :


برنامه ریزی تحقیق شامل تعیین منابع اطلاعاتی، انتخاب موضوع تحقیق و ملاحظات اخلاقی برای تحقیق و روش پیشنهادی. طراحی آزمون شامل تمرکز روی مدل سیستم و تقابل متغیرهای مستقل و وابسته. خلاصه سازی از نتایج مشاهدات برای جامعیت بخشیدن به آنها با حذف نتایج (آمار توصیفی). رسیدن به اجماع در مورد آنچه مشاهدات درباره دنیایی که مشاهده می‌کنیم به ما می‌گویند (استنباط آماری). ثبت و ارائه نتایج مطالعه.


سطوح اندازه گیری [ویرایش]


چهار نوع اندازه گیری یا مقیاس اندازه گیری در آمار استفاده می‌شود. چهار نوع یا سطح اندازه گیری (ترتیبی، اسمی، بازه‌ای و نسبی) دارای درجات متفاوتی از سودمندی در بررسی‌های آماری دارند. اندازه گیری نسبی در حالی که هم یک مقدار صفر و فاصله بین اندازه‌های متفاوت تعریف می‌شود بیشترین انعطاف پذیری را در بین روش‌های آماری دارد که می‌تواند برای تحلیل داده‌ها استفاده شود. مقیاس تناوبی با داشتن فواصل معنی دار بین اندازه‌ها اما بدون داشتن میزان صفر معنی دار (مثل اندازه‌گیری بهره هوشی یا اندازه‌گیری دما در مقیاس سلسیوس) در تحقیقات آماری استفاده می‌شود. صفت آماری - هر ویژگی مربوط به هر واحد جامعه را یک صفت آماری یا به اختصار یک صفت برای آن واحد آماری است. اگر یک واحد آماری یک انسان باشد، گروه خون، وزن، میزان سواد، میزان درآمد، درجه حرارت بدن و تعدادخانوار هر کدام یک صفت آماری برای آن واحد است. صفتهای آماری دو دسته کلی هستند. ۱- صفت مشخصه ۲ صفت متغیر

+ نوشته شده در  یکشنبه 8 آبان1390ساعت   توسط محمد حسین ضرغامی  | 

تعريفي از آمار

جمله ي بسيار نغزي از ايوان اسار (EVAN ESAR) درمورد تعريف آمار وجود دارد كه به نظر من بسيار جالب و عالي است و بيانگر نگاه عميق و علمي اسار به علم آمار است.

Definition of Statistics: The science of producing unreliable facts from reliable figures

تعريف آمار: آمار علمي است كه واقعيت هاي ناپايا را از ارقام پايا مي سازد.

و من با نگاه فازي مي گويم

"آمار (مبتني بر نظريه ي احتمال)علمي است كه با عينك تصادفي به جهاني هدفمند مي نگرد."

+ نوشته شده در  شنبه 30 مهر1390ساعت   توسط محمد حسین ضرغامی  |