تبلیغات
RF2268AM - رگرسیون لجستیك و سوالات
پنجشنبه 7 دی 1391

رگرسیون لجستیك و سوالات

   نوشته شده توسط: عارف محمدی    نوع مطلب :آمار ،

جدول ماتریس همبستگی را ترسیم و انواع همبستگی را ذکر کنید؟

جدول ماتریس همبستگی را ترسیم و انواع همبستگی را ذکر کنید؟

قبل از پاسخ به سوال،شرح مختصری از تحلیل رابطه همزمانی متغیرها و ارائه تعریفی از رابطه متقارن و همزمانی لازم و مفید است.

*تحلیل رابطه همزمانی متغیرها:

به منظور پی بردن به رابطه بین تغییرات دو یا چند متغیر که همزمان اندازه گیری شده اند،تحلیل رابطه همزمانی مورد استفاده قرار می گیرد.برای پی بردن به میزان رابطه شاخص های همبستگی بکار برده می شود.این نوع شاخصها با توجه به مقیاس اندازه گیری متغیرها انتخاب می گردد.شاخص های رابطه میان متغیرها را به طور کلی می توان به دو دسته پارامتری و ناپارامتری تقسیم کرد.

• محاسبه همبستگی برای تحقیقات پارامتری

چنانچه دو متغیر در مقیاس‏های فاصله‏ای یا نسبی اندازه گیری شده باشند، می‌توان برای تعیین رابطه بین آنها از ضریب همبستگی گشتاوری پیرسون استفاده کرد. در محاسبه ضریب همبستگی پیرسون پیش فرض اینست که دو متغیر دارای توزیع دومتغیری بهنجار باشد. درصورتی که این پیش فرض صادق نباشد از روش های دیگری استفاده می‏کنیم که به شرح ذیل می باشد(سرمد و همکاران،1390 ،ص222).

 

جدول1- ضریب های همبستگی دومتغیری در تحلیل های پارامتری

ضریب همبستگی

نماد متغیر 1 متغیر 2 مقیاس اندازه گیری

ضریب همبستگی گشتاوری پیرسون r پیوسته پیوسته هر دو متغیر فاصله‏ای

ضریب همبستگی دورشته‏ای

دو سطحی ساختگی پیوسته یک متغیر اسمی دو سطحی و دیگری فاصله‏ای

ضریب همبستگی دورشته‏ای نقطه‏ای دو سطحی واقعی پیوسته یک متغیر اسمی دو سطحی و دیگری فاصله‏ای

ضریب همبستگی تتراکوریک

دو سطحی ساختگی دو سطحی ساختگی هر دو متغیر اسمی دو سطحی

حسین چهارباشلو دانشجوی دکتری دانشگاه خوارزمی

توسط محمد حسین ضرغامی |


سوال دوم:کوواریانس چیست؟

سوال دوم:کوواریانس چیست؟

تعریف:

کوواریانس شاخصی برای تغییرات یک متغیر با متغیر دیگر است (سرمد،1388: 80). كوواریانس مشابه واریانس است ولی در كوواریانس انحراف از میانگین را به طور همزمان برای دو متغیر X,Y محاسبه می كنیم و با رابطه زیر محاسبه می‏شود:

ویژگی ها:

با توجه به فرمول کوواریانس می‏توان گفت که مقدار کوواریانس از میزان پراکندگی داده های هر متغیر از میانگین اثر می‏پذیرد. چنانکه دو متغیر تصادفی ناوابسته باشند، کواریانس آنها صفر خواهد بود(سرمد،1388: 12). اگر نمره بالا در یک متغیر با نمره بالا در متغیر دیگر و نمره پایین در یک متغیر با نمره پایین در متغیر دیگر همراه باشد، مقدار کوواریانس مثبت (هم جهت بودن تغیرات دو متغیر) خواهد بود. از طرف دیگر اگر نمره بالا در یک متغیر با نمره پایین در متغیر دیگر همراه باشد، مقدار کوواریانس منفی (غیر هم‏جهت بودن تغیرات دو متغیر) خواهد بود (کیامنش،1387: 198) .بطورکلی در توزیع‏های دومتغیری برای توصیف رابطه میان دو متغیر از ضریب همبستگی، کوواریانس و معادله رگرسیون استفاده می‏کنیم. تحقیقات همبستگی را می توان برحسب هدف به سه دسته تقسیم کرد:

1- مطالعات همبستگی دومتغیری : به بررسی رابطه همزمانی متغیرها می پردازد.

2- تحلیل رگرسیون: به بررسی رابطه تابعی میان متغیرها می پردازد. Y= f(x) ، در این رابطه متغیرx نسبت به متغیر y تقدم زمانی دارد.

3- تحلیل ماتریس همبستگی یا کوواریانس: هدف بررسی مجموعه ای از همبستگی های دو متغیر، متغیرها در جدولی به نام ماتریس همبستگی یا کوواریانس است که تحلیل عاملی و حل معادلات ساختاری از این دسته هستند. ماتریس همبستگی از نوع تحلیل عاملی با هدف تبین تغییرات متغیرها در عامل‏های محدودتر یا تعیین خصیصه‌های زیر بنایی یک مجموعه از داده‌ها انجام می‌شود. این روش می‌تواند بر دو نوع اکتشافی (Exploratory) یا تاییدی (Confirmatory) انجام شود. در تحلیل عامل اکتشافی محقق درباره تعداد عامل‏های خصیصه فرضیه‌ای ندارد، در صورتی که برای روش تاییدی فرضیه ارائه می‌شود.

در پایان به عنوان جمع بندی می توان گفت، یکی از شاخص های عددی آمار توصیفی دو متغیری کوواریانس می باشد. کوواریانس اندازه تغییرات هماهنگ دو متغیر تصادفی است. (اگر دو متغیر یکی باشند، کواریانس برابر واریانس خواهد شد). به عبارت ساده،واریانس یعنی تغییرات اما کوواریانس یعنی تغییرات مشترک.

کوواریانس تحت تاثیر دامنه تغییرات است.از آن جا که در علوم رفتاری ما با مقیاس های-که واحد و مشترک نیستند- سرو کار داریم،نتیجه کوواریانس تحت تاثیر واحد اندازه گیری قرار می گیرد.به طور کل،نتیجه کوواریانس تحت تاثیر دامنه تغییرات و رنج می باشد.از این رو،کوواریانس ابزار خوبی برای بیان رابطه نیست.برای برون رفت از نقطه ی ضعف کوواریانس،کوواریانس را استاندارد می کنیم که در قالب فرمول ضریب همبستگی پیرسون در می آید.پس همبستگی،کوواریانس استاندارد شده است.

دومین شاخص عددی همبستگی می باشد که درباره ی آن در تکلیف شماره ی چهار پاسخ داده شد.نکته ی تکمیلی اینکه،همبستگی هم براساس میانگین و هم بر اساس انحراف استاندارد محاسبه می شود. و نمودار ون هم برای تفسیر ضریب همبستگی استفاده می شود.

حسین چهارباشلو: دانشجوی دکتری برنامه ریزی درسی دانشگاه خوارزمی

+ نوشته شده در یکشنبه 21 آبان1391ساعت 20:16 توسط محمد حسین ضرغامی | نظر بدهید


علت رخداد کجی و کشیدگی در توزیعات چیست؟ و برای برون رفت از آن چه راهکاری وجود دارد؟

علت رخداد کجی و کشیدگی در توزیعات چیست؟ و برای برون رفت از آن چه راهکاری وجود دارد؟

در نگاه نخست برای پاسخ به این سوال ،به ارائه تعریفی از توزیع نرمال،کجی و کشیدگی به ترتیب خواهیم پرداخت:

* توزیع نرمال یا متقارن توزیعی است که در آن مد، میانه و میانگین برابر است.

* در تعریف کجی باید گفت :کجی یعنی انحراف یک منحنی از حالت تقارن.کجی به سه صورت است،در حالتی کجی صفر است که منحنی متقارن باشد.در توزیعهای متقارن فاصله بین چارک اول تا میانه با فاصله بین چارک سوم تا میانه مساوی است. در حالت کجی منفی مد بزرگتر از میانه و میانه بزرگتر از میانگین است(بیانگر این است که افراد زیادی نمره ی بالایی گرفته اند و بنابراین امتحان ساده بوده است). در حالت کجی مثبت نیز میانگین بزرگتر از میانه و میانه بزرگتر از مد است(یعنی آزمون دشوار بوده است).به دیگر سخن، کجی یا چولگی زمانی ایجاد می شود که منحنی مشاهدات متقارن نباشد. اگر سمت راست منحنی مشاهدات طول بیشتری نسبت به سمت چپش داشته باشد مشاهدات کجی مثبت دارند یا چوله به راستند. در این حالت مشاهدات کوچکتر از نما (مد) تنوع عددی کمی دارند ولی فراوانی های بزرگی دارند ولی مشاهدات بزرگتر از نما تنوع عددی زیادی دارند ولی فراوانی هایشان کوچک است. اگر سمت چپ منحنی مشاهدات طول بیشتری نسبت به سمت راستش داشته باشد مشاهدات کجی منفی دارند یا چوله به چپند. این حالت عکس حالت قبل است. یعنی مشاهدات کوچکتر از نما پر تنوعند با فراوانی های کوچک و مشاهدات بزرگتر از نما کم تنوعند با فراوانی های بزرگ.

* کشیدگی:هنگامی که مقدار کشیدگی برابر صفر باشد توزیع نمره ها طبیعی است یعنی در شکل توزیع که بلند و رو به بالاست، نمرات نزدیک به هم یا یکسان می باشند و واریانس کم است.در صورتی که کشیدگی مثبت باشد برآمدگی منحنی توزیع نمره ها در نقطه اوج قرار خواهد گرفت. در شکل توزیع مسطح که کشیدگی منفی دارد، نمرات دور از هم‌ قرار دارند و واریانس زیاد است. میزان كشیدگی یا پخی منحنی فراوانی را نسبت به منحنی نرمال استاندارد، برجستگی آن می نامند. به عبارتی دیگر،کشیدگی زمانی ایجاد می شود که پراکندگی مشاهدات بیشتر از پراکندگی مشاهدات نرمال باشد که در این صورت منحنی مشاهدات پهن تر از منحنی نرمال خواهد بود و تاجش نیز پایین تر از تاج منحنی نرمال خواهد بود. از طرفی اگر پراکندگی مشاهدات کمتر از پراکندگی مشاهدات نرمال باشد منحنی مشاهدات جمع تر از منحنی نرمال و تاجش نیز بالاتر از تاج منحنی نرمال خواهد بود. حالت اول را کشیدگی مثبت و دومی را کشیدگی منفی گوییم(دلاور،1383،ص103).

 

 

علت رخداد:

ویژگی های غیرنرمال بودن توزیع بدین صورت است: داده هایی که دارای کجی هستند یا در قسمتی از مقیاس اندازه گیری به شدت مجتمع شده اند، واریانس- کوواریانس میان متغیرها را تحت تاثیر قرار می دهند، بعلاوه کشیدگی در داده ها، آماره ها را متاثر می کند. داده های لپتوکوریک (کشیده) در مقایسه با یک توزیع نرمال متقارن، کشیده ترند. درحالی که داده های پلاتی کوریک (پهن) در مقایسه با آن پهن تر و مقادیر در طول محور x پراکنده اند، اما بر روی محور y دارای فراوانی کمی هستندکه منجر به ظاهر شدن توزیع فراوانی به شکل یک مستطیل است. داده های غیرنرمال به دلایلی نظیر مقیاس سازی متغیرها( رتبه ای به جای فاصله ای)، نمونه گیری محدود از موارد تحت مطالعه و یا داده های انتهایی و دور افتاده رخ می‏دهد (قاسمی،1390 : 46).

راه برون رفت:

راه حل‏های ممکن برای کجی و کشیدگی، پیرایش نمونه‏ها و یا اجرای یک تبدیل خطی مجاز نظیر تبدیل های ریشه دوم، معکوس، لجیت یا پروبیت است که به شرح هر یک می‏پردازیم:

1-تبدیل‏ها: در مواردی می‏توان از تبدیل ها استفاده کرد که بین میانگین و واریانس گروه ها رابطه ای وجود داشته وشکل توزیع خطا در تمام آنها یکسان باشد. متداولترین تبدیل هایی را که می توان بکاربرد عبارتند از تبدیل جذری (ریشه دوم)، تبدیل لگاریتمی، تبدیل معکوس و تبدیل قوس سینوسی (آرک سینوس) تصمیم درباره اینکه کدام تبدیل را باید بکاربرد براساس بررسی رابطه بین واریانس‏ها و میانگین‏های متغیر آغاز می‏شود. ماهیت این رابطه تعیین می‏کند که کدام تبدیل را بکار برد (فرگوسن و تاکانه،1383: 326).

تبدیل جذری: هرگاه متغیر وابسته فراوانی وقوع حادثه ای با احتمال خیلی کم باشد، از تبدیل جذری می توان استفاده کرد. این تبدیل هنگامی مناسب است که واریانس‏ها با میانگین‏ها متناسب باشند.

تبدیل لگاریتمی: در مواردی که بعضی از نمرات صفر و یا خیلی کوچک باشند، از این تبدیل استفاده می‏شود. استفاده از این تبدیل در مواردی که توزیع متغیر وابسته، کج مثبت باشد مفید است.

تبدیل معکوس: چنانچه مجذور میانگین گروه‏ها متناسب با واریانس گروه‏ها باشد یک تبدیل معکوس مناسب است. در مواقعی که یکی از نمرات صفر باشد از تبدیل دوم استفاده می‏کنیم.

تبدیل قوس سینوسی: در مواردی که واریانس ها متناسب با میانگین ها باشند و توزیع دو جمله‏ای باشد از این تبدیل استفاده می کنیم.

2-پیرایش نمونه ها: روش دیگر برای ایجاد همگنی واریانس ها و نرمال بودن، پیرایش نمونه هاست. در مواقعی که توزیع پهن بوده، توزیع فراوانی مشاهدات در دنباله ها سنگین است و یا بعبارت دیگر تعداد مشاهدات در دنباله‏ها بصورت غیرمعمولی زیاد است، درصدی از نمونه ها در دنباله ها برداشته می شود.

روش دیگری که با پیرایش نمونه ها ارتباط دارد، وینزوری کردن نمونه هاست که در آن مقادیر پیرایه شده با مقادیر ماقبل آنها جایگزین می شود و تغیری در تعداد نمونه صورت نمی گیرد (سرمد،1388: 146-144).

حسین چهارباشلو: دانشجوی دکتری برنامه ریزی درسی دانشگاه خوارزمی

+ نوشته شده در یکشنبه 21 آبان1391ساعت 20:14 توسط محمد حسین ضرغامی | نظر بدهید


انواع ضرایب همبستگی

محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است، بعنوان مثال برای متغیر­های اسمی جهت رابطه اصلا معنی ندارد، بین جنس و معدل تنها می­توان گفت که شدت وابستگی چه مقدار است اما افزایش یا کاهش جنس معنی ندارد.

با توجه به نوع متغیر ها ضریب همبستگی می­تواند یکی از حالت­های زیر را داشته باشد.

1- دو متغیر اسمی

2- دو متغیر رتبه­ای

3- دو متغیر فاصله­ای- نسبی

4- متغیر اسمی و متغیر رتبه ای

5- متغیر اسمی و متغیر فاصله­ای - نسبی

6- متغیر رتبه­ای و متغیر فاصله­ای – نسبی

برای هر کدام از حالت­های بالا ضرایب همبستگی متفاوتی وجود دارند.

کلمات کلیدی : انواع ضرایب همبستگی، ضریب همبستگی پیرسون، ضریب همبستگی اسپیرمن، ضریب همبستگی کرامر و فی، ضریب همبستگی لاندا، ضریب همبستگی تاو گودمن کروسکال، ضریب همبستگی گاما، ضریب همبستگی تاو کندال،ضریب همبستگی چند رشته­ای( polyserial correlation)، ضریب همبستگی چند حالتی(Polychoric correlation) و ...

منابع :

1. آمار ناپارامتریک،1382، سید یعقوب حسینی، انتشارات دانشگاه علامه طباطبایی

2. website of the NC STATE UNIVERSITY, http://faculty.chass.ncsu.edu

3. A coefficient of agreement for nominal scale, 1960, Cohen J. Educat Psychol Measure; 20: 37-46

4. The polyserial correlation coefficient, 1982, U Olsson, F Drasgow, NJ Dorans - Psychometrika, Springer

5. On the Estimation of Polychoric Correlations and their Asymptotic Covariance Matrix, (1994), Joreskog, K. GPsychometrika, 59:3, 381-389.

توسط محمد حسین ضرغامی


Renaldo
دوشنبه 25 اردیبهشت 1396 08:34 ق.ظ
I take pleasure in, lead to I found exactly what I used to be having a look for.
You've ended my four day long hunt! God Bless you man. Have a nice day.
Bye
BHW
پنجشنبه 24 فروردین 1396 11:10 ب.ظ
My family every time say that I am wasting my time here at web, except I
know I am getting knowledge daily by reading thes nice articles.
 
لبخندناراحتچشمک
نیشخندبغلسوال
قلبخجالتزبان
ماچتعجبعصبانی
عینکشیطانگریه
خندهقهقههخداحافظ
سبزقهرهورا
دستگلتفکر