تبلیغات
RF2268AM - رگرسیون لجستیك
پنجشنبه 7 دی 1391

رگرسیون لجستیك

   نوشته شده توسط: عارف محمدی    نوع مطلب :آمار ،

رگرسیون لوژستیك (لوجستیك) زمانی كه متغییر وابسته ی ما دو وجهی است و می خواهیم از طریق تركیبی از متغییرهای پیش بین دست به پیش بینی بزنیم باید از رگرسیون لوجستیك استفاده كنیم. چند مثال از كاربردهای رگرسیون لوژستیك در زیر ارائه می گردد. 1. در فرایند همه گیر شناسی ما می خواهیم ببینیم آیا یك فرد بیمار است یا خیر. اگر به عنوان مثال بیماری مورد نظر بیماری قلبی باشد پیش بینی كننده ها عبارتند از سن، وزن، فشار خون سیستولیك، تعداد سیگارهای كشیده شده و سطح كلسترول. 2. در بازاریابی ممكن است بخواهیم بدانیم آیا افراد یك ماشین جدیدی را می خرند یا خیر. در اینجا متغییرهایی مانند درآمد سالانه، مقدار پول رهن، تعداد وابسته ها، متغیرهای پیش بین می باشند. 3. در تعلیم و تربیت فرض كنید می خواهیم بدانیم یك فرد در امتحان نمره می آورد یا خیر. 4. در روانشناسی می خواهیم بدانیم آیا فرد یك تكلیف را انجام می دهد یا خیر. در تمام موارد گفته شده متغییر وابسته یك متغییر دو حالتی است كه دو ارزش دارد. زمانی كه متغییر وابسته دو حالتی است مسایل خاصی مطرح می شود. 1. خطا دارای توزیع نرمال نیست. 2. واریانس خطا ثابت نیست. 3. محدودیت های زیادی در تابع پاسخ وجود دارد. مشكل سوم مطرح شده مشكل جدی است. می توان از روش حداقل مجذورات وزنی برای حل مشكل مربوط به واریانس های نابرابر خطا استفاده نمود. بعلاوه زمانی كه حجم نمونه بالا باشد می توان روش حداقل مجذورات برآوردگرهایی را ارائه می دهد كه به طور مجانبی و تحت موقعیت های نسبتا عمومی نرمال می باشند. ما در رگرسیون لوژستیك به طور مستقیم احتمال وقوع یك رخداد را محاسبه می كنیم. چرا كه فقط دو حالت ممكن برای متغییر وابسته ی ما وجود دارد. این احتمال برای زمانی كه چند متغییر مستقل وجود دارد به صورت زیر محاسبه می شود: كه در آن z تركیب خطی زیر است: دو مساله ی مهم كه باید در ارتباط با رگرسیون لوجستیك در نظر داشته باشیم عبارتند از: 1. رابطه ی بین پیش بینی كننده ها و متغییر وابسته غیر خطی است. 2. ضرایب رگرسیونی از طریق روش ماكزیمم درستنمایی برآورد می شود. رگرسیون لوژستیك از لحاظ محاسبات آماری شبیه رگرسیون چند گانه است اما از لحاظ كاركرد مانند تحلیل تشخیصی می باشد. در این روش عضویت گروهی بر اساس مجموعه ای از متغییرهای پیش بین انجام می شود دقیقا مانند تحلیل تشخیصی. مزیت عمده ای كه تحلیل لوجستیك نسبت به تحلیل تشخیصی دارد این است كه در این روش با انواع متغییرها به كار می رود و بنابراین بسیاری از مفروضات در مورد داده ها را به كار ندارد. در حقیقت آنچه در رگرسیون لوژستیك پیش بینی می شود یك احتمال است كه ارزش آن بین 0 تا 1 در تغییر است. ضرایب رگرسیونی مربوط به معادله ی رگرسیون لجستیك اطلاعاتی را راجع به شانس هر مورد خاص برای تعلق به گروه صفر یا یك ارائه می دهد. شانس به صورت احتمال موفقیت در برابر شكست تعریف می شود. ولی بدلیل ناقرینگی و امكان وجود مقادیر بی نهایت برای آن تبدیل به لگاریتم شانس می شود. هر یك از وزن ها را می توان از طریق مقدار خی دو كه به آماره ی والد مشهور است به لحاظ معناداری آزمود. لگاریتم شانس، شانسی را كه یك متغییر به طور موفقیت آمیزی عضویت گروهی را برای هر مورد معین پیش بینی می كند را نشان می دهد. به طور كلی در روش رگرسیون لجستك رابطه ی بین احتمال تعلق به گروه 1 و تركیب خطی متغییرهای پیش بین بر اساس توزیع سیگمودال تعریف می شود. برای دستیابی به معادله ی رگرسیونی و قدرت پیش بینی باید به نحوی بتوان رابطه ای بین متغییرهای پیش بین و وابسته تعریف نمود. برای حل این مشكل از نسبت احتمال تعلق به گروه یك به احتمال تعلق به گروه صفر استفاده می شود. به این نسبت شانس گویند. به خاطر مشكلات شانس از لگاریتم شانس استفاده می شود. لگاریتم شانس با متغییرهای پیش بینی كننده ارتباط خطی دارد. بنابراین ضرایب بدست آمده برای آن باید بر اساس رابطه ی خطی كه با لگاریتم شانس دارند تفسیر گردند. بنابراین اگر بخواهیم تفسیر را بر اساس احتمال تعلق به گروهها انجام دهیم باید لگاریتم شانس را به شانس و شانس را به اجزای زیر بنایی آن كه احتمال تعلق است تبدیل نماییم. آماره ی والد كه از توزیع خی دو پیروی می كند نیز برای بررسی معناداری ضرایب استفاده می شود. از آزمون هوسمر و لمشو نیز برای بررسی تطابق داده ها با مدل استفاده می شود معنادار نبودن این آزمون كه در واقع نوعی خی دو است به معنای عدم تفاوت داده ها با مدل یعنی برازش داده با مدل است. رگرسیون چند متغییری در این رگرسیون هدف این است كه از طریق مجموعه ای از متغییرهای پیش بین به پیش بینی چند متغییر وابسته پرداخته شود در واقع اتفاقی كه در رگرسیون كانونی می افتد.

منبع . http://measurement.blogfa.com/post-744.aspx


eugeniebolig.hatenablog.com
جمعه 13 مرداد 1396 09:18 ب.ظ
It is the best time to make a few plans for the longer term and it is time
to be happy. I've read this post and if I could I want to recommend you few interesting
issues or suggestions. Perhaps you can write next
articles relating to this article. I want to learn more things
approximately it!
Antonio
دوشنبه 25 اردیبهشت 1396 12:30 ب.ظ
I was recommended this blog by my cousin. I'm not sure
whether this post is written by him as no one else
know such detailed about my difficulty. You are amazing!

Thanks!
BHW
پنجشنبه 24 فروردین 1396 04:25 ب.ظ
Hey there! I know this is somewhat off topic but I was wondering if you knew where I could locate a captcha
plugin for my comment form? I'm using the same
blog platform as yours and I'm having trouble finding one?
Thanks a lot!
مریم میرزایی
جمعه 27 آذر 1394 12:46 ق.ظ
باسلام
محتوای مطالب گفته شدخ خوب بود
 
لبخندناراحتچشمک
نیشخندبغلسوال
قلبخجالتزبان
ماچتعجبعصبانی
عینکشیطانگریه
خندهقهقههخداحافظ
سبزقهرهورا
دستگلتفکر