تبلیغات
RF2268AM - رگرسیون چیست؟
پنجشنبه 7 دی 1391

رگرسیون چیست؟

   نوشته شده توسط: عارف محمدی    نوع مطلب :آمار ،

رگرسیون چیست؟

تاریخچه :

واژه رگرسیون در فرهنگ لغت به معنی بازگشت است و اغلب جهت رساندن مفهوم "بازگشت به یک مقدار متوسط یا میانگین” به کار می رود. بدین معنی که برخی پدیده ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می کنند .

بیش از 100 سال پیش در سال 1877 فرانسیس گالتون (Francis Galton) در مقاله ای که در همین زمینه منتشر کرد اظهار داشت که متوسط قد پسران دارای پدران قد بلند ، کمتر از قد پدرانشان می باشد . به نحو مشابه متوسط قد پسران دارای پدران کوتاه قد نیز بیشتر از قد پدرانشان گزارش شده است. به این ترتیب گالتون پدیده بازگشت به طرف میانگین را در داده هایش مورد تأکید قرار داد . برای گالتون رگرسیون مفهومی زیست شناختی داشت اما کارهای او توسط کارل پیرسون (Karl Pearson) برای مفاهیم آماری توسعه داده شده . گرچه گالتون برای تأکید بر پدیده "بازگشت به سمت مقدار متوسط" از تحلیل رگرسیون استفاده کرد، اما به هر حال امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده می شود .

نمودار پراکندگی :

در حقیقت تحلیل رگرسیونی فن و تکنیکی آماری برای بررسی و مدل سازی ارتباط بین متغیرها است. رگرسیون تقریباً در هر زمینه ای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیشبینی مورد نیاز است . می توان گفت تحلیل رگرسیونی، پرکاربردترین روش در بین تکنیک های آماری است. شمایی کلی و خلاصه شده از یک تحلیل رگرسیونی ساده به صورت زیر می باشد:

در ابتدا تحلیل گر حدس می زند که بین دو متغیر نوعی ارتباط وجود دارد ، در حقیقت حدس می زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع آوری اطلاعات کمی از دو متغیر می پردازد و این داده ها را به صورت نقاطی در یک نمودار دو بعدی رسم می کند.

این نمودار که به آن نمودار پراکندگی [scatter plot] گفته می شود نقش بسیار مهمی را در تحلیل های رگرسیونی و نمایش ارتباط بین متغیرها ایفا می کند.

در صورتی که نمودار نشان دهنده این باشد که داده ها تقریباً (نه لزوماً دقیق) در امتداد یک خط مستقیم پراکنده شده اند، حدس تحلیل گر تأیید شده و این ارتباط خطی به صورت زیر نمایش داده می شود:

y = a x + b

که در آن a عرض از مبدأ و b شیب این خط است.

متغیر ها و خطا :

بین برخی از نقاط و تصویر آنها بر روی خط رگرسیونی (خط y) کمی تفاوت به چشم می­خورد که از آن به عنوان خطای برآورد یاد می کنیم.

این خطا ممکن است از خطا در اندازه گیری ، شرایط محیط ، تفاوت های طبیعی و... ناشی شده باشد. بنابراین معادله اولیه را به صورت زیر اصلاح می کنیم :

y = ax + b + ?

معادله بالا یک مدل رگرسیون خطی نامیده می شود . معمولاً به x متغیر مستقل (رگرسیونی) و به y متغیر وابسته (پاسخ) گفته می­شود . که ? خطای تصادفی است که برای کامل شدن مدل و نشان دادن این که خطا نیز تا حدی وجود دارد در نظر گرفته می شود.

فرضیات :

معمولا فرض میشود که خطاها یکدیگر را خنثی میکنند ، به عبارت دیگر مجموع خطا ها برابر صفر است . همچنین فرض میشود خطای موجود در یک مشاهده رابطه ای با خطاهای دیگر ندارد و در نهایت تغییرات بین خطاها ثابت در نظر گرفته میشود . این سه فرض برای ساختن یک مدل ضروری است و روشهای بسیاری برای پی بردن به وجود (یا عدم برقراری ) این فرض ها وجود دارد . یکی از دلایل استفاده های نادرست از رگرسیون معمولا نادیده گرفتن این فرض ها است که موجب استدلال های غلط خواهد شد .

در صورتی که در مدل رگرسیونی فقط یک متغیر مستقل وجود داشته باشد، مدل را مدل رگرسیونی خطی ساده می نامند.

روش های رگرسیونی :

ا این مرحله مدل رگرسیونی معرفی شده و کافی است پارامترهای مجهول مدل (در اینجا a و b) برآورد شوند. برآورد پارامترها در مدل سازی با استفاده از روش های مختلف انجام میشود از جمله روش کمترین مربع خطا .

 

روش کمترین مربع خطا که یکی از روش های مورد استفاده در تحلیل رگرسیونی است اولین بار توسط لژندر (Legendre) ریاضیدان فرانسوی در سال 1805 و گوس (Gauss) ریاضیدان مشهور آلمانی در سال 1809 معرفی و در مطالعات نجومی به کار برده شد .

پس تا این قسمت تحلیل گر مدلی مشخص را به عنوان الگویی برای داده ها معرفی کرده است. مرحله بعدی "کنترل مناسب بودن مدل" می باشد که مدل از نظر قابل استفاده بودن و این که تا چه حد می تواند خوب داده ها را بیان کند بررسی می شود و در مورد بکارگیری مدل تصمیم گرفته می شود. در نتیجه مدل یا قابل استفاده تشخیص داده می شود و یا اینکه باید اصلاح شود . بنابراین تحلیل رگرسیونی فرآیندی همراه با تکرار و بازنگری است، یعنی در ابتدا مدلی معرفی می شود، کیفیت مدل مورد بررسی قرار میگیرد ، مدل قبول و یا اینکه مجدداً اصلاح می شود.

رابطه قد و وزن، رابطه عرضه و تقاضا در علم اقتصاد، تعیین رابطه بین سن افراد و فشارخون آنها، رابطه بین میزان مطالعه دانش آموزان و سطح نمرات آنها، رابطه بین نمرات و میزان قبولی در کنکور سراسری مثال هایی ساده در کاربرد رگرسیون هستند .

¤ نویسنده: سیامک داداشی

توسط محمد حسین ضرغامی


feet problems
یکشنبه 26 شهریور 1396 10:42 ب.ظ
Your way of describing all in this article is truly fastidious, every one be able to simply know it,
Thanks a lot.
vernitakibbey.weebly.com
شنبه 14 مرداد 1396 12:27 ق.ظ
I do not know if it's just me or if everyone else encountering issues with your website.

It appears as though some of the text within your posts are running off the screen. Can someone else please
provide feedback and let me know if this is happening to them too?
This might be a problem with my web browser because I've had this happen before.
Cheers
Myrtle
دوشنبه 25 اردیبهشت 1396 09:02 ب.ظ
Cool blog! Is your theme custom made or did you download
it from somewhere? A design like yours with a few
simple tweeks would really make my blog jump out.
Please let me know where you got your design. Many thanks
Sven
دوشنبه 25 اردیبهشت 1396 09:49 ق.ظ
hey there and thank you for your information – I have
certainly picked up something new from right here.

I did however expertise several technical points using this web
site, as I experienced to reload the website a lot of times previous to
I could get it to load properly. I had been wondering if your web hosting is OK?
Not that I am complaining, but slow loading instances times will often affect your placement
in google and could damage your high-quality score if advertising and marketing with
Adwords. Anyway I'm adding this RSS to my email and could look out for
a lot more of your respective interesting content. Ensure that you update this again soon.
BHW
جمعه 25 فروردین 1396 07:56 ق.ظ
I'm curious to find out what blog system you
are utilizing? I'm having some minor security issues
with my latest blog and I'd like to find something more safeguarded.
Do you have any solutions?
BHW
سه شنبه 22 فروردین 1396 09:03 ق.ظ
Hello, i feel that i noticed you visited my website so
i got here to go back the favor?.I'm attempting to find things to improve my web site!I guess
its good enough to use a few of your ideas!!
رگرسیون؛ مدل‌ها، روش‌ها و کاربردها
دوشنبه 21 اردیبهشت 1394 11:03 ب.ظ
دانلود کتاب رگرسیون؛ مدل ها، روش ها و کاربردها
http://booktolearn.com/?p=3380
 
لبخندناراحتچشمک
نیشخندبغلسوال
قلبخجالتزبان
ماچتعجبعصبانی
عینکشیطانگریه
خندهقهقههخداحافظ
سبزقهرهورا
دستگلتفکر