Санамсаргүй хэмжигдэхүүн хоорондын хамаарал. Корреляцийн шинжилгээний танилцуулга. Регрессийн шинжилгээний үндэс Санамсаргүй хэмжигдэхүүний хоорондын хамаарлын шинж чанар

Регрессийн шинжилгээ

аргыг ашиглан туршилтын үр дүнг боловсруулах

Нарийн төвөгтэй системийн үйл ажиллагааны процессыг судлахдаа нэгэн зэрэг ажилладаг хэд хэдэн санамсаргүй хэмжигдэхүүнтэй харьцах хэрэгтэй. Үзэгдлийн механизм, системийн элементүүдийн хоорондын шалтгаан-үр дагаврын холбоо гэх мэтийг ойлгохын тулд олж авсан ажиглалт дээр үндэслэн бид эдгээр хэмжигдэхүүнүүдийн хоорондын хамаарлыг тогтоохыг хичээдэг.

Математик шинжилгээнд жишээлбэл, хоёр хэмжигдэхүүний хоорондын хамаарлыг функц гэсэн ойлголтоор илэрхийлдэг.

Энд нэг хувьсагчийн утга бүр нь нөгөө хувьсагчийн зөвхөн нэг утгатай тохирч байна. Энэ хамаарлыг нэрлэдэг ажиллагаатай.

Санамсаргүй хэмжигдэхүүний хамаарлын тухай ойлголтын нөхцөл байдал илүү төвөгтэй байдаг. Дүрмээр бол нарийн төвөгтэй системийн ажиллагааг тодорхойлдог санамсаргүй хэмжигдэхүүнүүдийн (санамсаргүй хүчин зүйлүүд) хооронд ихэвчлэн нэг утгын өөрчлөлтөөр нөгөөгийн тархалт өөрчлөгддөг ийм холболт байдаг. Энэ холболтыг нэрлэдэг стохастик, эсвэл магадлал. Энэ тохиолдолд санамсаргүй хүчин зүйлийн өөрчлөлтийн хэмжээ Ю, утгын өөрчлөлттэй харгалзах X, хоёр бүрэлдэхүүн хэсэг болгон хувааж болно. Эхнийх нь донтолттой холбоотой. Ю-аас X, хоёр дахь нь "өөрийн" санамсаргүй бүрэлдэхүүн хэсгүүдийн нөлөөгөөр ЮТэгээд X. Хэрэв эхний бүрэлдэхүүн хэсэг байхгүй бол санамсаргүй хэмжигдэхүүнүүд орно ЮТэгээд Xбие даасан байдаг. Хэрэв хоёр дахь бүрэлдэхүүн хэсэг байхгүй бол ЮТэгээд Xфункциональ байдлаар хамаарна. Хэрэв хоёр бүрэлдэхүүн хэсэг байгаа бол тэдгээрийн хоорондын хамаарал нь санамсаргүй хэмжигдэхүүнүүдийн хоорондын холболтын бат бөх эсвэл ойр байдлыг тодорхойлдог ЮТэгээд X.

Стохастик харилцааны тодорхой талыг тодорхойлдог янз бүрийн үзүүлэлтүүд байдаг. Тиймээс санамсаргүй хэмжигдэхүүнүүдийн хоорондох шугаман хамаарал XТэгээд Юкорреляцийн коэффициентийг тодорхойлно.

санамсаргүй хэмжигдэхүүн X болон математикийн хүлээлт хаана байна Ю.

– санамсаргүй хэмжигдэхүүний стандарт хазайлт XТэгээд Ю.


Санамсаргүй хэмжигдэхүүний шугаман магадлалын хамаарал нь нэг санамсаргүй хэмжигдэхүүн нэмэгдэхэд нөгөө нь шугаман хуулийн дагуу өсөх (эсвэл буурах) хандлагатай байдаг. Хэрэв санамсаргүй хэмжигдэхүүн XТэгээд Юхатуу шугаман функциональ хамаарлаар холбогддог, жишээлбэл,

y=b 0 +b 1 x 1,

дараа нь корреляцийн коэффициент нь тэнцүү байх болно; тэмдэг нь коэффициентийн тэмдэгтэй тохирч байна б 1.Хэрэв үнэт зүйлс XТэгээд Юдурын стохастик хамаарлаар холбогдсон бол корреляцийн коэффициент нь дотроо өөрчлөгдөнө

Бие даасан санамсаргүй хэмжигдэхүүнүүдийн хувьд корреляцийн коэффициент тэг байна гэдгийг онцлон тэмдэглэх нь зүйтэй. Гэсэн хэдий ч санамсаргүй хэмжигдэхүүнүүдийн хамаарлын үзүүлэлт болох корреляцийн коэффициент нь ноцтой сул талуудтай. Нэгдүгээрт, тэгш байдлаас r= 0 нь санамсаргүй хэмжигдэхүүнүүдийн бие даасан байдлыг илэрхийлдэггүй XТэгээд Ю(хэвийн тархалтын хуульд хамаарах санамсаргүй хэмжигдэхүүнүүдээс бусад нь r= 0 гэдэг нь нэгэн зэрэг хамааралгүй гэсэн үг). Хоёрдугаарт, хэт их утгууд нь тийм ч ашигтай биш, учир нь тэдгээр нь ямар ч функциональ хамааралгүй, зөвхөн шугаман хамааралтай байдаг.



Хамааралтай байдлын бүрэн тайлбар Ю-аас X, мөн цаашлаад яг функциональ хамаарлаар илэрхийлэгдэхийг нөхцөлт тархалтын функцийг мэдэж авч болно.

Энэ тохиолдолд ажиглагдсан хувьсагчдын нэг нь санамсаргүй бус гэж тооцогддог гэдгийг тэмдэглэх нь зүйтэй. Хоёр санамсаргүй хэмжигдэхүүний утгыг нэгэн зэрэг засах замаар XТэгээд Ю, тэдгээрийн утгыг харьцуулахдаа бид бүх алдааг зөвхөн утгад хамааруулж болно Ю. Тиймээс ажиглалтын алдаа нь өөрийн санамсаргүй алдаанаас бүрдэх болно Юмөн үнэ цэнэтэй учир үүссэн харьцуулалтын алдаанаас Юхарьцуулж байгаа яг ижил утгатай биш Xяг үнэндээ болсон.

Гэсэн хэдий ч нөхцөлт хуваарилалтын функцийг олох нь дүрмээр бол маш хэцүү ажил болж хувирдаг. хоорондын харилцааг судлах хамгийн хялбар арга XТэгээд Юхэвийн тархалттай Ю, учир нь энэ нь математикийн хүлээлт ба дисперсээр бүрэн тодорхойлогддог. Энэ тохиолдолд хамаарлыг тайлбарлах Ю-аас Xнөхцөлт хуваарилалтын функцийг бий болгох шаардлагагүй, харин параметрийг өөрчлөхдөө хэрхэн хийхийг зааж өгнө Xхэмжигдэхүүний өөрчлөлтийн математик хүлээлт ба дисперс Ю.

Тиймээс бид зөвхөн хоёр функцийг олох шаардлагатай байна:

Нөхцөлт хэлбэлзлийн хамаарал Дпараметрээс Xгэж нэрлэдэг сходастикхамаарал. Энэ нь параметр өөрчлөгдөхөд ажиглалтын техникийн нарийвчлалын өөрчлөлтийг тодорхойлдог бөгөөд үүнийг маш ховор ашигладаг.

Математикийн нөхцөлт хүлээлтийн хамаарал М-аас Xгэж нэрлэдэг регресс, энэ нь хэмжигдэхүүнүүдийн жинхэнэ хамаарлыг өгдөг XТэгээд У, бүх санамсаргүй давхаргагүй. Иймээс хамааралтай хувьсагчийн аливаа судалгааны хамгийн тохиромжтой зорилго нь регрессийн тэгшитгэлийг олох бөгөөд дисперсийг зөвхөн олж авсан үр дүнгийн үнэн зөвийг үнэлэхэд ашигладаг.

Тус компанид 10 хүн ажилладаг. Хүснэгт 2-т тэдний ажлын туршлага болон

сарын цалин.

Эдгээр өгөгдлийг ашиглан тооцоол

  • - түүврийн ковариацын үнэлгээний утга;
  • - түүврийн Pearson корреляцийн коэффициентийн утга;
  • - олж авсан утгуудаас холболтын чиглэл, хүчийг тооцоолох;
  • - Энэ компани нь тухайн компанид ажилчин хэдий чинээ их цаг зарцуулах тусам түүний цалин өндөр байх ёстой гэж үздэг Японы менежментийн загварыг ашигладаг гэж хэлэх нь хэр зүй ёсны болохыг тодорхойл.

Корреляцийн талбар дээр үндэслэн бид (хүн амын хувьд) X ба Y-ийн бүх боломжит утгуудын хоорондын хамаарал шугаман байна гэж таамаглаж болно.

Регрессийн параметрүүдийг тооцоолохын тулд бид тооцооллын хүснэгтийг байгуулна.

Дээж гэсэн үг.

Жишээ зөрүү:

Тооцоолсон регрессийн тэгшитгэл нь байх болно

y = bx + a + e,

Энд ei нь ei, a, b алдааны ажиглагдсан утгууд (тооцоолол), b параметрийн тооцоолол ба регрессийн загварт олох ёстой.

b ба c параметрүүдийг тооцоолохын тулд хамгийн бага квадратын аргыг (хамгийн бага квадратын арга) ашигладаг.

Ердийн тэгшитгэлийн систем.

a?x + b?x2 = ?y*x

Бидний өгөгдлийн хувьд тэгшитгэлийн систем нь хэлбэртэй байна

  • 10a + 307 b = 33300
  • 307 a + 10857 b = 1127700

Системийн (1) тэгшитгэлийг (-30.7)-аар үржүүлье, бид алгебрийн нэмэх аргаар шийдэх системийг олж авна.

  • -307а -9424.9 б = -1022310
  • 307 a + 10857 b = 1127700

Бид авах:

1432.1 b = 105390

b = 73.5912 хаанаас ирсэн бэ?

Одоо (1) тэгшитгэлээс "a" коэффициентийг олъё:

  • 10a + 307 b = 33300
  • 10a + 307 * 73.5912 = 33300
  • 10а = 10707.49

Бид эмпирик регрессийн коэффициентүүдийг олж авдаг: b = 73.5912, a = 1070.7492

Регрессийн тэгшитгэл (эмпирик регрессийн тэгшитгэл):

у = 73.5912 x + 1070.7492

Ковариац.

Бидний жишээнд Y шинж чанар ба X хүчин зүйлийн хоорондын холбоо өндөр бөгөөд шууд байна.

Тиймээс ажилтан тухайн компанид илүү их цаг ажиллах тусам түүний цалин өндөр байдаг гэж бид баттай хэлж чадна.

4. Статистикийн таамаглалыг шалгах. Энэ асуудлыг шийдэхийн тулд эхний алхам бол туршиж болох таамаглал болон өөр хувилбарыг боловсруулах явдал юм.

Ерөнхий хувьцааны тэгш байдлыг шалгах.

Хоёр факультет дээр оюутны гүйцэтгэлийн судалгаа хийсэн. Сонголтуудын үр дүнг 3-р хүснэгтэд үзүүлэв. Хоёр факультет онц сурдаг оюутнуудын хувь ижил байна гэж хэлж болох уу?

Энгийн арифметик дундаж

Бид ерөнхий хувьцааны тэгш байдлын талаархи таамаглалыг туршиж үздэг.

Оюутны шалгуурын туршилтын утгыг олъё:

Эрх чөлөөний зэрэглэлийн тоо

f = nх + ну - 2 = 2 + 2 - 2 = 2

Оюутны хуваарилалтын хүснэгтийг ашиглан tkp утгыг тодорхойлно уу

Оюутны хүснэгтийг ашигласнаар бид дараахь зүйлийг олно.

Хүснэгт(f;b/2) = Хүснэгт(2;0.025) = 4.303

Оюутны тархалтын чухал цэгүүдийн хүснэгтийг b = 0.05 ач холбогдлын түвшин ба өгөгдсөн тооны эрх чөлөөний зэрэглэлийг ашиглан бид tcr = 4.303-ийг олно.

Учир нь tob > tcr, тэгвэл тэг таамаглал няцаагдаж, хоёр түүврийн ерөнхий хувь тэнцүү биш байна.

Ерөнхий хуваарилалтын жигд байдлыг шалгах.

Их сургуулийн удирдлагууд хүмүүнлэгийн ухааны тэнхимийн нэр хүнд цаг хугацааны явцад хэрхэн өөрчлөгдсөнийг олж мэдэхийг хүсч байна. Энэ факультетэд өргөдөл гаргасан өргөдөл гаргагчдын тоог тухайн жилийн нийт өргөдөл гаргагчийн тоотой харьцуулан шинжилэв. (Мэдээллийг 4-р хүснэгтэд үзүүлэв). Хэрэв өргөдөл гаргагчийн тоог тухайн оны нийт сургууль төгсөгчдийн төлөөллийн түүвэр гэж үзвэл сургуулийн сурагчдын энэ факультетийн мэргэжлээр суралцах сонирхол цаг хугацааны явцад өөрчлөгддөггүй гэж хэлж болох уу?

Сонголт 4

Шийдэл: Шалгуур үзүүлэлтийг тооцоолох хүснэгт.

Интервалын дунд, xi

Хуримтлагдсан давтамж, С

Давтамж, fi/n

Түгээлтийн цувралыг үнэлэхийн тулд бид дараах үзүүлэлтүүдийг олно.

Жинлэсэн дундаж

Өөрчлөлтийн хүрээ нь үндсэн цуврал шинж чанарын хамгийн их ба хамгийн бага утгуудын хоорондох зөрүү юм.

R = 2008 - 1988 = 20 Тархалт - түүний дундаж утгын эргэн тойронд тархалтын хэмжүүрийг тодорхойлдог (тархалтын хэмжүүр, өөрөөр хэлбэл дунджаас хазайлт).

Стандарт хазайлт (дундаж түүвэрлэлтийн алдаа).

Цувралын утга тус бүр нь 2002.66-ийн дундаж утгаас дунджаар 6.32-оор ялгаатай байна.

Хүн амын жигд тархалтын талаарх таамаглалыг шалгах.

Х-ийн жигд тархалтын талаарх таамаглалыг шалгахын тулд, i.e. хуулийн дагуу: f(x) = 1/(b-a) интервалд (a,b) шаардлагатай:

a ба b параметрүүдийг тооцоолно - X-ийн боломжит утгууд ажиглагдсан интервалын төгсгөлийг томъёогоор тооцоолно (* тэмдэг нь параметрийн тооцоог илэрхийлнэ):

Хүлээгдэж буй тархалтын магадлалын нягтыг ол f(x) = 1/(b* - a*)

Онолын давтамжийг олох:

n1 = nP1 = n = n*1/(b* - a*)*(x1 - a*)

n2 = n3 = ... = ns-1 = n*1/(b* - a*)*(xi - xi-1)

ns = n*1/(b* - a*)*(b* - xs-1)

Пирсоны шалгуурыг ашиглан эмпирик болон онолын давтамжийг харьцуулж, k = s-3 эрх чөлөөний зэрэглэлийн тоог авч, s нь анхны түүвэрлэлтийн интервалын тоо; хэрэв жижиг давтамжуудын хослол, улмаар интервалууд өөрсдөө хийгдсэн бол s нь хослолын дараа үлдсэн интервалуудын тоо юм. Дараах томъёог ашиглан жигд тархалтын a* ба b* параметрийн тооцооллыг олъё.

Тооцоолсон жигд тархалтын нягтыг олъё:

f(x) = 1/(b* - a*) = 1/(2013.62 - 1991.71) = 0.0456

Онолын давтамжийг олъё:

n1 = n*f(x)(x1 - a*) = 0.77 * 0.0456(1992-1991.71) = 0.0102

n5 = n*f(x)(b* - x4) = 0.77 * 0.0456(2013.62-2008) = 0.2

ns = n*f(x)(xi - xi-1)

Пирсоны статистик нь эмпирик болон онолын тархалтын ялгааг хэмждэг тул түүний ажиглагдсан утга Коб их байх тусам үндсэн таамаглалын эсрэг аргумент илүү хүчтэй болно.

Тиймээс, энэ статистикийн чухал бүс нь үргэлж баруун гартай байдаг: ) анхны (гажуудаагүй) схемийн харгалзах шинж чанараас ихээхэн ялгаатай байж болно (, l) - Тиймээс, жишээлбэл, доор (1.1.4-р хэсгийг үзнэ үү) харуулав. Анхны хоёр хэмжээст хэвийн схемд санамсаргүй хэвийн алдаа оноох нь (, m) хамааралтай Ql регрессийн коэффициентийн абсолют утгыг (B. 15) үргэлж бууруулж, тэдгээрийн хоорондын уялдаа холбоог сулруулдаг. (өөрөөр хэлбэл корреляцийн коэффициент r-ийн үнэмлэхүй утгыг бууруулдаг).

Корреляцийн коэффициентийн утгад хэмжилтийн алдааны нөлөөлөл. Хоёр хэмжээст хэвийн санамсаргүй хэмжигдэхүүний (, TJ) бүрэлдэхүүн хэсгүүдийн хоорондын хамаарлын ойрын зэрэглэлийг тооцоолохыг хүсч байна, гэхдээ бид тэдгээрийг зөвхөн санамсаргүй хэмжилтийн es ба e алдаагаар л ажиглаж болно (D2 диаграмыг харна уу). Оршил хэсэгт хамаарах хамаарал). Тиймээс туршилтын өгөгдөл (xit i/i), i = 1, 2,. .., l нь гажуудсан хоёр хэмжээст санамсаргүй хэмжигдэхүүний түүврийн утгууд (, r)), энд =

Арга R.a. регрессийн тэгшитгэл (түүний параметрүүдийг тооцоолох) гаргахаас бүрдэх бөгөөд үүний тусламжтайгаар өөр нэг (эсвэл олон буюу олон хувьсах регрессийн хувьд бусад) утгыг мэддэг бол санамсаргүй хэмжигдэхүүний дундаж утгыг олдог. (Үүний эсрэгээр корреляцийн шинжилгээг санамсаргүй хэмжигдэхүүнүүдийн хоорондын хамаарлын хүчийг олж, илэрхийлэхэд ашигладаг71.)

Цаг хугацааны тогтвортой өөрчлөлттэй холбоогүй шинж тэмдгүүдийн харилцан хамаарлыг судлахдаа тэмдэг бүрийг олон шалтгааны нөлөөн дор санамсаргүй байдлаар авч үздэг. Динамик цувралд цуврал бүрийн цаг хугацааны өөрчлөлтийг нэмж оруулсан болно. Энэ өөрчлөлт нь автокорреляци гэж нэрлэгддэг зүйлд хүргэдэг - өмнөх цувралуудын түвшний өөрчлөлтийн дараагийн цувралд үзүүлэх нөлөө. Иймд цаг хугацааны цувааны түвшний хоорондын хамаарал нь тухайн үе бүрт автокорреляци байхгүй тохиолдолд л хугацааны цуваанд тусгагдсан үзэгдлүүдийн хоорондын нягт холбоог зөв харуулдаг. Нэмж дурдахад автокорреляци нь регрессийн коэффициентүүдийн дундаж квадрат алдааны утгыг гажуудуулахад хүргэдэг бөгөөд энэ нь регрессийн коэффициентүүдийн итгэлцлийн интервалыг бий болгох, түүнчлэн тэдгээрийн ач холбогдлыг шалгахад хүндрэл учруулдаг.

(1.8) ба (1.8) хамаарлаар тодорхойлсон онолын болон түүврийн корреляцийн коэффициентийг хоёр хэмжээст ажиглалтын дурын системд албан ёсоор тооцож болох бөгөөд тэдгээр нь дүн шинжилгээ хийсэн шинж чанаруудын хоорондын шугаман статистик харилцааны ойролцоо байдлын хэмжүүр юм. Гэхдээ судалж буй санамсаргүй хэмжигдэхүүн ба q-ын хамтарсан хэвийн тархалтын үед л корреляцийн коэффициент r нь тэдгээрийн хоорондын холболтын ойрын зэрэглэлийн шинж чанар болох тодорхой утгатай байна. Ялангуяа энэ тохиолдолд r - 1 харьцаа нь судалж буй хэмжигдэхүүнүүдийн хоорондох цэвэр функциональ шугаман хамаарлыг баталж, r = 0 тэгшитгэл нь тэдгээрийн бүрэн бие даасан байдлыг харуулж байна. Нэмж дурдахад корреляцийн коэффициент нь санамсаргүй хэмжигдэхүүн ба TJ-ийн дундаж ба дисперсийн хамт эдгээр таван параметрийг бүрдүүлдэг.

Корреляцийн шинжилгээний зорилгоЭнэ нь зарим бодит үйл явцыг тодорхойлдог санамсаргүй хэмжигдэхүүнүүдийн (онцлогууд) хоорондын холболтын бат бөх байдлын тооцоог тодорхойлох явдал юм.
Корреляцийн шинжилгээний асуудлууд:
a) Хоёр ба түүнээс дээш үзэгдлийн уялдаа холбоо (ойр байдал, хүч чадал, ноцтой байдал, эрч хүч) зэргийг хэмжих.
б) Үзэгдлийн хоорондын уялдаа холбоог хэмжихэд үндэслэн үүссэн шинж чанарт хамгийн их нөлөө үзүүлэх хүчин зүйлсийг сонгох. Энэ тал дээр чухал ач холбогдолтой хүчин зүйлсийг регрессийн шинжилгээнд цаашид ашигладаг.
в) Үл мэдэгдэх учир шалтгааны хамаарлыг илрүүлэх.

Харилцааны илрэлийн хэлбэрүүд нь маш олон янз байдаг. Хамгийн түгээмэл төрөл нь функциональ (бүрэн) ба хамаарал (бүрэн бус) холболт.
Корреляцихамааралтай хувьсагчийн өгөгдсөн утга нь бие даасан хувьсагчийн тодорхой цуврал магадлалын утгатай тохирч байх үед масс ажиглалтын хувьд дунджаар илэрдэг. Харилцааг корреляци гэж нэрлэдэг, хэрэв хүчин зүйлийн шинж чанарын утга бүр нь үр дүнгийн шинж чанарын сайн тодорхойлсон санамсаргүй бус утгатай тохирч байвал.
Корреляцийн хүснэгтийн дүрслэл нь корреляцийн талбар юм. Энэ нь абсцисса тэнхлэг дээр X утгыг, ордны тэнхлэг дээр Y утгыг, X ба Y-ийн хослолыг цэгээр харуулсан график юм. Цэгүүдийн байршлаар хүн байгаа эсэхийг дүгнэж болно. холболтын.
Холболтын ойрын үзүүлэлтүүдҮүссэн шинж чанарын өөрчлөлтөөс хамаарах хүчин зүйлийн шинж чанарын өөрчлөлтөөс хамаарлыг тодорхойлох боломжтой болгоно.
Ачаалал ихтэй байдлын илүү дэвшилтэт үзүүлэлт корреляцийн холболтбайна шугаман корреляцийн коэффициент. Энэ үзүүлэлтийг тооцоолохдоо зөвхөн шинж чанарын бие даасан утгуудын дунджаас хазайхаас гадна эдгээр хазайлтын хэмжээг харгалзан үздэг.

Энэ сэдвийн гол асуултууд нь үр дүнтэй шинж чанар ба тайлбарлагч хувьсагчийн хоорондох регрессийн хамаарлын тэгшитгэл, регрессийн загварын параметрүүдийг тооцоолох хамгийн бага квадратын арга, үүссэн регрессийн тэгшитгэлийн чанарыг шинжлэх, үр дүнг таамаглах итгэлийн интервалыг бий болгох явдал юм. регрессийн тэгшитгэлийг ашиглан үр дүнтэй шинж чанарын утгууд.

Жишээ 2


Ердийн тэгшитгэлийн систем.
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Бидний өгөгдлийн хувьд тэгшитгэлийн систем нь хэлбэртэй байна
30a + 5763 b = 21460
5763 a + 1200261 b = 3800360
Эхний тэгшитгэлээс бид илэрхийлнэ Аба хоёр дахь тэгшитгэлд орлуулна:
Бид b = -3.46, a = 1379.33-ыг авна
Регрессийн тэгшитгэл:
у = -3.46 x + 1379.33

2. Регрессийн тэгшитгэлийн параметрийн тооцоо.
Дээж гэсэн үг.



Жишээ зөрүү:


Стандарт хэлбэлзэл


1.1. Корреляцийн коэффициент
Ковариац.

Бид холболтын ойрын үзүүлэлтийг тооцдог. Энэ үзүүлэлт нь түүврийн шугаман корреляцийн коэффициент бөгөөд үүнийг дараах томъёогоор тооцоолно.

Шугаман корреляцийн коэффициент нь -1-ээс +1 хүртэлх утгыг авна.
Онцлог шинж чанаруудын хоорондын холбоо нь сул, хүчтэй (ойр) байж болно. Тэдний шалгуурыг Чаддокийн масштабаар үнэлдэг.
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Бидний жишээн дээр Y шинж чанар ба X хүчин зүйлийн хоорондын хамаарал өндөр бөгөөд урвуу байна.
Үүнээс гадна шугаман хос корреляцийн коэффициентийг b регрессийн коэффициентээр тодорхойлж болно:

1.2. Регрессийн тэгшитгэл(регрессийн тэгшитгэлийн тооцоо).

Шугаман регрессийн тэгшитгэл нь y = -3.46 x + 1379.33

Коэффициент b = -3.46 нь түүний хэмжилтийн нэгжид х хүчин зүйлийн үнэ цэнийн өсөлт, бууралттай үр дүнтэй үзүүлэлтийн дундаж өөрчлөлтийг (y хэмжлийн нэгжээр) харуулна. Энэ жишээнд 1 нэгжээр өсөхөд y нь дунджаар -3.46-аар буурч байна.
a = 1379.33 коэффициент нь y-ийн таамагласан түвшинг албан ёсоор харуулдаг, гэхдээ зөвхөн x = 0 нь түүврийн утгуудтай ойролцоо байвал.
Гэхдээ хэрэв x=0 нь x-ийн түүврийн утгуудаас хол байвал шууд утгаар тайлбарлах нь буруу үр дүнд хүргэж болзошгүй бөгөөд регрессийн шугам нь ажиглагдсан түүврийн утгыг нэлээд үнэн зөв тодорхойлсон ч гэсэн энэ нь бас болно гэсэн баталгаа байхгүй. зүүн эсвэл баруун экстраполяци хийх үед тохиолдох болно.
Регрессийн тэгшитгэлд тохирох x утгыг орлуулснаар бид ажиглалт бүрийн гүйцэтгэлийн үзүүлэлтийн y(x)-ийн зэрэгцүүлсэн (урьдчилан таамагласан) утгыг тодорхойлж чадна.
y ба x хоорондын хамаарал нь регрессийн коэффициент b (хэрэв > 0 бол - шууд хамаарал, эсрэгээр - урвуу) тэмдгийг тодорхойлно. Бидний жишээн дээр холболт нь эсрэгээрээ байна.
1.3. Уян хатан байдлын коэффициент.
Үр дүнгийн үзүүлэлт y ба хүчин зүйлийн шинж чанарын хэмжлийн нэгжийн зөрүүтэй бол үр дүнгийн шинж чанарт үзүүлэх хүчин зүйлсийн нөлөөг шууд үнэлэхийн тулд регрессийн коэффициентийг (жишээ b) ашиглахыг зөвлөдөггүй.
Эдгээр зорилгын үүднээс уян хатан байдлын коэффициент ба бета коэффициентийг тооцоолно.
Дундаж уян хатан байдлын коэффициент E нь үр дүн нь дүүргэгчийн хувьд дунджаар хэдэн хувиар өөрчлөгдөхийг харуулдаг цагтхүчин зүйл өөрчлөгдөхөд түүний дундаж утгаас xдундаж үнийн дүнгийн 1%-иар.
Уян хатан байдлын коэффициентийг дараах томъёогоор олно.


Уян хатан байдлын коэффициент 1-ээс бага.Тиймээс X 1%-иар өөрчлөгдвөл Y 1%-иас бага өөрчлөгдөнө. Өөрөөр хэлбэл, Y-д X-ийн нөлөө тийм ч чухал биш юм.
Бета коэффициентхүчин зүйлийн шинж чанар нь тогтмол түвшинд тогтсон үл хамаарах бие даасан хувьсагчдын утгаас стандарт хазайлтын утгаар өөрчлөгдөхөд түүний стандарт хазайлтын утгын ямар хэсэгээр үр дүнгийн шинж чанарын дундаж утга өөрчлөгдөхийг харуулна.

Тэдгээр. стандарт хазайлтаар x-ийн өсөлт S x нь Y-ийн дундаж утгыг 0.74 стандарт хазайлтаар S y бууруулахад хүргэнэ.
1.4. Ойролцоогоор алдаа.
Үнэмлэхүй ойртсон алдааг ашиглан регрессийн тэгшитгэлийн чанарыг үнэлье. Ойролцоогоор дундаж алдаа - тооцоолсон утгын бодит хэмжээнээс дундаж хазайлт:


Алдаа нь 15% -иас бага тул энэ тэгшитгэлийг регресс болгон ашиглаж болно.
Вариацын шинжилгээ.
Дисперсийн шинжилгээний зорилго нь хамааралтай хувьсагчийн дисперсийг шинжлэхэд оршино.
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
Хаана
∑(y i - y cp) 2 - квадрат хазайлтын нийт нийлбэр;
∑(y(x) - y cp) 2 - регрессийн улмаас үүссэн квадрат хазайлтын нийлбэр (“тайлбарласан” эсвэл “факториаль”);
∑(y - y(x)) 2 - квадрат хазайлтын үлдэгдэл нийлбэр.
Онолын корреляцийн хамааралшугаман холболтын хувьд корреляцийн коэффициент r xy-тай тэнцүү байна.
Аливаа хэлбэрийн хамаарлын хувьд холболтын нягтыг ашиглан тодорхойлно олон корреляцийн коэффициент:

Энэ коэффициент нь харилцааны ойр байдал, загварын үнэн зөв байдлыг илэрхийлдэг тул бүх нийтийнх бөгөөд хувьсагчдын хоорондын холболтын аль ч хэлбэрт ашиглагдаж болно. Нэг хүчин зүйлийн корреляцийн загварыг бүтээхдээ олон корреляцийн коэффициент нь хос корреляцийн коэффициент r xy-тэй тэнцүү байна.
1.6. Тодорхойлох коэффициент.
(Олон) корреляцийн коэффициентийн квадратыг детерминацийн коэффициент гэж нэрлэдэг бөгөөд энэ нь хүчин зүйлийн шинж чанарын хэлбэлзлээр тайлбарлагдаж буй үр дүнгийн шинж чанарын хэлбэлзлийн эзлэх хувийг харуулдаг.
Ихэнх тохиолдолд детерминацийн коэффициентийг тайлбарлахдаа үүнийг хувиар илэрхийлдэг.
R2 = -0.742 = 0.5413
тэдгээр. тохиолдлын 54.13% -д х-ийн өөрчлөлт нь у-ийн өөрчлөлтөд хүргэдэг. Өөрөөр хэлбэл, регрессийн тэгшитгэлийг сонгох нарийвчлал дундаж байна. Y-ийн өөрчлөлтийн үлдсэн 45.87%-ийг загварт харгалзаагүй хүчин зүйлсээр тайлбарлаж байна.

Ном зүй

  1. Эконометрик: Сурах бичиг / Ed. I.I. Елисеева. – М.: Санхүү, статистик, 2001, х. 34...89.
  2. Магнус Ю.Р., Катышев П.К., Пересецкий А.А. Эконометрик. Анхан шатны курс. Заавар. – 2-р хэвлэл, Илч. – М.: Дело, 1998, х. 17..42.
  3. Эконометрикийн семинар: Прок. тэтгэмж / I.I. Елисеева, С.В. Курышева, Н.М. Гордеенко болон бусад; Эд. I.I. Елисеева. – М.: Санхүү, статистик, 2001, х. 5..48.

Санамсаргүй хэмжигдэхүүн нь туршилтын үр дүнд урьд өмнө тодорхойгүй байсан нэг буюу өөр утгыг авах боломжтой хэмжигдэхүүн юм.

Жишээ нь: агаарын алдагдал, гоожих, хүчилтөрөгч шингээх зэрэг, жингийн цэнэгийн бүрэлдэхүүн хэсгүүдийн алдаа, дундаж хэмжээ хангалтгүйгээс түүхий эдийн химийн найрлага дахь хэлбэлзэл гэх мэт.

Санамсаргүй хэмжигдэхүүний боломжит утгууд ба тэдгээрийн харгалзах магадлалын хоорондын холбоог тогтоодог харилцааг тархалтын хууль гэж нэрлэдэг бөгөөд энэ нь тоон хэлбэрээр хоёр хэлбэрээр илэрхийлэгддэг.

Цагаан будаа. 5.1 Түгээлтийн функц (a) ба тархалтын нягт (б)

Утгаас хамаарах үйл явдлын магадлалыг санамсаргүй хэмжигдэхүүний тархалтын функц гэнэ.

. (5.1) нь буурахгүй функц юм (Зураг 5.1,а). Аргументийн хязгаарлагдмал утгуудын утгууд нь дараахтай тэнцүү байна.

Түгээлтийн нягтрал

Өөр нэг хэлбэрийг илүү олон удаа ашигладаг хуваарилалтын хууль– тархалтын функцийн дериватив болох санамсаргүй хэмжигдэхүүний тархалтын нягт:

. (5.2) Дараа нь интервал дахь утгыг олох магадлалыг тархалтын нягтаар илэрхийлж болно.

. (5.3`) Тархалтын нягт нь сөрөг бус функц (Зураг 21, b), тархалтын муруй доорх талбай нь нэгдэлтэй тэнцүү байна:

. (5.4) Түгээлтийн функцийг тархалтын нягтаар дараах байдлаар илэрхийлж болно.

. (5.5) Ихэнх практик асуудлыг шийдвэрлэхэд зориулагдсан хуваарилалтын хууль, өөрөөр хэлбэл, санамсаргүй хэмжигдэхүүний бүрэн шинж чанар нь ашиглахад тохиромжгүй байдаг. Тиймээс санамсаргүй хэмжигдэхүүний тоон шинж чанарыг гол шинж чанарыг тодорхойлоход илүү их ашигладаг хуваарилалтын хууль. Тэдгээрийн хамгийн түгээмэл нь математикийн хүлээлт ба тархалт(эсвэл стандарт хазайлт).

Хүлээгдэж буй үнэ цэнэ

Санамсаргүй хэмжигдэхүүний математик хүлээлтийг дараах байдлаар тодорхойлно

. (5.6) хаана

Санамсаргүй хэмжигдэхүүний математик хүлээлтийг ихэвчлэн түүний арифметик дундажаар үнэлдэг бөгөөд туршилтын тоо нэмэгдэх тусам математик хүлээлтэд нийлдэг.

. (5.7) санамсаргүй хэмжигдэхүүний ажиглагдсан утгууд хаана байна.

Хэрэв хэмжигдэхүүн нь цаг хугацааны явцад (дээвэр, хананы температур, шаталтын бүтээгдэхүүний химийн найрлага) байнга өөрчлөгддөг бол ийм хугацаанд тусгаарлагдсан хэмжигдэхүүний утгыг утга болгон авах шаардлагатай гэдгийг анхаарах нь чухал юм. бие даасан туршилт гэж үзэж болох интервалууд. Практикт энэ нь зохих сувгаар дамжих инерцийг харгалзан үзэхэд хүргэдэг. Объектуудын инерцийг үнэлэх аргуудыг доор авч үзэх болно.

Вариаци ба стандарт хазайлт

Тархалт нь санамсаргүй хэмжигдэхүүний математик хүлээлтийн эргэн тойронд тархалтыг тодорхойлдог

. (5.8) Томъёог ашиглан зөрүүг тооцоолно

. (5.9) ба томьёоны дагуу стандарт хазайлт

Корреляцийн коэффициент

Корреляцийн коэффициент нь хувьсагчдын хоорондын шугаман хамаарлын түвшинг тодорхойлдог, өөрөөр хэлбэл энд бид санамсаргүй хэмжигдэхүүнүүдийн системтэй аль хэдийн харьцаж байна. Үнэлгээг томъёог ашиглан хийдэг

. (5.10)

Санамсаргүй хэмжигдэхүүний шинж чанаруудын алдаа ба итгэлийн интервалыг тодорхойлох

Санамсаргүй хэмжигдэхүүний авч үзсэн шинж чанаруудыг тодорхой найдвартай ашиглахын тулд заасан тооцооллоос гадна тархалтын зэрэг, тоо, тоо зэргээс хамаарах алдаа эсвэл итгэлцлийн интервалыг тус бүрээр нь тооцоолох шаардлагатай. туршилт ба өгөгдсөн итгэлийн магадлал. Математикийн хүлээлтийн алдааг ойролцоогоор томъёогоор тодорхойлно

. (5.11) Оюутны t тест хаана байна; заасан итгэлийн магадлал болон туршилтын тооноос хамааран хүснэгтүүдээс сонгогдоно (жишээ нь, хэзээ,).

Тиймээс математикийн хүлээлтийн жинхэнэ утга нь итгэлцлийн интервалд байх магадлалтай

. (5.12) Тооцооллын өгөгдсөн нарийвчлал, найдвартай байдлын хувьд ижил томъёог ашиглан шаардлагатай тооны бие даасан туршилтыг тооцоолж болно.

Тоо хэмжээ болон

. (5.13) Хэрэв хооронд шугаман хамаарал нь бодитоор оршин байдаг гэж үздэг

. эсвэл

. (5.14) Жишээ нь, судалж буй хэмжигдэхүүнүүдийн хоорондын хамаарал нь хэрэв

. (5.15) Үгүй бол хэмжигдэхүүнүүдийн хоорондын хамаарал нь найдваргүй болно.

Санамсаргүй утга

Санамсаргүй хэмжигдэхүүний тухай ойлголтын тодорхойлолт

Санамсаргүй хэмжигдэхүүнүүдийн хоорондын холболтын хэлбэрийг дундаж утгын өөрчлөлтийг харуулсан регрессийн шугамаар тодорхойлно

утга нь тодорхой утгыг авсан тохиолдолд тооцоолсон утгын нөхцөлт математик хүлээлтээр тодорхойлогддог утга өөрчлөгдөх үед. Тиймээс регрессийн муруй нь нөхцөлт математикийн хүлээлтийн мэдэгдэж буй утгаас хамаарах хамаарал юм

. (5.16) хаана,– сонголтуудтэгшитгэл (коэффициент).

Санамсаргүй хэмжигдэхүүн дэх өөрчлөлтүүд нь стохастик холбоотой санамсаргүй хувьсагчийн хувьсах чанар, түүнчлэн нөлөөлдөг боловч хамаарахгүй бусад хүчин зүйлсээс үүсдэг. Регрессийн тэгшитгэлийг тодорхойлох үйл явц нь тэгшитгэлийн төрлийг сонгох, өөрөөр хэлбэл функцийг тодорхойлох, регрессийн тэгшитгэлийн параметрүүдийг тооцоолох гэсэн хоёр чухал үе шатаас бүрдэнэ.

Регрессийн тэгшитгэлийн төрлийг сонгох

Энэ төрлийг судалж буй санамсаргүй хэмжигдэхүүний системийн шинж чанарт үндэслэн сонгоно. Энэ тохиолдолд боломжит аргуудын нэг бол утгуудын хоорондын харилцан хамаарлын талбарын төрлөөс хамааран регрессийн тэгшитгэлийн төрлийг туршилтаар сонгох, эсвэл тэгшитгэлийн бүтцийг зорилтот тоолох, тус бүрийг үнэлэх явдал юм. , хүрэлцэхүйц шалгуурын дагуу. Тухайн объектын талаар тодорхой априори (туршилтын өмнөх) мэдээлэл байгаа тохиолдолд энэ зорилгоор судлагдсан параметрүүдийн хоорондын холболтын үйл явц, төрлүүдийн талаархи онолын санааг ашиглах нь илүү үр дүнтэй байдаг. Шалтгаан ба үр дагаврын хамаарлыг тоон байдлаар тодорхойлох, тодорхойлох шаардлагатай үед энэ арга нь ялангуяа чухал юм.

Жишээлбэл, зөвхөн ган хайлуулах үйл явцын онолын талаархи зарим санааг олж авснаар нүүрстөрөгчгүйжүүлэх хурд нь хувиргагч ваннд шахагдсан хүчилтөрөгчийн урсгалын хурд эсвэл хүхэргүйжүүлэх чадвараас хамаарах шалтгаан-үр дагаврын хамаарлын талаар дүгнэлт хийж болно. түүний суурь болон исэлдэлтийн талаар шаар . Метал дахь хүчилтөрөгчийн агууламжийн нүүрстөрөгчийн агууламжаас хамаарах гиперболын шинж чанарын тухай ойлголт дээр үндэслэн бид нүүрстөрөгчийн ялгаруулалтын хурдыг бага хэмжээгээр үлээх эрчмээс хамаарах шугаман тэгшитгэлийг урьдчилан таамаглаж болно. нүүрстөрөгчийн агууламж (0.2% -иас бага) хангалтгүй байх тул хэд хэдэн үе шатаас зайлсхийх болно туршилтынтэгшитгэлийн төрлийг сонгох.

Регрессийн тэгшитгэлийн төрлийг сонгосны дараа түүний параметрүүдийг (коэффициент) тооцдог бөгөөд үүнийг ихэвчлэн ашигладаг. хамгийн бага квадрат арга, үүнийг доор хэлэлцэх болно.