Интервал цувралын давтамжийг хэрхэн олох вэ. Вариацын цувралын тодорхойлолт. Хосолсон Оюутны t-тестийг юунд ашигладаг вэ?

Тодорхой шинж чанараар нэгдсэн тоонуудын бүлгийг нэрлэдэг бүхэлд нь.

Дээр дурдсанчлан, спортын анхан шатны статистик материал нь дасгалжуулагчид үзэгдэл, үйл явцын мөн чанарын талаархи ойлголтыг өгдөггүй ялгаатай тоонуудын бүлэг юм. Энэ цуглуулгыг систем болгон хувиргаж, түүний үзүүлэлтүүдийг ашиглан шаардлагатай мэдээллийг олж авах нь тулгамдсан асуудал юм.

Вариацын цувралын эмхэтгэл нь тодорхой математикийг бий болгох явдал юм

Жишээ 2. 34 цаначин зайг дуусгасны дараа зүрхний цохилтыг сэргээх дараах хугацааг тэмдэглэв (секундээр):

81; 78: 84; 90; 78; 74; 84; 85; 81; 84: 79; 84; 74; 84; 84;

85; 81; 84; 78: 81; 74; 84; 81; 84; 85; 81; 78; 81; 81; 84;

Таны харж байгаагаар энэ бүлэг тоонууд нь ямар ч мэдээлэл агуулдаггүй.

Вариацын цувралыг эмхэтгэхийн тулд эхлээд үйлдлийг гүйцэтгэдэг зэрэглэл -тоонуудыг өсөх эсвэл буурах дарааллаар байрлуулах. Жишээлбэл, өсөх дарааллаар зэрэглэл нь дараах үр дүнд хүрдэг;

78; 78; 78; 78; 78; 78;

81; 81; 81; 81; 81; 81; 81; 81; 81;

84; 84; 84; 84; 84; 84; 84; 84; 84; 84; 84;

Буурах дарааллаар зэрэглэл нь энэ бүлгийн тоонуудын үр дүнд:

84; 84; 84; 84; 84; 84; 84; 84: 84: 84; 84;

81; 81; 81; 81; 8!; 81: 81; 81; 81;

78; 78; 78; 78; 78; 78;

Үнэлгээний дараа энэ бүлгийн тоог бичих утгагүй хэлбэр нь тодорхой болно - ижил тоо олон удаа давтагдана. Иймд бичлэгийг ямар тоо хэдэн удаа давтагдаж байгааг илтгэх байдлаар хувиргах байгалийн санаа гарч ирдэг. Жишээлбэл, зэрэглэлийг өсөх дарааллаар өгвөл:

Зүүн талд нь тамирчны судасны цохилтыг сэргээх хугацааг харуулсан тоо, баруун талд 34 тамирчны өгөгдсөн бүлэгт энэ уншлагын давталтын тоог харуулав.

тухай дээрх ойлголтуудын дагуу математикийн тэмдэгтүүдХэмжилтийн бүлгийг зарим үсгээр тэмдэглэе, жишээ нь x. Энэ бүлгийн тоонуудын өсөн нэмэгдэж буй дарааллыг харгалзан үзвэл: x 1 -74 s; x 2 - 78 секунд; x 3 - 81 сек; x 4 - 84 сек; x 5 - 85 секунд; x 6 - x n - 90 с, авч үзсэн тоо бүрийг X i тэмдгээр тэмдэглэж болно.

Харгалзан үзсэн хэмжилтийн давталтын тоог n үсгээр тэмдэглэе. Дараа нь:

n 1 =4; n 2 =6; n 3 =9; n 4 =11; n 5 =3;n 6 =n n =1, давталтын тоо бүрийг n i гэж тэмдэглэж болно.

Нийт тооЖишээ нөхцөлийн дагуу авсан хэмжилтүүд нь 34. Энэ нь бүх n-ийн нийлбэр нь 34-тэй тэнцүү гэсэн үг юм. Эсвэл бэлгэдлийн илэрхийллээр:

Энэ дүнг нэг үсгээр тэмдэглэе - n. Дараа нь авч үзэж буй жишээний анхны өгөгдлийг энэ хэлбэрээр бичиж болно (Хүснэгт 1).

Үр дүнгийн бүлэг тоо нь ажлын эхэнд сургагч багшийн олж авсан эмх замбараагүй тархсан уншилтын цуврал юм.

Хүснэгт 1

x i n i
n=34

Ийм бүлэг нь тодорхой системийг төлөөлдөг бөгөөд түүний параметрүүд нь авсан хэмжилтийг тодорхойлдог. Хэмжилтийн үр дүнг харуулсан тоонуудыг (x i) гэж нэрлэдэг сонголтууд; n i - тэдгээрийн давталтын тоо - гэж нэрлэдэг давтамж; n - бүх давтамжийн нийлбэр - тийм хүн амын тоо хэмжээ.

Үүссэн системийг бүхэлд нь гэж нэрлэдэг вариацын цуврал.Заримдаа эдгээр цувралыг эмпирик эсвэл статистик гэж нэрлэдэг.

Бүх давтамж нь нэг n i ==1-тэй тэнцүү байх үед, өөрөөр хэлбэл өгөгдсөн бүлэг тоон дахь хэмжилт бүр зөвхөн нэг удаа тохиолдох үед вариацын цувааны онцгой тохиолдол боломжтой гэдгийг харахад хялбар байдаг.

Үүссэн вариацын цувралыг бусадтай адил графикаар дүрсэлж болно. Үүссэн цувралын графикийг зурахын тулд юуны өмнө хэвтээ ба босоо тэнхлэгийн масштабын талаар тохиролцох шаардлагатай.

Энэ асуудалд хэвтээ тэнхлэгБид импульсийн сэргэлтийн хугацааны утгыг (x 1) дур мэдэн сонгосон уртын нэгж нь нэг секундын утгатай тохирч байхаар зурах болно. Бид эдгээр утгыг 70 секундээс хойш хойшлуулж, хоёр тэнхлэгийн огтлолцолоос нөхцөлтэйгээр ухарч эхэлнэ 0.

Босоо тэнхлэг дээр бид цувралын давтамжийн утгыг (n i) зурж, масштабыг авч үзье: уртын нэгж нь давтамжийн нэгжтэй тэнцүү байна.

График байгуулах нөхцөлийг бэлтгэсний дараа бид үүссэн вариацын цуваатай ажиллаж эхэлнэ.

График дээр x 1 =74, n 1 =4 гэсэн эхний хос тоог бид дараах байдлаар зурна: x тэнхлэг дээр; х 1-ийг ол =74 ба энэ цэгээс перпендикулярыг сэргээж, n тэнхлэг дээр бид n 1 = 4-ийг олж, түүнээс өмнө сэргээсэн перпендикуляртай огтлолцох хүртэл хэвтээ шугамыг зурна. Босоо болон хэвтээ шугамууд нь туслах шугамууд тул зураг дээр тасархай зурсан болно. Тэдний огтлолцох цэг нь энэ графикийн масштабаар X 1 =74 ба n 1 =4 харьцааг илэрхийлнэ.

График дээрх бусад бүх цэгүүдийг ижил аргаар зурсан. Дараа нь тэдгээрийг шулуун сегментээр холбодог. График нь хаалттай харагдахын тулд бид сегмент бүхий туйлын цэгүүдийг хэвтээ тэнхлэгийн зэргэлдээ цэгүүдтэй холбодог.

Үүссэн зураг нь бидний вариацын цувралын график юм (Зураг 1).

Вариацын цуваа бүр өөрийн гэсэн графикаар илэрхийлэгдэх нь туйлын тодорхой юм.

Цагаан будаа. 1. Вариацын цувааны график дүрслэл.

Зураг дээр. 1 харагдахуйц:

1) бүх үзлэгт хамрагдсан хүмүүсийн хамгийн том бүлэг нь зүрхний цохилтыг сэргээх хугацаа 84 секунд байсан тамирчдаас бүрдсэн;

2) олон хүний ​​хувьд энэ хугацаа 81 секунд байна;

3) хамгийн жижиг бүлэг нь богино импульс сэргээх хугацаатай тамирчдаас бүрдсэн - 74 секунд, урт нь - 90 секунд.

Тиймээс, хэд хэдэн тестийг бөглөсний дараа та олж авсан тоонуудыг эрэмбэлж, тодорхой математикийн систем болох вариацын цувралыг эмхэтгэх хэрэгтэй. Тодорхой болгохын тулд вариацын цувааг графикаар дүрсэлж болно.

Дээрх вариацын цувралыг мөн нэрлэдэг салангидхажууд нь - сонголт бүрийг нэг тоогоор илэрхийлдэг.

Эмхэтгэх хэд хэдэн жишээ хэлье вариацын цуврал.

Жишээ 3. 10 буудлагын дасгал хийсэн 12 мэргэн бууч дараах үр дүнг үзүүлэв (оноогоор):

94; 91; 96; 94; 94; 92; 91; 92; 91; 95; 94; 94.

Вариацын цуврал үүсгэхийн тулд бид эдгээр тоог эрэмбэлэх болно;

94; 94; 94; 94; 94;

Үнэлгээний дараа бид вариацын цувралыг эмхэтгэдэг (Хүснэгт 3).

Тухайн туршилт эсвэл ажиглалтаар судлагдсан параметрийн утгуудын багцыг утгаараа (өсөлт эсвэл бууралт) эрэмбэлсэн багцыг вариацын цуваа гэж нэрлэдэг.

Цусны даралтын дээд босго тогтоохын тулд бид арван өвчтөний цусны даралтыг хэмжсэн гэж бодъё: систолын даралт, өөрөөр хэлбэл. ганцхан тоо.

Артерийн систолын даралтын 10 удаагийн ажиглалт (статистикийн нийлбэр) дараах хэлбэртэй байна гэж төсөөлөөд үз дээ (Хүснэгт 1).

Хүснэгт 1

Вариацын цувралын бүрэлдэхүүн хэсгүүдийг хувилбар гэж нэрлэдэг. Сонголтууд нь судалж буй шинж чанарын тоон утгыг илэрхийлнэ.

Статистик ажиглалтын багцаас вариацын цуваа байгуулах нь бүх багцын онцлогийг ойлгох эхний алхам юм. Дараа нь судалж буй тоон шинж чанарын дундаж түвшинг (цусан дахь уургийн дундаж түвшин, өвчтөнүүдийн дундаж жин, мэдээ алдуулалт эхлэх дундаж хугацаа гэх мэт) тодорхойлох шаардлагатай.

Дундаж түвшинг дундаж хэмжигдэхүүн гэж нэрлэдэг шалгуураар хэмждэг. Дундаж утга нь чанарын хувьд нэг төрлийн утгуудын ерөнхий тоон шинж чанар бөгөөд нэг шалгуурын дагуу бүх статистикийн популяцийг нэг тоогоор илэрхийлдэг. Дундаж утга нь тухайн ажиглалтын багц дахь шинж чанарт юу нийтлэг байгааг илэрхийлдэг.

Нийтлэг хэрэглээнд гурван төрлийн дундаж байдаг: горим (), медиан () болон арифметик дундаж ().

Аливаа дундаж утгыг тодорхойлохын тулд бие даасан ажиглалтын үр дүнг ашиглан вариацын цуврал хэлбэрээр бүртгэх шаардлагатай (Хүснэгт 2).

Загвар- цуврал ажиглалтын явцад хамгийн их тохиолддог утга. Бидний жишээн дээр горим = 120. Хэрэв вариацын цувралд давтагдах утга байхгүй бол тэд горим байхгүй гэж хэлдэг. Хэрэв хэд хэдэн утгыг ижил тоогоор давтвал тэдгээрийн хамгийн бага нь горимд тооцогддог.

Медиан- тархалтыг хоёр тэнцүү хэсэгт хуваах утга, өсөх эсвэл буурах дарааллаар эрэмблэгдсэн цуврал ажиглалтын төв буюу дундаж утга. Тиймээс хэрэв вариацын цувралд 5 утга байгаа бол түүний медиан нь цувралд байгаа бол вариацын цувралын гурав дахь гишүүнтэй тэнцүү байна. тэгш тоогишүүд, тэгвэл медиан нь түүний хоёр төв ажиглалтын арифметик дундаж, i.e. хэрэв цувралд 10 ажиглалт байгаа бол медиан нь 5 ба 6 дахь ажиглалтын арифметик дундажтай тэнцүү байна. Бидний жишээн дээр.

Анхаарна уу чухал онцлоггорим ба медианууд: тэдгээрийн утгууд нь туйлын сонголтуудын тоон утгуудаас хамаардаггүй.

Арифметик дундажтомъёогоор тооцоолно:

хаана --р ажиглалтад ажиглагдсан утга ба ажиглалтын тоо. Бидний хэргийн хувьд.

Арифметик дундаж нь гурван шинж чанартай байдаг.

Дундаж нь вариацын цувралын дунд байр суурийг эзэлдэг. Хатуу тэгш хэмтэй эгнээнд.

Дундаж нь ерөнхий утга бөгөөд бие даасан өгөгдлийн санамсаргүй хэлбэлзэл, ялгаа нь дунджийн ард харагдахгүй. Энэ нь нийт хүн амын ердийн зүйлийг тусгасан байдаг.

Дунджаас бүх сонголтуудын хазайлтын нийлбэр тэг байна: . Дунджаас сонголтын хазайлтыг зааж өгсөн болно.

Вариацын цуваа нь хувилбарууд болон тэдгээрийн холбогдох давтамжуудаас бүрдэнэ. Олж авсан арван утгын 120 нь 6 удаа, 115 нь 3 удаа, 125 нь 1 удаа гарсан байна. Давтамж () - өгөгдсөн хувилбар нь вариацын цувралд хэдэн удаа тохиолдож байгааг харуулсан нийлбэр дэх бие даасан хувилбаруудын үнэмлэхүй тоо.

Вариацын цуваа нь энгийн (давтамж = 1) эсвэл бүлэглэж, богиносгосон байж болно, 3-5 сонголттой. Энгийн цувралыг цөөн тооны ажиглалт хийхэд ашигладаг (), бүлэглэсэн цувралыг олон тооны ажиглалтанд ашигладаг ().

Орчин үеийн шинжлэх ухааны хөгжлийг хэрэгжүүлэхэд онцгой ач холбогдолтой их хэмжээний мэдээллийг боловсруулахдаа судлаач эх сурвалжийг зөв бүлэглэх ноцтой ажилтай тулгардаг. Хэрэв өгөгдөл нь салангид шинж чанартай бол бидний харж байгаагаар ямар ч асуудал гарахгүй - та функц бүрийн давтамжийг тооцоолох хэрэгтэй. Хэрэв судалж буй шинж чанар нь байвал Үргэлжилсэншинж чанар (энэ нь практикт илүү түгээмэл байдаг), дараа нь функцийг бүлэглэх интервалын оновчтой тоог сонгох нь тийм ч энгийн ажил биш юм.

Тасралтгүй санамсаргүй хэмжигдэхүүнүүдийг бүлэглэхийн тулд шинж чанарын бүх вариацын хүрээг тодорхой тооны интервалд хуваана. руу.

Бүлэглэсэн интервал (Үргэлжилсэн) вариацын цуврал r"-р интервалд орсон ажиглалтын тоо эсвэл харьцангуй давтамж () -ийг харгалзах давтамжийн () -ийн хамт тэмдэглэсэн атрибутын () утгаар эрэмблэгдсэн интервалууд гэж нэрлэдэг.

Онцлог утгын интервалууд

ми давтамж

баганат графикТэгээд хуримтлагдах (огива),Бидний аль хэдийн нарийвчлан хэлэлцсэн эдгээр нь өгөгдлийн бүтцийн талаар анхан шатны ойлголт авах боломжийг олгодог өгөгдлийг дүрслэх маш сайн хэрэгсэл юм. Ийм графикуудыг (Зураг 1.15) тасралтгүй өгөгдөлд зориулж салангид өгөгдлийн нэгэн адил бүтээдэг бөгөөд зөвхөн тасралтгүй өгөгдөл нь боломжит утгуудын мужийг бүрэн дүүргэж, ямар ч утгыг авч байгааг харгалзан үздэг.

Цагаан будаа. 1.15.

Тийм ч учраас гистограм дээрх баганууд ба хуримтлал нь бие биедээ хүрч, атрибутын утгууд нь боломжит бүх хэсэгт багтахгүй байх ёстой.(жишээ нь, гистограмм болон хуримтлал нь 1.16-р зурагт үзүүлсэн шиг судлагдсан хувьсагчийн утгыг агуулаагүй абсцисса тэнхлэгийн дагуу "нүх" байх ёсгүй). Баарны өндөр нь давтамжтай тохирч байна - өгөгдсөн интервал доторх ажиглалтын тоо, эсвэл харьцангуй давтамж - ажиглалтын эзлэх хувь. Интервалууд огтлолцох ёсгүйихэвчлэн ижил өргөнтэй байдаг.

Цагаан будаа. 1.16.

Гистограм ба олон өнцөгт нь магадлалын нягтын муруй (дифференциал функц) f(x)магадлалын онолын хүрээнд авч үзсэн онолын тархалт. Тиймээс тэдгээрийн бүтэц нь тоон тасралтгүй өгөгдлийн анхан шатны статистик боловсруулалтад маш чухал байдаг - тэдгээрийн гадаад төрхөөр нь таамаглалын тархалтын хуулийг шүүж болно.

Хуримтлал – интервалын өөрчлөлтийн цувралын хуримтлагдсан давтамжийн (давтамж) муруй. Хуримтлагдсан тархалтын функцийн графикийг хуримтлалтай харьцуулна F(x), мөн магадлалын онолын хичээлээр хэлэлцсэн.

Үндсэндээ гистограмм ба хуримтлал гэсэн ойлголтууд нь тасралтгүй өгөгдөл, тэдгээрийн интервалын хэлбэлзлийн цувралтай холбоотой байдаг, учир нь тэдгээрийн графикууд нь магадлалын нягтын функц ба тархалтын функцийн эмпирик тооцоолол юм.

Интервалын вариацын цувралыг бүтээх нь интервалын тоог тодорхойлохоос эхэлдэг к.Энэ даалгавар нь судалж буй асуудлын хамгийн хэцүү, чухал, маргаантай байж магадгүй юм.

Интервалын тоо хэт бага байж болохгүй, учир нь энэ нь гистограмыг хэт жигд болгоно ( хэт гөлгөр),анхны өгөгдлийн хувьсах бүх шинж чанараа алддаг - Зураг дээр. 1.17. Зураг дээрх графиктай ижил өгөгдөл хэрхэн байгааг харж болно. 1.15, цөөн тооны интервалтай гистограммыг бүтээхэд ашигладаг (зүүн график).

Үүний зэрэгцээ интервалын тоо хэт том байх ёсгүй - эс тэгвээс бид тоон тэнхлэгийн дагуу судлагдсан өгөгдлийн тархалтын нягтыг тооцоолох боломжгүй болно: гистограмм нь дутуу гөлгөр болно. (дутуу гөлгөр),хоосон зайтай, тэгш бус (Зураг 1.17, баруун талын графикийг үз).

Цагаан будаа. 1.17.

Хамгийн тохиромжтой интервалын тоог хэрхэн тодорхойлох вэ?

1926 онд Герберт Стергес судалж буй шинж чанарын анхны багц утгыг хуваах шаардлагатай интервалын тоог тооцоолох томъёог санал болгосон. Энэ томьёо үнэхээр их алдартай болсон - ихэнх статистикийн сурах бичгүүд үүнийг санал болгодог бөгөөд олон статистикийн багцууд үүнийг анхдагч байдлаар ашигладаг. Энэ нь хэр үндэслэлтэй, бүх тохиолдолд маш ноцтой асуулт юм.

Тэгэхээр Стержсийн томъёо юунд үндэслэсэн бэ?

Ингээд авч үзье бином тархалт }