Автомат загвар таних технологи. Загвар таних (таних) системүүд Загвар таних зарчим

Таних системийн ерөнхий бүтэц, түүний хөгжлийн үе шатыг Зураг дээр үзүүлэв. 4.

Цагаан будаа. 4. Таних системийн бүтэц

Таних даалгаврууд нь дараахь онцлог шинж чанартай байдаг.

Эдгээр нь хоёр үе шатаас бүрдэх мэдээллийн даалгавар юм: - эх өгөгдлийг танихад тохиромжтой хэлбэрт шилжүүлэх; - өөрийгөө таних (объект нь тодорхой ангилалд хамаарахыг илтгэнэ).

Эдгээр асуудлуудад та объектын аналоги эсвэл ижил төстэй байдлын тухай ойлголтыг танилцуулж, объектыг нэг ангид эсвэл өөр ангид оруулах дүрмийг боловсруулж болно.

Эдгээр даалгаврын хувьд ангиллыг нь мэддэг, сургалтын явцад даалгаврыг тохируулахын тулд албан ёсны тайлбар хэлбэрээр таних алгоритмд танилцуулж болох жишээнүүдийн багцыг ашиглаж болно.

Эдгээр асуудлын хувьд албан ёсны онолыг бий болгох, математикийн сонгодог аргуудыг хэрэглэхэд хэцүү байдаг (ихэвчлэн үнэн зөв математик загвар гаргах мэдээлэл байхгүй эсвэл загвар, математик аргуудыг ашиглахаас гарах үр ашиг нь зардалтай тохирохгүй байдаг).

Дараах төрлийн таних даалгавруудыг ялгаж үздэг: - Таних даалгавар - танилцуулсан объектыг тайлбарын дагуу өгөгдсөн ангиудын аль нэгэнд хуваарилах (хяналттай суралцах); Автомат ангиллын даалгавар бол объект, нөхцөл байдал, үзэгдлийн багцыг тэдгээрийн тайлбарын дагуу давхцаагүй ангиллын системд хуваах явдал юм (таксономи, кластерийн шинжилгээ, бие даан суралцах);

Таних явцад мэдээллийн шинж чанарын багцыг сонгох даалгавар; - Эх сурвалжийн өгөгдлийг танихад тохиромжтой хэлбэрт оруулах даалгавар; - Динамик таних ба динамик ангилал - динамик объектуудын 1 ба 2-р даалгавар;

Урьдчилан таамаглах асуудал нь өмнөх төрөл бөгөөд шийдвэр нь ирээдүйд ямар нэгэн цэгтэй холбоотой байх ёстой.

Дүгнэлт

Загварыг таних (мөн ихэвчлэн хэлдэг - объект, дохио, нөхцөл байдал, үзэгдэл, үйл явц) нь хүн оршин тогтнохынхоо эхний өдрөөс сүүлчийн өдөр хүртэл бараг секунд тутамд шийдэх ёстой хамгийн нийтлэг ажил юм. Үүний тулд тэрээр тархиныхаа асар их нөөцийг ашигладаг бөгөөд үүнийг бид 10 10-тай тэнцэх мэдрэлийн эсийн тоо гэх мэт үзүүлэлтээр үнэлдэг.

Биологи, амьд байгаль, заримдаа бүр амьгүй байгальд ч үүнтэй төстэй үйлдлүүд ажиглагдаж байгааг та жишээн дээр санаа зовохгүйгээр анзаарч болно. Нэмж дурдахад технологид хүлээн зөвшөөрөх асуудал байнга тулгардаг. Хэрэв энэ нь тийм бол хүлээн зөвшөөрөх механизмыг цогц гэж үзэх нь ойлгомжтой.

Илүү ерөнхий үүднээс авч үзвэл, өдөр тутмын үйл ажиллагаанд хүн байнга өөрчлөгдөж буй орчны улмаас шийдвэр гаргахтай холбоотой даалгавартай байнга тулгардаг гэдгийг маргаж болох бөгөөд энэ нь маш тодорхой юм. Энэ үйл явцад оролцох нь: мэдрэхүйн эрхтнүүд, тэдгээрийн тусламжтайгаар хүн гаднаас мэдээллийг хүлээн авдаг; төв мэдрэлийн систем, мэдээллийг сонгох, боловсруулах, шийдвэр гаргах; гаргасан шийдвэрийг хэрэгжүүлэх хөдөлгөөний эрхтнүүд. Гэхдээ эдгээр асуудлыг шийдэх үндэс нь харахад хялбар байдаг шиг хэв маягийг таних явдал юм.

Тэдний практикт хүмүүс объект, үзэгдэл, нөхцөл байдлыг ангилах, таних янз бүрийн асуудлыг шийддэг (бие биенээ шууд таних, хэвлэмэл болон гараар бичсэн текстийг өндөр хурдаар унших, тээврийн хэрэгслийн нарийн төвөгтэй урсгалд машиныг үнэн зөв жолоодох, туузан дамжуулагч дээрх эд ангиудыг татгалзах, кодыг шийдвэрлэх) , эртний Египетийн дөрвөлжин бичиг гэх мэт).

Албан ёсны нейронуудын сүлжээн дэх тооцоолол нь тархинд мэдээлэл боловсруулахтай олон талаараа төстэй юм. Сүүлийн 10 жилд нейрокомпьютер нь барууны орнуудад маш их алдартай болсон бөгөөд энэ нь арилжааны бүтээгдэхүүн үйлдвэрлэхтэй нягт холбоотой инженерийн салбар болжээ. Жил бүр нейрокомпьютерийн практик талуудад зориулсан олон арван ном хэвлэгддэг. Нейрокомпьютерийн шинэ аналог элементийн суурийг бий болгох ажил эрчимтэй явагдаж байна.

Орос улсад ерөнхийдөө дуу чимээ багассантай холбоотой Шинжлэх ухааны судалгааШинжлэх ухааны бүтэц "хөлдүү" болсон тул уламжлалт математик аргууд нь хэв маягийг таних аливаа асуудлыг шийдвэрлэхэд хангалттай гэсэн үзэл бодол байсаар байна. Нейрокомпьютер нь богино хугацааны загварын хэт их зүйл, хүндэтгэл гэж үздэг. Гэсэн хэдий ч нейротехнологийн олон тооны практик амжилтын цаана аливаа тодорхой асуудлыг зарчмын хувьд шийдвэрлэх боломжтой бөгөөд үүнгүйгээр зарим талаараа шинжлэх ухааны үндэслэлтэй харагдаж байна. Нейрокомпьютер нь өрсөлдөх чадвараа баталдаг тул энэ үзэгдлийг сайтар судлах нь илүү ухаалаг хэрэг юм. Бид эргэлзэж, компьютерийн хувьсгалын шинэ үе шат эхлэхийг эрсдэлд оруулж байна уу? Оросын компьютерийн шинжлэх ухаан энэ удаад маш хурдацтай хөгжиж буй, стратегийн ач холбогдолтой салбартаа дэлхийгээс бүрэн хоцрох уу?

Ойрын ирээдүйн хэтийн төлөв. Нейрокомпьютерийг орчин үеийн компьютерээс ялгаж, энэ чиглэлийн ирээдүйг баталгаажуулдаг гол онцлог нь зохиогчийн үзэж байгаагаар ямар нэгэн шалтгаанаар шийдлийн алгоритм нь хараахан байхгүй байгаа албан бус асуудлыг шийдвэрлэх чадвар юм. Нейрокомпьютерууд нь суралцах замаар алгоритм үүсгэх харьцангуй энгийн технологийг санал болгодог. Энэ бол тэдний гол давуу тал, компьютерийн ертөнц дэх "зорилго" юм.

Алгоритм үүсгэх чадвар нь хэв маягийг таних асуудалд онцгой ач холбогдолтой бөгөөд энэ нь ихэвчлэн чухал шинж чанаруудыг априори тодорхойлох боломжгүй байдаг. Тийм ч учраас дэлхийн интернетийн хөгжил нь дүрсийг танихтай нягт холбоотой шинэ технологийг хөгжүүлэхийг шаарддаг мультимедиа хөгжсөн үед нейрокомпьютер нь яг одоо хамааралтай болсон. Гэсэн хэдий ч хамгийн түрүүнд хийх зүйл.

Хиймэл оюун ухааныг хөгжүүлэх, ашиглахад тулгарч буй гол бэрхшээлүүдийн нэг бол аудио болон дүрсний дүрсийг таних асуудал хэвээр байна. Гэсэн хэдий ч интернет болон хөгжсөн харилцаа холбооны сувгууд нь энэ асуудлыг шийдвэрлэх системийг бий болгох боломжийг аль хэдийн бий болгож байна Нийгмийн сүлжээ, роботуудад 24 цагийн турш туслахад бэлэн байна.

Нийгмийн сүлжээнд суурилсан дүрс таних системийн инженерийн мэргэжил ойрын ирээдүйд, хиймэл оюун ухааны системүүд Тюринг тестийг өөрсдөө давах хүртэл эрэлт хэрэгцээтэй байх болно.

Хэдэн арван жилийн турш технологийн экспоненциал өсөлтөөс таамаглаж буй футурист Рэймонд Курцвейл Тьюрингийн туршилтыг давах чадвартай машинуудыг хамгийн эрт 2029 он хүртэл үйлдвэрлэхгүй гэж санал болгов.

Гэсэн хэдий ч AI системүүд удаан хүлээх боломжгүй - бусад бүх технологи нь анагаах ухаан, биологи, аюулгүй байдлын систем гэх мэт хэрэглээгээ олоход аль хэдийн бэлэн болсон. Тэдний нүд, чих нь алан хядагчийн гэрэл зураг, эмийн саван дээрх бичээс, тусламж хүссэн үгсийг танихад бэлэн байгаа дэлхийн сая сая хүмүүс байх болно.

Нийгмийн сүлжээнүүдийн үзэгчид асар хурдацтай өсч байна. ComScore-ийн судалгаагаар 2009 оны тавдугаар сард зөвхөн Facebook л гэхэд АНУ-д 70.28 сая хэрэглэгчтэй байжээ. Энэ нь 2008 оны тавдугаар сарын мөн үеийнхээс бараг хоёр дахин их байна.

Инженерийн ажил нь хэрэглэгчдэд танигдаагүй дүрс болон аудио дүрсийг MMS, вэб сайт дээрх попап цонх, блог дээрх маягт дээрх CAPTCHA тэмдэг гэх мэт хэлбэрээр дамжуулах, хүлээн авсан өгөгдлийг баталгаажуулах, хүлээн зөвшөөрөгдсөн үг эсвэл илгээх үйл явцыг зохион байгуулах явдал юм. AI систем рүү буцах зураг.

Ерөнхийдөө хэв маягийг таних гурван аргыг ялгаж болно: Харгис хүчний арга. Энэ тохиолдолд өгөгдлийн сантай харьцуулалтыг хийж, объектын төрөл бүрийн хувьд дэлгэцийн янз бүрийн өөрчлөлтүүдийг харуулсан болно. Жишээлбэл, оптик хээ танихын тулд та объектын харагдах байдлыг янз бүрийн өнцгөөр тоолох, масштаб, шилжилт, хэв гажилт гэх мэт аргыг ашиглаж болно. Үсгийн хувьд та үсгийн фонт, үсгийн шинж чанар гэх мэтийг тоолох хэрэгтэй. Тохиолдолд Дууны дүрсийг танихын тулд зарим мэдэгдэж буй загвартай харьцуулалтыг хийдэг (жишээлбэл, хэд хэдэн хүний ​​хэлсэн үг).

Хоёр дахь арга нь зургийн шинж чанарыг илүү гүнзгий дүн шинжилгээ хийх явдал юм. Оптик таних тохиолдолд энэ нь янз бүрийн геометрийн шинж чанарыг тодорхойлох явдал байж болно. Энэ тохиолдолд дууны дээжийг давтамж, далайцын шинжилгээ гэх мэтээр хийдэг.

Дараагийн арга бол хиймэл мэдрэлийн сүлжээ (ANN) ашиглах явдал юм. Энэ арга нь сургалтын явцад таних даалгаврын олон тооны жишээ эсвэл тусгай бүтэц шаарддаг мэдрэлийн сүлжээ, энэ ажлын онцлогийг харгалзан . Гэсэн хэдий ч энэ нь илүү өндөр үр ашиг, бүтээмжийг санал болгодог.

4. Загвар таних түүх

Загвар таних математикийн формализмыг товч авч үзье. Загвар таних объектыг үндсэн шинж чанаруудаар (онцлогууд, шинж чанарууд) тодорхойлдог. Үндсэн шинж чанарууд нь өөр шинж чанартай байж болно: тэдгээрийг бодит шугамын дараалсан багцаас эсвэл салангид багцаас (гэхдээ бүтэцтэй байж болно) авч болно. Объектын талаарх энэхүү ойлголт нь хэв маягийг таних практик хэрэглээний хэрэгцээ болон хүний ​​объектыг мэдрэх механизмын талаарх бидний ойлголттой нийцдэг. Үнэн хэрэгтээ, хүн объектыг ажиглах (хэмжих) үед түүний тухай мэдээлэл тархинд хязгаарлагдмал тооны мэдрэгч (шинжилсэн сувгууд) -аар дамжин ирдэг бөгөөд мэдрэгч бүр нь тухайн объектын харгалзах шинж чанартай холбоотой байж болно гэдэгт бид итгэдэг. Объектыг хэмжихэд тохирсон шинж чанаруудаас гадна сонгосон шинж чанар буюу шинж чанаруудын бүлэг байдаг бөгөөд үүнийг бид шинж чанаруудыг ангилах гэж нэрлэдэг бөгөөд өгөгдсөн X векторын утгыг олох нь дараахь үүрэг гүйцэтгэдэг. байгалийн болон хиймэл таних систем.

Эдгээр шинж чанаруудын утгыг тогтоохын тулд мэдэгдэж буй шинж чанарууд нь ангилсан шинж чанаруудтай хэрхэн холбоотой байдаг талаар мэдээлэлтэй байх шаардлагатай нь тодорхой байна. Энэ холболтын талаархи мэдээллийг урьд өмнө нь, өөрөөр хэлбэл ангилах шинж чанарын мэдэгдэж буй утгууд бүхий объектуудын тайлбарын багц хэлбэрээр өгдөг. Энэхүү урьдчилсан мэдээлэлд үндэслэн объектын дур зоргоороо дүрслэхдээ түүний ангилах шинж чанаруудын утгыг оноох шийдвэрийн дүрмийг бий болгох шаардлагатай.

Хэв таних асуудлын талаархи энэхүү ойлголт нь өнгөрсөн зууны 50-аад оноос хойш шинжлэх ухаанд бий болсон. Тэгээд дараа нь ийм үйлдвэрлэл огт шинэ зүйл биш гэдгийг анзаарсан. Бид үүнтэй төстэй томъёололтой тулгарсан бөгөөд жишээлбэл, техникийн оношлогоо гэх мэт олон практик асуудалд идэвхтэй ашиглагдаж байсан статистик мэдээлэлд дүн шинжилгээ хийх нэлээд батлагдсан аргууд байдаг. Тиймээс хэв маягийг таних эхний алхмууд нь үндсэн асуудлуудыг тодорхойлсон статистик аргын тэмдгийн дор явагдсан.

Статистикийн хандлага нь объектын анхны орон зай нь магадлалын орон зай, объектын шинж тэмдэг (шинж чанар) нь санамсаргүй хэмжигдэхүүнүүн дээр заасан. Дараа нь өгөгдлийн эрдэмтний даалгавар бол тодорхой үзэл баримтлалд үндэслэн шинж чанаруудын тархалтын талаархи статистик таамаглалыг дэвшүүлэх, эсвэл илүү нарийвчлалтайгаар ангилах шинж тэмдгүүдийн бусдаас хамааралтай байдлын талаархи статистик таамаглал дэвшүүлэх явдал байв. Статистикийн таамаглал нь дүрмээр бол шинж чанарын хуваарилалтын функцүүдийн параметрийн тодорхойлсон багц байв. Ердийн ба сонгодог статистик таамаглал бол энэ тархалтын хэвийн байдлын талаархи таамаглал юм (статистикчид ийм таамаглалуудын маш олон төрлийг гаргаж ирсэн). Таамаглалыг томъёолсны дараа энэ таамаглалыг өмнөх өгөгдөл дээр туршиж үзэх шаардлагатай байв. Энэхүү тест нь анх тодорхойлсон тархалтын багцаас (тархалтын таамаглалын параметр) тодорхой тархалтыг сонгох, энэ сонголтын найдвартай байдлыг (итгэлийн интервал) үнэлэхээс бүрдсэн. Үнэн хэрэгтээ энэ хуваарилалтын функц нь асуудлын хариулт байсан бөгөөд зөвхөн объектыг хоёрдмол утгагүй ангилахаа больсон, харин ангилалд хамаарах тодорхой магадлалтай байв. Статистикчид мөн ийм аргуудын асимптотик үндэслэлийг боловсруулсан. Ийм үндэслэлийг дараахь схемийн дагуу хийсэн: түгээлтийн сонголтын чанарын тодорхой функциональ (итгэлийн интервал) бий болсон бөгөөд өмнөх тохиолдлын тоо нэмэгдэхийн хэрээр 1-ийн магадлал бүхий бидний сонголт зөв болж байгааг харуулсан. энэ функциональ мэдрэмж (итгэлийн интервал 0 рүү чиглэдэг). Цаашид таних асуудлын талаархи статистикийн үзэл бодол нь зөвхөн боловсруулсан алгоритмуудын хувьд (түүнд кластер ба ялгаварлан гадуурхах дүн шинжилгээ, параметрийн бус регресс гэх мэт) маш үр дүнтэй болсон гэж бид хэлэх болно. Вапник нь хүлээн зөвшөөрөх гүнзгий статистик онолыг бий болгоход .

Гэсэн хэдий ч хэв маягийг танихтай холбоотой асуудлуудыг статистик байдлаар бууруулж болохгүй гэсэн хүчтэй аргумент бий. Ийм аливаа асуудлыг зарчмын хувьд статистикийн үүднээс авч үзэж, түүний шийдлийн үр дүнг статистик байдлаар тайлбарлаж болно. Ингэхийн тулд асуудлын объектын орон зайг магадлалын шинжтэй гэж үзэхэд л хангалттай. Гэхдээ инструментализмын үүднээс авч үзвэл таних тодорхой аргын статистик тайлбарын амжилтын шалгуур нь зөвхөн математикийн салбар болох статистикийн хэлээр энэ аргыг зөвтгөх явдал байж болно. Үндэслэл нь энэ аргыг хэрэглэхэд амжилтанд хүрэх даалгаврын үндсэн шаардлагыг боловсруулах гэсэн үг юм. Гэсэн хэдий ч одоогоор хүлээн зөвшөөрөх ихэнх аргууд, түүний дотор статистикийн аргын хүрээнд шууд үүссэн аргуудын хувьд ийм хангалттай үндэслэл олдоогүй байна. Нэмж дурдахад Фишерийн шугаман дискриминант, Парзен цонх, EM алгоритм, хамгийн ойрын хөршийн арга, Байесын итгэл үнэмшлийн сүлжээг дурьдахгүйгээр одоогийн байдлаар хамгийн түгээмэл хэрэглэгддэг статистикийн алгоритмууд нь хүчтэй эвристик шинж чанартай бөгөөд ийм тайлбартай байж болно. статистик мэдээллээс ялгаатай. Эцэст нь, дээр дурдсан бүх зүйл дээр нэмж хэлэхэд, статистикийн гол асуудал болох таних аргуудын асимптот шинж чанараас гадна хүлээн зөвшөөрөх практик нь аргуудын тооцоолол, бүтцийн нарийн төвөгтэй байдлын талаархи асуултуудыг бий болгодог. зөвхөн магадлалын онолын хамрах хүрээ.

Тиймээс статистикийн хэв маягийг хүлээн зөвшөөрөхийг статистикийн салбар гэж үзэх гэсэн статистикчдийн хүсэл эрмэлзэлээс ялгаатай нь хүлээн зөвшөөрөх практик, үзэл сурталд огт өөр санаанууд орсон байв. Тэдгээрийн нэг нь харааны хэв маягийг таних чиглэлээр хийсэн судалгаанаас үүдэлтэй бөгөөд дараах зүйрлэлд үндэслэсэн болно.

Өмнө дурьдсанчлан, өдөр тутмын амьдралд хүмүүс янз бүрийн нөхцөл байдал, сонсголын болон харааны дүрсийг таних асуудлыг байнга (ихэвчлэн ухамсаргүйгээр) шийддэг. Компьютерт зориулсан ийм чадвар нь хамгийн сайндаа ирээдүйн зүйл юм. Тиймээс хэв маягийг таних зарим анхдагчид эдгээр асуудлыг компьютер дээр шийдвэрлэх нь ерөнхийдөө хүний ​​сэтгэхүйн үйл явцыг загварчлах ёстой гэж дүгнэсэн. Асуудалд энэ өнцгөөс хандах гэсэн хамгийн алдартай оролдлого бол Ф.Розенблаттын перцептронуудын тухай алдартай судалгаа юм.

50-иад оны дунд үе гэхэд нейрофизиологичид тархины физик зарчмуудыг ойлгосон юм шиг санагдсан ("Хааны шинэ оюун ухаан" номонд Британийн нэрт онолын физикч Р.Пенроуз тархины мэдрэлийн сүлжээний загварыг сонирхолтойгоор асууж, үүнийг зөвтгөжээ. түүний үйл ажиллагаанд квант механик нөлөө чухал үүрэг гүйцэтгэдэг хэдий ч энэ загвар нь анхнаасаа эргэлзээтэй байсан ч эдгээр нээлтүүд дээр үндэслэн Ф.Розенблат харааны дүрсийг танихад суралцах загвар зохион бүтээж, түүнийг перцептрон гэж нэрлэсэн.Розенблаттын перцептрон нь дараах функц (Зураг 1):

Зураг 1. Перцептрон хэлхээ

Оролтын үед перцептрон нь объектын векторыг хүлээн авдаг бөгөөд энэ нь Розенблаттын бүтээлд дэлгэцийн аль пикселийг дүрсээр харлаж, аль нь харлаж байгааг харуулсан хоёртын вектор байсан юм. Дараа нь шинж тэмдэг бүр нь мэдрэлийн эсийн оролтоор тэжээгддэг бөгөөд түүний үйлдэл нь нейроны тодорхой жингээр энгийн үржүүлэх явдал юм. Үр дүн нь хамгийн сүүлийн нейрон руу тэжээгддэг бөгөөд энэ нь тэдгээрийг нэмж, нийт дүнг тодорхой босготой харьцуулдаг. Харьцуулалтын үр дүнгээс хамааран оролтын объект X шаардлагатай эсэхийг хүлээн зөвшөөрдөг. Дараа нь хэв маягийг танихыг заах даалгавар бол нейроны жин ба босго утгыг сонгох явдал байсан бөгөөд ингэснээр перцептрон урьд өмнө тохиолдсон харааны зургуудад зөв хариулт өгөх болно. Розенблатт энэ функц нь оролтын объект урьд өмнө байгаагүй байсан ч хүссэн дүрсийг танихад сайн байх болно гэж Розенблатт үзсэн. Бион шалтгааны улмаас тэрээр жин, босго сонгох аргыг боловсруулсан бөгөөд бид үүнд анхаарлаа хандуулахгүй. Түүний арга нь таних олон асуудалд амжилттай болж, мэдрэлийн сүлжээн дээр суурилсан сургалтын алгоритмыг судлах бүх чиглэлийг бий болгосон бөгөөд үүний нэг онцгой тохиолдол нь перцептрон юм.

Цаашилбал, перцептроны янз бүрийн ерөнхий ойлголтыг зохион бүтээж, мэдрэлийн эсийн үйл ажиллагаа төвөгтэй болсон: мэдрэлийн эсүүд одоо зөвхөн оролтын тоог үржүүлээд эсвэл тэдгээрийг нэмж, үр дүнг босготой харьцуулах төдийгүй илүү ихийг ашиглах боломжтой болсон. нарийн төвөгтэй функцууд. Зураг 2-т эдгээр нейроны хүндрэлүүдийн нэгийг харуулав.

Цагаан будаа. 2 Мэдрэлийн сүлжээний диаграмм.

Нэмж дурдахад мэдрэлийн сүлжээний топологи нь Розенблаттын үзэж байснаас хамаагүй илүү төвөгтэй байж болно, жишээлбэл:

Цагаан будаа. 3. Rosenblatt мэдрэлийн сүлжээний диаграм.

Хүндрэлүүд нь сургалтын явцад тохируулж болох параметрүүдийн тоог нэмэгдүүлэхэд хүргэсэн боловч үүнтэй зэрэгцэн маш нарийн төвөгтэй хэв маягийг тааруулах чадварыг нэмэгдүүлсэн. Энэ чиглэлийн судалгаа одоо хоорондоо нягт холбоотой хоёр чиглэлд явагдаж байна - янз бүрийн сүлжээний топологи, янз бүрийн тохиргооны аргуудыг судалж байна.

Мэдрэлийн сүлжээ нь одоогоор хэв маягийг таних асуудлыг шийдвэрлэх хэрэгсэл төдийгүй ассоциатив санах ой, дүрс шахалтын судалгаанд ашиглагдаж байна. Судалгааны энэ чиглэл нь хэв маягийг таних асуудалтай хүчтэй огтлолцдог боловч кибернетикийн тусдаа салбарыг төлөөлдөг. Одоогийн байдлаар танигч хүний ​​хувьд мэдрэлийн сүлжээ нь маш тусгайлан тодорхойлсон, параметрийн дагуу тодорхойлогдсон зураглалын багцаас өөр зүйл биш бөгөөд энэ утгаараа доор товч дурдагдах бусад ижил төстэй сургалтын загваруудаас ямар ч чухал давуу талгүй юм.

Мэдрэлийн сүлжээг өөрөө таних үүргийг (өөрөөр хэлбэл бионикийн хувьд биш, энэ нь одоо чухал ач холбогдолтой) хэрхэн үнэлэгдэж байгаатай холбогдуулан би дараахь зүйлийг тэмдэглэхийг хүсч байна: мэдрэлийн сүлжээ нь математикийн хувьд маш нарийн төвөгтэй объект юм. Шинжилгээг зөв ашигласан тохиолдолд өгөгдлөөс маш энгийн хууль тогтоомжийг олох боломжтой болгодог. Дүн шинжилгээ хийхэд хүндрэлтэй байгаа нь ерөнхийдөө нарийн төвөгтэй бүтэцтэй, үүний үр дүнд олон төрлийн хэв маягийг нэгтгэх бараг шавхагдашгүй боломжоор тайлбарлагддаг. Гэхдээ эдгээр давуу талууд нь ихэвчлэн тохиолддог тул болзошгүй алдаа, давтан сургах боломжуудын эх үүсвэр болдог. Доор авч үзэх болно, аливаа сургалтын загварын хэтийн төлөвийг ийм хоёрдмол байдлаар харах нь машин сургалтын зарчмуудын нэг юм.

Хүлээн зөвшөөрөх өөр нэг түгээмэл чиглэл бол логик дүрмүүд ба шийдвэрийн мод юм. Дээр дурдсан таних аргуудтай харьцуулахад эдгээр аргууд нь тухайн сэдвийн талаархи мэдлэгээ магадгүй хамгийн байгалийн (ухамсартай түвшинд) бүтэц болох логик дүрмийн хэлбэрээр илэрхийлэх санааг хамгийн идэвхтэй ашигладаг. Энгийн логик дүрэм гэдэг нь "Хэрэв ангилах боломжгүй шинж чанарууд нь X-тэй хамааралтай бол ангилсан нь Y-тэй холбоотой" гэх мэт хэллэгийг хэлнэ. Эмнэлгийн оношлогоонд ийм дүрмийн жишээ бол: хэрэв өвчтөн 60-аас дээш настай, өмнө нь зүрхний шигдээс өвчтэй байсан бол мэс засал хийхгүй байх - сөрөг үр дагавар гарах эрсдэл өндөр байна.

Өгөгдөл дэх логик дүрмийг хайхын тулд хоёр зүйл хэрэгтэй: дүрмийн "мэдээллийн" хэмжигдэхүүн ба дүрмийн орон зайг тодорхойлох. Дараа нь дүрмүүдийг хайх ажил нь тэдгээрийн хамгийн мэдээлэл сайтайг олохын тулд дүрмийн орон зайд бүрэн эсвэл хэсэгчлэн тоолох ажил болж хувирдаг. Мэдээллийн агуулгын тодорхойлолтыг хамгийн их танилцуулж болно янз бүрийн арга замуудЭнэ нь бас загварын зарим параметр гэдгийг харгалзан бид энэ талаар ярихгүй. Хайлтын орон зай нь стандарт аргаар тодорхойлогддог.

Хангалттай мэдээлэлтэй дүрмийг олж авсны дараа дүрмийг эцсийн ангилагч болгон "угсрах" үе шат эхэлнэ. Энд гарч буй асуудлуудыг (мөн тэдний нэлээд олон тооны) талаар дэлгэрэнгүй ярихгүйгээр бид "угсрах" үндсэн 2 аргыг жагсаах болно. Эхний төрөл нь шугаман жагсаалт юм. Хоёрдахь төрөл нь жигнэсэн санал хураалт бөгөөд дүрэм бүрт тодорхой жин оноож, тухайн объектыг ангилагчаас хамгийн олон тооны дүрмийн санал өгсөн ангид хуваарилдаг.

Үнэн хэрэгтээ, дүрэм боловсруулах үе шат болон "угсрах" үе шат нь хамтдаа явагддаг бөгөөд жигнэсэн санал эсвэл жагсаалт гаргахдаа өгөгдөл болон загвар хооронд илүү сайн нийцүүлэхийн тулд кейсийн өгөгдлийн хэсгүүдийн дүрмийн хайлтыг дахин дахин дууддаг. .

2015 оны 3-р сарын 29, Ням

Одоогийн байдлаар зураг дээрх объект байгаа эсэхээс хамааран шийдвэр гаргах эсвэл ангилах шаардлагатай олон ажил байдаг. "Таних" чадварыг биологийн амьтдын гол өмч гэж үздэг бол компьютерийн системүүд энэ шинж чанарыг бүрэн эзэмшдэггүй.

Ангиллын загварын ерөнхий элементүүдийг авч үзье.

Анги- байгаа объектуудын багц ерөнхий шинж чанарууд. Нэг ангиллын объектуудын хувьд "ижил төстэй байдал" байгаа гэж үздэг. Таних даалгаврын хувьд 1-ээс их тооны ангиудыг дурын тоогоор тодорхойлж болно.Ангиудын тоог S тоогоор тэмдэглэнэ. Анги бүр өөрийн тодорхойлох ангийн шошготой.

Ангилал- эдгээр объектын шинж чанарын зарим тайлбарын дагуу объектуудад ангийн шошго олгох үйл явц. Ангилагч нь объектын шинж чанаруудын багцыг оролтын өгөгдөл болгон хүлээн авч, үр дүнд нь ангийн шошго үүсгэдэг төхөөрөмж юм.

Баталгаажуулалт- объектын жишээг нэг объектын загвар эсвэл ангийн тайлбарт буулгах үйл явц.

Доод арга замБид материаллаг ертөнцийн олон объект, үзэгдлийг харуулсан шинж чанаруудын орон зай дахь талбайн нэрийг ойлгох болно. Гарын үсэг зурах- судалж буй объект, үзэгдлийн тодорхой шинж чанарын тоон тодорхойлолт.

Онцлог орон зайЭнэ нь өгөгдсөн таних даалгаварт тодорхойлогдсон N хэмжээст орон зай бөгөөд N нь аливаа объектын хэмжсэн шинж чанаруудын тогтмол тоо юм. Таних даалгаврын объектод харгалзах функцын х орон зайн вектор нь энэ объектын шинж чанарын утгууд болох бүрэлдэхүүн хэсгүүд (x_1,x_2,…,x_N) бүхий N хэмжээст вектор юм.

Өөрөөр хэлбэл, загвар таних нь сонгон шалгаруулалтыг ашиглан тодорхой ангид эх өгөгдлийг хуваарилах гэж тодорхойлж болно чухал шинж чанаруудэсвэл ач холбогдолгүй нарийн ширийн зүйлийн нийт массаас энэ өгөгдлийг тодорхойлох шинж чанарууд.

Ангиллын асуудлын жишээ нь:

  • дүрийг таних;
  • яриа таних;
  • эмнэлгийн оношийг тогтоох;
  • цаг агаарын урьдчилсан мэдээ;
  • нүүр царай таних
  • баримт бичгийн ангилал гэх мэт.

Ихэнх тохиолдолд эх сурвалж нь камераас авсан зураг юм. Асуудлыг авч үзэж буй зургийн анги тус бүрийн онцлог векторыг олж авах байдлаар томъёолж болно. Уг процессыг анги тус бүрийн функцийн орон зайгаас онцлог тус бүрт утга оноохыг агуулсан кодчиллын процесс гэж үзэж болно.

Хэрэв бид 2 ангиллын объектыг авч үзвэл: насанд хүрэгчид, хүүхдүүд. Та өндөр, жинг шинж тэмдэг болгон сонгож болно. Зургаас харахад эдгээр хоёр анги нь хоёр салангид багц үүсгэдэг бөгөөд үүнийг сонгосон шинж чанаруудаар тайлбарлаж болно. Гэсэн хэдий ч зөв хэмжсэн параметрүүдийг ангийн шинж чанар болгон сонгох нь үргэлж боломжгүй байдаг. Жишээлбэл, сонгосон параметрүүд нь хөлбөмбөгчид болон сагсан бөмбөгчдийн ангиллыг бий болгоход тохиромжгүй байдаг.

Таних хоёрдахь ажил бол эх зургаас онцлог шинж чанар, шинж чанарыг гаргаж авах явдал юм. Энэ ажлыг урьдчилсан боловсруулалт гэж ангилж болно. Хэрэв бид яриа таних даалгаврыг авч үзвэл эгшиг, гийгүүлэгч гэх мэт шинж чанаруудыг ялгаж салгаж болно. Шинж чанар нь тодорхой ангийн шинж чанар байх ёстой бөгөөд үүний зэрэгцээ энэ ангид нийтлэг байх ёстой. Хоорондын ялгааг тодорхойлдог шинж чанарууд - анги хоорондын шинж чанарууд. Бүх ангиудын нийтлэг шинж чанарууд нь тийм биш юм хэрэгтэй мэдээлэлмөн таних даалгаврын онцлогт тооцогдохгүй. Онцлогын сонголт нь нэг юм чухал ажлуудтаних системийг бий болгохтой холбоотой.

Онцлог шинж чанаруудыг тодорхойлсны дараа ангиллын оновчтой шийдвэр гаргах журмыг тодорхойлох шаардлагатай. m_1,m_2,…,m гэж тэмдэглэсэн өөр M ангиллыг таних зориулалттай загвар таних системийг авч үзье. 3. Дараа нь зургийн орон зай нь M мужаас бүрдэх ба тус бүр нь нэг ангиллын зурагт харгалзах цэгүүдийг агуулна гэж үзэж болно. Дараа нь хүлээн зөвшөөрөх асуудлыг хүлээн авсан хэмжилтийн векторууд дээр үндэслэн M ангиудыг тусгаарлах хил хязгаарыг бий болгох гэж үзэж болно.

Зургийг урьдчилан боловсруулах, шинж чанарыг задлах, оновчтой шийдэл, ангиллыг олж авах асуудлыг шийдвэрлэх нь ихэвчлэн хэд хэдэн параметрүүдийг тооцоолох хэрэгцээтэй холбоотой байдаг. Энэ нь параметрийн үнэлгээний асуудалд хүргэдэг. Нэмж дурдахад, шинж чанарыг задлах нь ашиглах боломжтой нь ойлгомжтой Нэмэлт мэдээлэлангиудын шинж чанарт үндэслэн.

Объектуудыг хэмжилтийн вектор хэлбэрээр дүрсэлсэнд үндэслэн харьцуулж болно. Хэмжилтийн өгөгдлийг бодит тоо хэлбэрээр илэрхийлэх нь тохиромжтой. Дараа нь хоёр объектын онцлог векторуудын ижил төстэй байдлыг Евклидийн зайг ашиглан тодорхойлж болно.

Энд d нь онцлог векторын хэмжээс юм.

Загвар таних 3 бүлэг аргууд байдаг:

  • Дээжтэй харьцуулах. Энэ бүлэгт хамгийн ойрын дундажаар, хамгийн ойрын хөрш хүртэлх зайгаар ангилдаг. Бүтцийн таних аргуудыг түүвэртэй харьцуулах бүлэгт мөн оруулж болно.
  • Статистикийн аргууд. Нэрнээс нь харахад статистикийн аргуудтаних асуудлыг шийдвэрлэхдээ зарим статистик мэдээллийг ашиглах. Энэ арга нь тухайн объектыг магадлалд тулгуурлан тодорхой ангилалд хамаарах эсэхийг тодорхойлдог.Зарим тохиолдолд тухайн объектын шинж чанар нь зохих утгыг авсан тохиолдолд тодорхой ангилалд хамаарах объектын хойд магадлалыг тодорхойлоход хүргэдэг. Жишээ нь Байесийн шийдвэрийн дүрэмд суурилсан арга юм.
  • Мэдрэлийн сүлжээнүүд. Таних аргуудын тусдаа анги. Бусдаас ялгарах онцлог нь суралцах чадвар юм.

Хамгийн ойрын дундажаар ангилна

Сонгодог хэв маягийг таних аргад ангилалд үл мэдэгдэх объектыг үндсэн шинж чанарын вектор хэлбэрээр төлөөлдөг. Онцлог шинж чанарт суурилсан таних системийг янз бүрийн аргаар боловсруулж болно. Эдгээр векторуудыг сургалтын үр дүнд системд урьдчилан мэдэж эсвэл зарим загварт үндэслэн бодит цаг хугацаанд урьдчилан таамаглаж болно.

Энгийн ангиллын алгоритм нь ангийн хүлээлтийн вектор (дундаж) ашиглан ангийн лавлагааны өгөгдлийг бүлэглэх явдал юм.

Энд x(i,j) нь i ангиллын j-р лавлагааны шинж чанар, n_j нь i ангийн лавлагаа векторуудын тоо юм.

Дараа нь үл мэдэгдэх объект нь бусад ангиудын математикийн хүлээлтийн векторуудаас i ангийн математикийн хүлээлтийн вектортой илүү ойр байвал i ангилалд хамаарах болно. Энэ арга нь анги бүрийн цэгүүд нь бусад ангиудын цэгүүдээс хол зайд байрладаг асуудлуудад тохиромжтой.

Ангиуд нь жишээлбэл, зураг дээрх шиг арай илүү төвөгтэй бүтэцтэй бол хүндрэл гарах болно. Энэ тохиолдолд 2-р анги нь нэг дундаж утгаараа муу дүрслэгдсэн хоёр салангид хэсэгт хуваагдана. Мөн 3-р анги хэтэрхий уртассан; координатын x_2 их утгатай 3-р ангийн дээжүүд 3-р ангиас 1-р ангийн дундаж утгатай ойр байна.

Тодорхойлсон асуудлыг зарим тохиолдолд зайны тооцоог өөрчлөх замаар шийдэж болно.

Бид координатын i чиглэл бүрийн дагуу ангиллын утгуудын "тарагдах" шинж чанарыг харгалзан үзэх болно - σ_i. Стандарт хазайлт нь квадрат язгууртархалтаас. x вектор ба хүлээлт x_c векторын хоорондох масштабтай Евклидийн зай нь байна

Энэхүү зайны томъёо нь ангиллын алдааны тоог багасгах боловч бодит байдал дээр ихэнх асуудлыг ийм энгийн ангиар илэрхийлэх боломжгүй юм.

Хамгийн ойрын хөрш хүртэлх зайгаар ангилах

Ангилах өөр нэг арга бол үл мэдэгдэх шинж чанарын вектор x-ийг тухайн түүвэрт энэ вектор хамгийн төстэй ангилалд оноох явдал юм. Энэ дүрмийг хамгийн ойрын хөршийн дүрэм гэж нэрлэдэг. Хамгийн ойрын хөршийн ангилал нь ангиуд нь нарийн төвөгтэй бүтэцтэй эсвэл анги давхцаж байсан ч илүү үр дүнтэй байж болно.

Энэ арга нь орон зай дахь онцлог векторуудын тархалтын загваруудын талаархи таамаглалыг шаарддаггүй. Алгоритм нь зөвхөн мэдэгдэж буй лавлагааны дээжийн мэдээллийг ашигладаг. Шийдлийн арга нь өгөгдлийн сан дахь дээж тус бүрийн х зайг тооцоолж, хамгийн бага зайг олоход суурилдаг. Энэ аргын давуу талууд нь тодорхой байна:

  • та хүссэн үедээ мэдээллийн санд шинэ дээж нэмэх боломжтой;
  • мод болон сүлжээний өгөгдлийн бүтэц нь тооцоолсон зайны тоог багасгадаг.

Нэмж дурдахад бид мэдээллийн сангаас хамгийн ойрын хөршийг биш, харин k гэж хайвал шийдэл нь илүү дээр байх болно. Дараа нь k > 1-ийн хувьд d хэмжээст орон зай дахь векторуудын тархалтын хамгийн сайн түүвэрлэлтийг хангана. Гэсэн хэдий ч үр ашигтай ашиглах k-ийн утга нь орон зайн бүс бүрт хангалттай тоо байгаа эсэхээс хамаарна. Хэрэв хоёроос дээш анги байвал зөв шийдвэр гаргахад хэцүү болно.

Уран зохиол

  • M. Castrillon, . O. Deniz, . Д.Хернандес, Ж.Лорензо, “Виола-Жонсын ерөнхий объект илрүүлэх тогтолцоонд суурилсан нүүр ба нүүрний онцлог илрүүлэгчийн харьцуулалт” Олон улсын компьютерийн харааны сэтгүүл, № 22, х. 481-494, 2011.
  • Ю.-К. Ван, "Виола-Жонсын нүүр илрүүлэх алгоритмын шинжилгээ," IPOL сэтгүүл, 2013 он.
  • L. Shapiro болон D. Stockman, Computer Vision, Binom. Мэдлэгийн лаборатори, 2006 он.
  • З.Н.Г., Таних аргууд ба тэдгээрийн хэрэглээ, Зөвлөлтийн радио, 1972 он.
  • Ж.Ту, Р.Гонзалес, Загвар таних математикийн зарчим, Москва: “Мир” Москва, 1974.
  • Хан, Х.Абдулла ба М.Шамиан Бин Зайнал, “Viola jones болон арьсны өнгөний пиксел илрүүлэх хослолыг ашиглан нүд, ам илрүүлэх үр дүнтэй алгоритм,” International Journal of Engineering and Applied Sciences, No. Vol. 3 No 4, 2013 он.
  • V. Gaede, O. Gunther, "Multimensional Access Methods," ACM Computing Surveys, pp. 170-231, 1998 он.

Тэмдэглэл: Бид зан үйл, ойлголтын даалгавар, өөрөөр хэлбэл тархи үүсч хөгжсөн ажлуудаас эхлээд сэтгэлгээний үзэгдлийн талаар ойлголттой болохыг хүсч байна. Өмнөх лекцүүд дээр бид зан үйлийн тухай ярьж байсан. Одоо ойлголтын даалгавар нь сэтгэхүйн үзэгдлийг ойлгоход юу өгч байгааг харцгаая. Гараар бичсэн тэмдэгтүүдийг автоматаар унших асуудлыг шийдэх жишээн дээр харуулсан "ухаалаг" ойлголтын зарим зарчмуудыг бид авч үзэх болно. Практик чиг баримжаа нь ихэвчлэн тохиолддог шиг ойлголтын асуудлыг хялбарчлах, сулруулахад хүргэдэггүй байв. Үүний эсрэгээр, ажиллах боломжтой шийдлийг олж авахын тулд "ойлголтоор" хүлээн зөвшөөрөхөд чиглэсэн "ухаалаг" бүрэлдэхүүн хэсгүүдийг нэвтрүүлэх шаардлагатай байв.

Загвар таних

Кибернетикийн хөгжлийн эхэн үеэс эхлэн оюун ухааныг судлах, загварчлах, ялангуяа хүрээлэн буй орчны талаархи ерөнхий мэдлэгийн тогтолцоог бий болгох, энэ мэдлэгийг ашиглах гэх мэт сэтгэлгээний тодорхой бүрэлдэхүүн хэсгүүдийг судлах, загварчлахад зориулж зургийн машин ойлголтыг ихэвчлэн сонгосон. үйл явц шийдвэр гаргах. Харааны мэдээллийг хүлээн авах нь загварчлахад хамгийн тохиромжтой, үүнтэй зэрэгцэн практикт хамгийн чухал зүйл мэт санагдаж байв.

Энэ нь тэр даруй тодорхой болсон бүрэн шийдэлМашины харааны мэдрэхүйн даалгаврууд нь "ухаалаг" таних, эсвэл "ойлголттой" хүлээн зөвшөөрөхийг шаарддаг. Ихэнхдээ тэд өөрсдийнхөө хооронд ижил төстэй шинж тэмдэг тавьж, сэтгэхүйг ойлголт болгон багасгахыг оролддог. Сэтгэхүй, ойлголт хоёр салшгүй холбоотой боловч нэг зүйлээс хол байдгийг бид хожим харах болно. Тиймээс амьд ойлголтын судалгаа (үндсэндээ харааны) нь сэтгэн бодох үйл явцыг ойлгоход тустай боловч асуудал бүхэлдээ асуудлыг шийдэхээс хол байна. Үүний зэрэгцээ харааны мэдээллийн автомат дүн шинжилгээ хийх ажлын практик чиг баримжаа, техникийн боломжийн хүсэл эрмэлзэл нь асуудлыг ноцтой өөрчлөхөд хүргэсэн. Тус тусад нь авч үзсэн энгийн объектуудын шинж чанарын дагуу ангилах замаар ойлголтын үйл явцыг авч үзэхийг хялбарчлахаас өөр аргагүй болсон юм. Энэ чиглэл нь "гэж нэрлэгдэх болсон. Загвар таних".

Загвар танихчиглэл рүү" Хиймэл оюун"(AI) ихэвчлэн оруулаагүй, учир нь хиймэл оюун ухааны асуудлаас ялгаатай нь дүрсийг танихад сайн хөгжсөн математикийн аппарат гарч ирсэн бөгөөд тийм ч төвөгтэй биш объектуудын хувьд практик ажиллаж байгаа таних (ангилах) системийг бий болгох боломжтой болсон. Үүний үр дүнд уламжлалт хэв маягийг таних, нэг талаас, нарийн төвөгтэй зургуудын машин шинжилгээний асуудлыг шийдэж чадахгүй, нөгөө талаас, оюун ухааныг загварчлах ноцтой хэрэгсэл биш юм. Үүнтэй холбоотой асуудлыг илүү нарийвчлан авч үзье.

Аливаа танихын тулд хүлээн зөвшөөрөгдсөн объектын ангиллын стандарт эсвэл загвар шаардлагатай. Хүлээн зөвшөөрөх аргуудыг ашигласан стандартын төрлөөр, эсвэл хүлээн зөвшөөрөх системийн оролтын хэсэгт объектыг дүрслэх аргын дагуу бараг ижил байдлаар ангилах боломжтой. Ихэнх зураг таних систем нь растер, функц эсвэл бүтцийн аргыг ашигладаг.

Растер арга нь зураг эсвэл зарим төрлийн зургийн бэлтгэлийн стандартад нийцдэг. Таних явцад цэгийн растер хэлбэрээр үзүүлсэн оролтын зургийг бүх лавлагаатай харьцуулж, стандартуудын аль нь илүү сайн тохирч байгааг, жишээлбэл, илүү нийтлэг цэгүүдийг тодорхойлдог. Оролтын болон лавлагааны зураг нь ижил хэмжээ, чиглэлтэй байх ёстой. Жишээлбэл, олон фонт-OCR (олон фонт хэвлэсэн текст танигч) гэж нэрлэгддэг программд зөвхөн өөр өөр фонтууд төдийгүй ижил үсгийн фонт доторх өөр өөр тэмдэгтийн хэмжээ (цэг)-ийн өөр өөр стандартыг бий болгосноор үүнийг хийдэг. Хэлбэр, хэмжээ, чиг баримжаа нь хэт их өөрчлөгддөг тул гараар бичсэн тэмдэгтүүдийг ийм байдлаар таних боломжгүй юм.

Энэ нь бас боломжтой ашиглах тохиолдолоролтын дүрсийг стандарт хэмжээ, чиг баримжаа болгон бууруулж растер таних. Энэ тохиолдолд хүлээн зөвшөөрөгдсөн анги бүрийг кластер болгон, кластер бүрт тусдаа растер стандарт үүсгэсний дараа растер аргыг ашиглан гараар бичсэн тэмдэгтүүдийг таних боломжтой болно.

Ерөнхийдөө растераар хүлээн зөвшөөрөгдсөн объектын хэмжээ, хэлбэр, чиглэлийн хувьд өөрчлөгддөггүй байдлыг олж авах нь нарийн төвөгтэй бөгөөд ихэвчлэн шийдэгддэггүй асуудал юм. Өөр нэг асуудал нь тусдаа объекттой холбоотой зурагнаас фрагментийг тусгаарлах хэрэгцээ шаардлагаас үүсдэг. Энэ асуудал хүн бүрт нийтлэг байдаг сонгодог аргуудхэв маягийг таних.

Таних системүүдийн дийлэнх нь, ялангуяа одоо байгаа omnifont оптик унших системд гол арга нь онцлог шинж чанар юм. Онцлогт суурилсан хандлагад зураг дээр тодорхойлсон шинж чанаруудыг ашиглан стандартуудыг бий болгодог. Таних системийн оролт дээрх дүрсийг шинж чанарын вектороор илэрхийлнэ. Аливаа зүйлийг шинж тэмдэг гэж үзэж болно - танигдах объектын аливаа шинж чанар. Онцлогууд нь объектын чиглэл, хэмжээ, хэлбэрийн өөрчлөлтөөс хамааралгүй байх ёстой. Нэг ангийн өөр өөр объектод хамаарах онцлог векторууд нь шинж чанарын орон зайн гүдгэр авсаархан мужид хамаарах нь зүйтэй. Онцлог орон зайбүх хүлээн зөвшөөрөгдсөн объектын хувьд тогтмол бөгөөд ижил байх ёстой. Онцлогуудын цагаан толгойг систем хөгжүүлэгч зохион бүтээсэн. Таних чанар нь онцлог шинж чанаруудын цагаан толгойг хэр сайн зохион бүтээсэнээс ихээхэн хамаардаг. Оновчтой цагаан толгойн үсгийг автоматаар бүтээх ерөнхий арга байхгүй.

Хүлээн зөвшөөрөх нь зураг дээр сонгогдсон аливаа танигдах объектын шинж чанаруудын бүрэн векторыг априори олж авах, зөвхөн дараа нь энэ вектор нь аль стандартад нийцэж байгааг тодорхойлох явдал юм. Стандартуудыг ихэвчлэн статистик эсвэл геометрийн объект хэлбэрээр бүтээдэг. Эхний тохиолдолд сургалт нь жишээлбэл, объектын ангилал тус бүрийн шинж чанар тус бүрийн давтамжийн матрицыг олж авах, таних нь стандарт тус бүрт хамаарах шинж чанарын векторын магадлалыг тодорхойлохоос бүрдэж болно.

Геометрийн аргын хувьд сургалтын үр дүн нь ихэвчлэн хүлээн зөвшөөрөгдсөн объектын өөр өөр ангилалд тохирох орон зайг хуваах явдал бөгөөд таних нь хүлээн зөвшөөрөгдсөн объектод тохирох оролтын шинж чанарын вектор эдгээр хэсгүүдийн алинд нь хамаарахыг тодорхойлохоос бүрддэг. Хэрэв талбайнууд огтлолцох, түүнчлэн хүлээн зөвшөөрөгдсөн ангиудад харгалзах хэсгүүд нь гүдгэр биш бөгөөд танигдсан анги нь бусад ангиллуудаас тусгаарлагдахгүй байхаар шинж чанарын орон зайд байрладаг бол аль ч хэсэгт оролтын функцийн векторыг хуваарилахад хүндрэл гарч болзошгүй. нэг гипер хавтгайгаар. Эдгээр асуудлуудыг ихэвчлэн эвристик аргаар, жишээлбэл, шинжилж буй объектоос янз бүрийн ангиудад тохирох сургалтын түүврийн дэд хэсгүүдийн хүндийн төвүүд хүртэлх зайг (заавал Евклидийн байх албагүй) тооцоолж, харьцуулах замаар шийддэг. Илүү радикал арга хэмжээ авах боломжтой, жишээлбэл, онцлог шинж чанаруудын цагаан толгойг өөрчлөх, сургалтын багцыг нэгтгэх эсвэл хоёуланг нь нэгэн зэрэг хийх боломжтой.

Бүтцийн хандлага нь объектын бүтцийн хэсгүүд, тэдгээрийн хоорондын орон зайн харилцааны хувьд баригдсан стандарт тодорхойлолттой нийцдэг. Бүтцийн элементүүдийг дүрмээр бол объектын контур эсвэл "араг яс" дээр тодруулдаг. Ихэнх тохиолдолд бүтцийн тодорхойлолтыг бүтцийн элементүүд болон тэдгээрийн хоорондын хамаарлыг агуулсан графикаар дүрсэлж болно. Таних явцад оролтын объектын бүтцийн тодорхойлолтыг бүтээдэг. Энэ тайлбарыг бүх бүтцийн стандарттай харьцуулж үздэг, жишээлбэл, график изоморфизм олддог.

Растер ба бүтцийн аргуудыг заримдаа онцлог шинж чанар болгон бууруулж, эхний тохиолдолд зургийн цэгүүдийг шинж чанар, хоёрдугаарт бүтцийн элементүүд ба тэдгээрийн хоорондын харилцааг харгалзан үздэг. Эдгээр аргуудын хооронд маш чухал үндсэн ялгаа байгааг нэн даруй тэмдэглэе. Растер арга нь бүрэн бүтэн байдлын шинж чанартай байдаг. Бүтцийн аргабүрэн бүтэн байдлын өмчтэй байж болно. Аттрибутын арга нь бүрэн бүтэн байдлын шинж чанартай байдаггүй.

Шударга байдал гэж юу вэ, энэ нь ойлголтод ямар үүрэг гүйцэтгэдэг вэ?

Сонгодог хэв маягийг танихҮзэл баримтлалын дээд түвшнээс ойлголтын хяналт байхгүй үед ихэвчлэн "доороос дээш" (дүрслэлээс ойлголт хүртэл) дараалсан үйл явц хэлбэрээр зохион байгуулагддаг. Таних үе шат нь оролтын зургийн априори тайлбарыг олж авах үе шат юм. Энэ тайлбарын элементүүдийг сонгох үйлдлүүд, жишээлбэл, онцлог, эсвэл бүтцийн элементүүд, зураг дээр орон нутгийн байдлаар хийгддэг, зургийн хэсгүүд нь бие даасан тайлбарыг хүлээн авдаг, өөрөөр хэлбэл нэгдмэл ойлголт байдаггүй бөгөөд энэ нь ерөнхийдөө алдаа гаргахад хүргэдэг - тусад нь авч үзсэн зургийн фрагментийг ихэвчлэн өөр өөр байдлаар тайлбарлаж болно. ойлголтын таамаглал, өөрөөр хэлбэл ямар төрлийн нэгдмэл объект харагдах ёстой.

Хоёрдугаарт, уламжлалт хандлага нь тус тусдаа авч үзсэн объектуудыг таних (ангилах) дээр төвлөрсөн байдаг. Таних үе шат нь өөрөө хүлээн зөвшөөрөгдсөн бие даасан объектуудын зурагтай тохирох хэсгүүдэд дүрсийг сегментлэх (хуваах) үе шатаас өмнө байх ёстой. Априори сегментчиллийн аргууд нь ихэвчлэн оролтын зургийн тодорхой шинж чанарыг ашигладаг. Ерөнхий шийдэлУрьдчилан ангилах ажил байхгүй. Хамгийн энгийн тохиолдлоос бусад тохиолдолд тусгаарлах шалгуурыг тухайн зургийн орон нутгийн шинж чанараар, өөрөөр хэлбэл түүнийг танихаас өмнө томъёолж болохгүй.

Жижиг үсгээр, тэр ч байтугай гараар бичсэн текст нь хамгийн хэцүү тохиолдол биш боловч ийм зургуудын хувьд ч гэсэн үгэн дэх мөр, үг, бие даасан тэмдэгтүүдийг тодруулах нь ноцтой асуудал байж болно. Энэ асуудлыг шийдэх практик шийдэл нь гол төлөв сегментчлэлийн сонголтуудыг эргэцүүлэн бодоход тулгуурладаг бөгөөд энэ нь нэгдмэл, зорилгод чиглэсэн харааны ойлголтын үед хүн эсвэл амьтны тархи хийдэг зүйлээс огт өөр юм. "Бид сонсож, хардаггүй, харин сонсож, хардаг" гэж Сеченов хэлснийг санацгаая. Ийм идэвхтэй ойлголт нь бие даасан хэсгээс эхлээд бүрэн үзэгдэл хүртэлх бүх түвшний объектуудын цогц дүрслэлийг шаарддаг бөгөөд хэсгүүдийг зөвхөн бүхэл бүтэн хэсэг болгон тайлбарлахыг шаарддаг.

Тиймээс ихэнх уламжлалт аргуудын сул тал, юуны түрүүнд шинж чанарын аргын сул тал нь ойлголтын бүрэн бүтэн байдал, анхаарал төвлөрөл дутагдал, үйл явцыг "доороос дээш", эсвэл дүр төрхөөс "ойлголт" хүртэлх нэг чиглэлтэй зохион байгуулалтад хүргэдэг.

Бараг ид шидийн манангаар бүрхэгдсэн хиймэл эсвэл албан ёсны мэдрэлийн сүлжээг (RNN) ашиглан таних боломжтой. Заримдаа тэдгээрийг тархины зарим төрлийн аналог гэж үздэг. IN Сүүлийн үедТекстүүдэд тэд зүгээр л "мэдрэлийн сүлжээ" гэж бичдэг бөгөөд "хиймэл" эсвэл "албан ёсны" гэсэн нэр томъёог орхигдуулдаг. Үнэн хэрэгтээ RNN нь ихэвчлэн функцийн орон зайд тусгаарлах гиперплангуудыг бий болгодог онцлог ангилагч юм.

Эдгээр сүлжээнд ашиглагддаг албан ёсны нейрон нь шинж чанарын утгын бүтээгдэхүүний нийлбэрийг зарим коэффициентээр тооцдог босго элемент бүхий нэмэгч бөгөөд энэ нь функцийн орон зайд тусгаарлах гиперплангийн тэгшитгэлийн коэффициентээс өөр зүйл биш юм. Хэрэв нийлбэр нь босго хэмжээнээс бага бол шинж чанарын вектор нь хуваах хавтгайн нэг талд, хэрэв илүү бол нөгөө талд байна. Тэгээд л болоо. Тусгаарлах гиперплатыг бүтээх, шинж чанарт үндэслэн ангилахаас гадна гайхамшиг гэж байдаггүй.

Албан ёсны нейронд 1-ээс 1 хүртэлх босго үсрэлтийн оронд гөлгөр (ялгарах боломжтой), ихэвчлэн сигма хэлбэрийн шилжилтийг нэвтрүүлэх нь юуг ч үндсэндээ өөрчлөхгүй бөгөөд зөвхөн сүлжээг сургах градиент алгоритмыг ашиглах боломжийг олгодог. , өөрөөр хэлбэл, хуваах хавтгайн тэгшитгэл дэх коэффициентийг олох, хуваах хавтгайн хилийг "түрхэх", оноог тогтоох, жишээлбэл, таних үр дүнд, өөрөөр хэлбэл хилийн ойролцоох албан ёсны нейроны ажилд. 0-ээс 1 хүртэлх муж. Энэ оноо нь тодорхой хэмжээгээрОролтын векторыг функцийн орон зайн нэг эсвэл өөр хэсэгт хуваарилах системийн "итгэл"-ийг тусгаж болно. Үүний зэрэгцээ, энэ тооцоо нь хатуугаар хэлбэл, магадлал ч биш, тусгаарлах хавтгай хүртэлх зай ч биш юм.

Албан ёсны нейронуудын сүлжээ нь шугаман бус хуваах гадаргууг хавтгайд ойртуулж, үр дүнд тулгуурлан функцийн орон зайн холбоогүй хэсгүүдийг нэгтгэж чаддаг. Энэ нь олон давхаргат сүлжээнд хийгддэг зүйл юм.

Бүх тохиолдолд шинж чанарыг таних албан ёсны мэдрэлийн сүлжээ (PRNN) нь тусгаарлах гипер хавтгайг бүтээж, шинж чанаруудын (шинж чанар) тогтсон орон зайд хэсгүүдийг сонгох онцлог ангилагч юм. PRNS нь өөр ямар ч асуудлыг шийдэж чадахгүй бөгөөд PRNS нь таних асуудлыг аналитик аргыг ашиглан ердийн онцлог танигчаас илүү сайн шийддэг.

Нэмж дурдахад, онцлог танигчаас гадна растер, түүний дотор чуулга, танигчийг албан ёсны мэдрэлийн эсүүд дээр барьж болно. Энэ тохиолдолд растер хүлээн авагчийн тэмдэглэсэн бүх сул талууд хадгалагдана. Үнэн, зарим давуу талууд байж магадгүй бөгөөд бид дараа нь ярих болно.

Үл ойлголцол гарахаас зайлсхийхийн тулд зарчмын хувьд хувьсагчийн орон зайд хуваах хавтгай болон албан мэдрэлийн эсүүд дээр хялбар хэрэгждэг БА, ЭСВЭЛ, БИШ логик функцуудыг ашиглан албан ёсны нейрон дээр бүх нийтийн компьютер бүтээх боломжтой гэдгийг тэмдэглэх нь зүйтэй. Гэхдээ хэн ч ийм компьютер барихгүй байгаа бөгөөд энэ асуудалтай холбоотой хэлэлцүүлэг хэлэлцэж буй асуудлын хүрээнээс хэтэрч байна. Нейрокомпьютерийг ихэвчлэн мэдрэлийн танигч эсвэл тусгай систем гэж нэрлэдэг асуудал шийдэх, эдгээр нь хэв маягийг танихад ойрхон бөгөөд онцлог орон зайд гипер хавтгайг тусгаарлах эсвэл растерыг стандарттай харьцуулах үндсэн дээр бодитоор таних аргыг ашигладаг.

Сэтгэлгээг загварчлахад амьд тархины мэдрэлийн механизм хэрхэн ажилладагийг ойлгох нь маш чухал бөгөөд магадгүй зайлшгүй шаардлагатай гэдгийг дээр дурдсан. Үүнтэй холбогдуулан асуулт гарч ирнэ: мэдрэлийн сүлжээг албан ёсоор таних нь тархины мэдрэлийн механизмыг загварчлах асуудлыг шийдэх шийдэл биш юм бол энэ чиглэлд хийх чухал алхам биш гэж үү? Харамсалтай нь хариулт нь үгүй ​​байх ёстой. Идэвхтэй амьд мэдрэлийн сүлжээнээс ялгаатай нь RIS нь уламжлалт ангилагчийн бүх сул талуудтай идэвхгүй функц эсвэл растер ангилагч юм. Энэ дүгнэлтийг үндэслэсэн аргументуудыг бид дараа нь илүү нарийвчлан авч үзэх болно.

Тиймээс, объектуудыг тусад нь авч үзэх, таних, ангилах үйл явцыг дэс дараалсан зохион байгуулалтад суурилсан уламжлалт, үндсэндээ онцлог шинж чанарт суурилсан таних системүүд нь харааны нарийн төвөгтэй мэдээллийг хүлээн авах асуудлыг үр дүнтэй шийдэж чадахгүй байгаа нь гол төлөв харааны бүрэн бүтэн байдал, зорилгогүй байдлаас үүдэлтэй юм. хүлээн зөвшөөрөгдсөн объектын талаархи ойлголт, бүрэн бүтэн байдал (стандарт) дутмаг, хүлээн зөвшөөрөх үйл явцын дараалсан зохион байгуулалт. Үүнтэй ижил шалтгаанаар ийм хэв маягийг таних системүүд нь амьд харааны ойлголт, сэтгэн бодох үйл явцын талаар бага ойлголт өгдөг.