Bendras

Regėjimo sistemos įkvėptos žmogaus žvilgsnio

Regėjimo sistemos įkvėptos žmogaus žvilgsnio

Remiantis straipsniu, paskelbtu 2007 m. Vasario 21 d., „Technology Review“, MIT neurologų grupė sukūrė kompiuterio modelį, kuris imituoja žmogaus regėjimo sistemą, kad judrioje gatvėje būtų galima tiksliai aptikti ir atpažinti tokius objektus kaip automobiliai ir motociklai. Anot MIT neurologo Thomaso Serre'o, šių tipų matymo sistemos netrukus galėtų būti naudojamos stebėjimo sistemose arba išmaniuosiuose jutikliuose, įspėjančiuose vairuotojus apie pėsčiųjų ar kitų objektų buvimą.

Ilgus metus tyrėjai mėgino imituoti biologinio matymo sistemas dėl jų tobulumo. Tačiau išmokyti kompiuterį klasifikuoti objektus pasirodė sudėtingesnis, nei atrodė iš pradžių, sako Serre'as, dirbęs kartu su Tomaso Poggio. Pirma, norint atpažinti tam tikro tipo objektus, kompiuteriui reikia šablono arba konkretaus skaičiavimo to konkretaus objekto vaizdavimo, o tai kompiuteriui leidžia atskirti, pavyzdžiui, automobilį nuo objektų, kurie nėra automobiliai. Tačiau šablonas turi būti pakankamai lankstus, kad tilptų visų tipų automobiliai skirtingais kampais ir padėtimis bei skirtingomis apšvietimo sąlygomis.

Geriausias būdas to pasiekti yra išmokyti mokymosi algoritmo su vaizdų serijomis, kad būtų galima išgauti jų bendras savybes. Serre'as ir Poggio mano, kad žmogaus regėjimo sistema laikosi panašaus požiūrio, tačiau tai priklauso nuo regos žievės vienas nuo kito einančių sluoksnių hierarchijos. Taigi pirmieji plutos sluoksniai aptiktų paprasčiausias objekto savybes, o paskutiniai - sujungtų tą informaciją ir sudarytų mūsų suvokimą apie visą objektą.

Norėdami patikrinti savo teoriją, Serre ir Poggio dirbo su Stanley Bileschi iš MIT ir Lior Wolf iš Tel Avivo universiteto, Izraelis, kad sukurtų kompiuterio modelį su 10 milijonų skaičiavimo vienetų, skirtų elgtis kaip neuronų grupės. regos žievės. Kaip ir regimojoje žievėje, vienetai yra padalijami į sluoksnius.

Pirmiausia, paprasčiausi vienetai iš scenos ištraukia pradines savybes (pavyzdžiui, orientuotus profilius), analizuodami labai mažas pikselių grupes. Tada sudėtingesni vienetai analizuoja didesnes vaizdo dalis ir atpažįsta charakteristikas, susijusias su objektų dydžiu ar padėtimi. Su kiekvienu iš eilės sluoksniu išgaunamos vis sudėtingesnės savybės, tokios kaip atstumas tarp dviejų objekto dalių arba skirtingi šių dalių orientacijos kampai. Tai leidžia atpažinti tą patį objektą iš skirtingų kampų.

Kai jie išbandė sistemą, jų rezultatai buvo labai geri, nes jie galėjo konkuruoti su geriausiomis sistemomis rinkoje. Be to, dėl mokymosi galimybių kuo daugiau vaizdų analizuosite, tuo tikslesni bus jūsų rezultatai.
Šiuo metu sistema buvo sukurta tik statiniams vaizdams analizuoti. Tačiau, pasak Serre'o, procesas yra panašus į žmogaus regos sistemos procesą, kai viena sistemos dalis yra atsakinga už formas, o kita - už judėjimą. Komanda dabar siekia integruoti lygiagrečią sistemą, veikiančią su vaizdo įrašais.

Šaltinis: „Technology Review“

Vaizdo įrašas: apie astigmatizmo priežastis (Lapkritis 2020).