ArvutidInfotehnoloogia

Kaasaegne arvuti nägemine. Ülesanded ja arvuti nägemine tehnoloogia. Programmeerimine Computer Vision Python

Kuidas õpetada arvuti aru saada, mida on kujutatud pildil või pilte? See tundub lihtne, kuid arvuti see on lihtsalt koosnev maatriks ühtede ja nullide kust soovite eraldada olulist teavet.

Mis on arvuti nägemine? See on võime "näha" arvuti

Vision - on oluline teabeallikas kasutav isik, siis me saada, et eri hinnangute kohaselt, 70-90% kogu teabe saamist. Ja muidugi, kui me tahame luua smart auto, peame rakendama samu oskusi ja arvuti.

Probleem arvuti nägemine võib väita üsna selgelt. Mis on "näha"? On arusaadav, et kus on lihtsalt vaadates. See lõpetas erinevusi arvuti nägemine ja inimese nägemine. Vision meile - see on allikas teadmisi maailma, samuti allikas mõõdik teave - see tähendab, võime mõista vahemaid ja suurused.

Semantiline tuuma pilt

Vaadates pilti, saame kirjeldada mitmed atribuudid, niiöelda, et eraldada semantilise informatsiooni.

Näiteks vaadates seda pilti, saame öelda, et see on väljas. Mis on linnaliikluses. See on autod. saame arvan, et see on Kagu-Aasia konfiguratsioonist hoone ja hieroglüüfid. Portree Mao Zedong aru, et see on Peking, ja kui keegi nägi live video või ise oli seal olnud, oleks vist, et see on kuulus Tiananmeni väljak.

Mida me saame öelda lähemalt pilt, nähes seda? Me ei saa tuvastada objekte pilt, st et on olemas inimesi siin lähemale - tara. Siin vihmavarjud, et hoone plakatid. Need on näited klassid on väga oluline objektid, mis on tegelenud otsing hetkel.

Ikka saame õppida mõned funktsioonid või atribuutide objektid. Näiteks, siin saame kindlaks teha, et see ei ole portree tavaline Hiina, nimelt Mao Zedong.

Vastavalt sõiduki saab määrata, et see on liikuv objekt, ja see on raske, et ei ole deformeerunud liikumise ajal. Umbes lipud võib öelda, et tal on vastuväiteid, need on ka liikuvad, kuid nad ei ole raske, pidevalt deformeerunud. Ja stseen on tuul, mis võib määrata arendada lipud, ja võib isegi määrata tuule suunda, näiteks see puhub vasakult paremale.

Vahemaad ja pikkusega arvuti nägemine

Väga oluline on mõõdik informatsioon arvuti nägemine teadust. See on igasuguseid vahemaid. Näiteks ROVER on eriti oluline, sest meeskonnad on Maalt umbes 20 minutit ja vastata nii palju. Seega link sinna ja tagasi - 40 minutit. Ja kui me teeme kava liikumise käske Maa, peate võtma seda arvesse.

Edukalt integreeritud tehnoloogia arvuti nägemine videomängud. Vastavalt video, saate luua kolmemõõtmelisi mudeleid objektide, inimesed ja fotosid saab kasutaja taastada kolmemõõtmeline mudelite linnades. Ja siis kõndida neid.

arvuti nägemine - üsna laias vahemikus. See on tihedalt seotud mitmete teiste teaduste. Osa arvuti nägemine Ta lööb pilditöötluse ala ja mõnikord eraldab arvuti nägemine, ajalooliselt.

Analüüs, muster tunnustamine - tee loomine kõrge intelligentsus

Uurigem neid mõisteid eraldi.

Pilditöötlus - see on valdkond, algoritme, kus sisend ja väljund - pilt ja me peame teda midagi tegema.

kujutise analüüs - on ala arvuti nägemine, mis keskendub koostööd kahemõõtmeline pilt ja teha sellest järeldusi.

Muster tunnustamine - abstraktne matemaatiline distsipliini, mis tunnistab andmeid vektorite kujul. See tähendab, et sissepääsu juures - vektori ja meil on midagi pistmist. Kui vektor on, ei ole me nii oluline teada.

Arvuti nägemine - see algselt oli taastada struktuuri kahemõõtmeline pilte. Täna see on laienenud ja seda võib tõlgendada kui nõusolekut kõik füüsilised objektid tegemise, mis põhineb pilt. See tähendab, see on ülesanne tehisintellekti.

Paralleelselt arvuti nägemine täiesti erinevas valdkonnas, geodeesia, fotogramm on arenenud - mõõdab vahemaa esemeid kahemõõtmeline pilte.

Robotid "näeb"

Ja lõpuks - see on masina nägemine. Vastavalt masina nägemine tähendab nägemus robotid. See on otsus, mõned tootmise probleeme. Me ei saa öelda, et arvuti nägemine - on üks suur teadus. See ühendab mõned teised teaduse osa. Ja kui arvuti nägemine muutub iga konkreetse taotluse, muutub see masin nägemus.

Arvuti visioon piirkonna mass on praktiliste rakenduste. See on seotud automaatika tootmine. Kell ettevõtete muutunud efektiivsemaks asendada käsitsitöö masinaga. Masin ei väsi, ei maga, ta oli ebaregulaarne töögraafik, ta on nõus töötama 365 päeva aastas. Niisiis, kasutades masin töö, saame tagatud tulemus teatud ajal, ja see on üsna huvitav. Kõik ülesanded on selge kasutamiseks arvuti nägemine süsteemid. Ja seal on midagi paremat kui näha tulemusi kohe pildil ainult arvutamise etapis.

Lävel maailma tehisintellekti

Plus ala - see on raske! Märkimisväärne osa aju vastutab nägemine, ja usutakse, et kui sa õpetada arvuti "näha", mis on täielikult kasutada arvuti nägemine, see on üks eesmärke täielikult tehisintellekti. Kui saame probleemi lahendada inimese tasandil, tõenäoliselt samal ajal, me lahendame probleemi AI. See on väga hea! Või ei ole väga hea, kui te vaatate, "Terminator 2".

Miks on nägemus - see on raske? Kuna pilti samast objektist võib suuresti varieeruda, sõltuvalt välistest teguritest. Sõltuvalt objekti vaatluspunktide teistmoodi.

Näiteks üks ja sama näitaja, mis on võetud erinevate nurkade alt. Ja mis on kõige huvitavam joonisel võib olla üks silm, kaks silma ja pool. Ja sõltuvalt kontekstist (kui see pilt mees särgi maalitud silmad), silma võib olla rohkem kui kaks.

Arvuti ikka ei saa aru, kuid see "näeb"

Teine tegur, mis raskendab - see on valgustus. Sama stseeni erinevate valgustus teistmoodi. objekti suurus võib varieeruda. Lisaks mistahes esemeid klassi. Kuidas sa võid öelda mees, et tema kõrgus 2 m? Mitte midagi. Inimese kasvu ja võib olla 2,3 m ja 80 cm. Nagu teistegi tüüpi objektide on aga objektid samasse klassi.

Eriti elava objekti läbivad erinevaid tüvesid. Juuste inimesed, sportlased, loomad. Vaata pilte hobuseid jookseb kindlaks, mis toimub nende lakk ja saba on lihtsalt võimatu. Kattuva objektid pilt? Kui te pista arvuti pilti, isegi kõige võimsam masin leida raske anda õige otsuse.

Järgmine vaade - see on maskeering. Mõned objektid, loomade maskeeritud keskkonnale, ja üsna osavalt. Ja sama laigud ja värvaineid. Siiski näeme neid, kuigi mitte alati kaugelt.

Teine probleem - liikumine. Objektid liikumise mõeldamatu deformeeru.

Paljud objektid on väga erinevad. Siin näiteks kaks pildid allpool objektid "tool".

Ja see saab istuda. Aga õpetada masin, nii et erinevaid asju kuju, värvi, materjali, kõik on objekt "tool" - on väga raske. See on väljakutse. Integreerida meetodeid arvuti nägemine - on õpetada masin mõista, analüüsida, spekuleerida.

Integratsiooni arvuti nägemine eri platvormide

Mass arvuti nägemine hakkas tungivad aastal 2001, mil ta lõi esimese näo detektor. Tegime seda kaks autorit: Viola, Jones. See oli esimene kiire ja usaldusväärne piisavalt algoritmi, mis näitas võimu masin õppimise meetodeid.

Nüüd arvuti nägemine on piisavalt uusi praktilisi rakendusi - tunnustatakse inimese nägu.

Aga tunnustada mees nagu filmid - juhuslikult nurgad, erinevate valgustuse - see on võimatu. Aga probleemi lahendada, või mis on erinevatele inimestele erineva valgustuse või erinevas poosis, mis on sarnane nagu foto passi, on võimalik koos suure kindlusega.

passipilti nõuded suuresti tingitud näojooned tunnustamine algoritme.

Näiteks, kui teil on biomeetrilise passi, mõnes tänapäevases lennujaamades, mida saab kasutada automaatset passikontrolli süsteemi.

Lahendamata probleem arvuti nägemine - võime ära tunda teksti

Äkki keegi kasutada OCR süsteemi. Üks neist - Fine Reader, on väga populaarne RuNet süsteemi. Seal on palju vorme, kus te täidate andmed, need on täiesti skaneeritud teave on tunnustatud süsteemi väga hästi. Kuid mis tahes teksti pildil on olukord palju hullem. See probleem on endiselt lahendamata.

Mängud hõlmab arvuti nägemine, ülesvõte

Eraldi suur ala - on luua kolmemõõtmelisi mudeleid ja ülesvõte (mis on üsna edukalt rakendatud arvutimängud). Esimene programm, mis kasutab arvuti nägemine - süsteem suhtlemist arvuti liigutuste abil. Kui see loodi see oli palju asju lahti.

Algoritm on mõeldud lihtsalt, kuid seadistada kulus luua generaator sünteetiliste inimeste pilte saada miljonit pilte. Super nendega valida parameetrid algoritmi, mille eest ta nüüd töötab hästi.

See on miljoni pilte ja nädalas loendatav superarvuti ajal võimalik luua algoritmi, mis tarbib 12% võimsuse ühe protsessori ja võimaldab isikul tajuvad positsiooni reaalajas. See Microsoft Kinect süsteemi (2010).

Otsi pilte sisu võimaldab laadida fotosid süsteemi ja tulemusi see annab kõik pildid, millel on sama sisu ja valmistatud sama nurga.

Näited arvuti nägemine: kolmemõõtmeline ja kahemõõtmeline kaardid nüüd tehakse seda. Kaardid navigeerimiseks autod on regulaarselt ajakohastatud vastavalt DVR.

On andmebaasi miljardeid geosiltidega fotosid. Laadides pildi andmebaasis, saate määrata, kus see tehti, ja isegi mõned perspektiivi. Muidugi eeldusel, et koht on populaarne piisavalt, et korraga turiste ja tegi mitmeid fotosid ala on seal olnud.

robotid on kõikjal

Robootika praegusel ajal, igal pool, ilma seda kuidagi. Nüüd on sõidukeid, mis on eriline kaamerad, mis tunnustavad jalakäijatele ja liiklusmärgid edastada käske juht (seda viisil arvutiprogrammi vaadata, aitab autojuht). Ja seal on täielikult automatiseeritud robotite sõidukid, kuid nad ei saa tugineda üksnes kaameraga süsteemi ei kasutata palju lisateavet.

Modern kaamera - see on analoog camera obscura

Räägime digitaalse pildi. Modern digikaamerad on paigutatud põhimõtte camera obscura. Ainult asemel auk, mille kaudu valgus siseneb kiire ja projitseeritud tagasi kambri seinas teema circuit, meil on eriline optiline süsteem, mida nimetatakse objektiivi. Selle eesmärgiks on koguda suur valgusvihk ja teisendada nii, et kõik kiired läbi virtuaalse punkti saamiseks projektsioon ning kujutis filmile või maatriks.

Modern digikaamerad (maatriks) koosneb üksikute elementide - pikslit. Iga piksel saab mõõta energiat valguse, mis on langeva piksli kokku ja anda üks väljund number. Seetõttu digikaamera, saame asemel pildi heledus valguse mõõtmisi, püütud ühe piksli - arvuti vaatevälja. Seega, kui pilt näeme ei voolujooneline ja selgete kontuuridega ja ruudustik värvilised ruudud erinevates värvides - pikslit.

Allpool näete esimese digitaalse pildi maailmas.

Aga see pilt ei ole? Värv. Mis on värv?

Psühholoogiline värvitaju

Värv - see on see, mida me näeme. Värv üks ja sama asi inimestele ja kassid on erinevad. Kuna me (inimesed) ja loomade optilise süsteemi - visioon on erinev. Seetõttu värvi - see on psühholoogiline kvaliteet meie visioon, mis toimub järgides objektid ja valgust. Ja mitte füüsilisi vara objekti ja valgust. Värv - on tingitud koosmõju valguse komponendid ja stseen meie visuaalse süsteemi.

Programmeerimine Computer Vision Python kasutades raamatukogud

Kui olete otsustanud alustada tõsiselt uuring arvuti nägemine, peaks kohe valmistuda mitmeid raskusi, see teadus ei ole kõige lihtsam ja peidab mitmeid lõkse. Aga "Programmeerimine Computer Vision Pythoni" autorsuse Jan Erik SOLEMA - raamat, mis kirjeldab kõik kõige lihtsas keeles. Siin tutvuda meetodeid tunnustamine erinevate objektide 3D, õppida koostööd stereo pilt, virtuaalne reaalsus ja paljud teised rakendused arvuti nägemine. Raamatus on piisavalt näiteid Python. Aga selgitused esitatakse niiöelda, üldistatud, et mitte koormata liiga palju teadus- ja kindlaid andmeid. Töö sobib üliõpilastele, amatöörid ja harrastajatele. Lae see raamat ja teised umbes arvuti nägemine (pdf-formaadis) saab võrgus.

Praegu on avatud lähtekoodiga raamatukogu arvuti nägemine algoritme ja pilditöötluse ja numbriliste algoritmide OpenCV. On rakendatud moodsaim programmeerimiskeeli, on avatud lähtekoodiga. Kui me räägime arvuti nägemine, Python kasutab programmeerimiskeelt, see on ka toetuse raamatukogu, lisaks on pidevalt ja on suur kogukond.

Ettevõte "Microsoft" pakub oma teenuseid Api-võimeline koolitama Närvivõrgus töötada seda pilti inimesi. On ka võimalus taotleda arvuti nägemine, Python kasutab programmeerimiskeelt.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 et.delachieve.com. Theme powered by WordPress.