Komputeran, Teknolojîya agahî
Dîtiniyekê de dibe Modern. Peywir û teknolojiya dîtiniyekê de dibe. Programming Vision Computer di Python
How to hînî a komputerê fêm bikin ku di picture an pictures teswîrkirin? Ev sade xuya dike, lê ji bo ku dibe ev tenê matrix ku ji sifir û yên ku ji we dixwazim ji bo derxistin û agahiyên girîng e.
dîtiniyekê de dibe çi ye? Ev qabîlîyeta "bibînin" komputera we ye
Vision - çavkaniyeke girîng ji agahî ji bo kesê bikaranîna ew e, em bigihîjin, ku li gor texmînên cuda, ji 70 ji bo 90% ji hemû agahiyên. Û, bê guman, heke em dixwazin ku ji bo pêkanîna car smart, divê em ji bo pêkanîna jîrektî û dibe heman.
Pirsgirêka dîtiniyekê de dibe dikare pir eşkere diyar kir. Çi ye "dibînin?" Tê fêmkirin ku li wir ne tenê bi digerin heye. Ku cudatiyên ji dîtiniyekê de dibe û vîzyona mirovan de qedand. Vision ji bo me - ew a çavkaniya agahiyên li ser cîhanê, herwiha wekî çavkaniya agahî metric e - ku, kapasîteya fêm dûr û sizes.
image kernel semantîk
Nerînekê li picture, em dikarin ji aliyê hejmareke ji taybetmendiyên xwe rave bike, da ku bipeyive, ji bo derxistin û agahî semantic.
Ji bo nimûne, digerî li vê picture, em dikarin bêjin ku ew e li derve. trafîkê bajêr çi ye. Ku erebe li wir. em texmîn dikim ku wê ev Başûr-Rojhilatê Asyayê li ser avakirina avahiya û hieroglyphics e. Li portreya Mao Zedong fêm bikin ku ev Pekîn e, û eger mirovek dît, video live an jî bi xwe li wir derbas kirin, dê texmîn dikim ku ev navdar meydana Tiananmen e.
Çi em dikarin zêdetir li ser picture dibêjin, ev dît? Em dikarin objects in the image nasandin, ku bêjin, ku mirovên li vir in nêzîkî wê derê - fence. Here sîwan, posterên ku avahiya da. Ev ne wergerandî yên çînên tiştên pir girîng e, ku di search for niha dimeşandin e.
Dîsa jî em dikarin hin taybetiyan an, taybetmendiyên xwe yên objects hîn bibin. Ji bo nimûne, li vir em dikarin diyar kir ku ev e portreyeke Chinese asayî de, ango, Mao Zedong ne.
Li gor wesayîta dikare bê diyarkirin ku ev object Xerzan e, û zehmet e, ku di dema tevgera di temeke ne. About alên dikare bê gotin ku, ew li tiştên, ku ew bi her raperîn, lê ew ne giran, bi berdewamî di temeke. Û li cihê bûyerê ye, li ber bayê, ku dikare ji aliyê pêş de alên biryar hene, û dikare heta bi alî yê li ber bayê, ji bo nimûne, ku bayekî ji çepê ber bi rastê diyar bike.
The dûr û dirêjahî di dîtiniyekê de dibe
Pir girîng e ku agahiyên metric ser zanistî vîzyona komputerê ye. Ev her cûreyê dûr e. Ji bo nimûne, ji bo rover taybetî gelekî girîng e ji ber ku tîmên ji erdê li ser 20 minutes in û bersiva qasî. Li gorî vê, li ser grêdanka li wir û şûn - 40 deqeyan. Û eger em bikin planeke ji bo emrên tevgera erdê, divê hûn bi xwe ev nav account.
Bi serfirazî teknolojiya ji vîzyona dibe li games video yekpare. Li gor video, tu modelên sê-alî yên objects, gelê ava, û wêneyên li ser bikarhêner dikarin modelên sê-alî ya li bajarên vegerînim. Û piştre li ser wan digerin.
dîtiniyekê de dibe - cûrbecûr bêtir fireh. Ev ji nêzîk ve bi zanistên cuda din zal in. Part ji dîtiniyekê de dibe Ev bindest herêma image processing û carna dikevin dîtiniyekê de dibe, di dîrokê de.
Analysis, naskirina pattern - rêya creation ên îstîxbaratê Pêdeçûnê
Werin, em van têgehên cuda dinirxînin.
Processing Image - image, û em wî tiştekî - ev yek li herêma algorîtmayên, li ku deran û ketanên e.
analysis image - herêma dîtiniyekê de dibe, ya ku li ser kar bi wêneyê de du-alî û encamên ji vê disekine.
Qedirgirtina Pattern - an dîsîplîna razber a matematîkî ku daneyên di form of vectors nas dike. e ku, di ketina - vector û em tiştekî ji bo ku ez bi it. Li kû vector e, em pir girîng in, ji bo dizanin ne.
dîtiniyekê de Computer - ew bi eslê xwe ji nû de avahiya images du-alî. Îro vê herêmê berfireh bûye û dikare weke qebûlkirina hemû tiştên fîzîkî çêkirina şîrovekirin, li ser wêneyê. Ku, ev karê wan ew e yên çêkirî.
li images du-alî a pîvandinê ya ku di navbera tiştên - Li paralel bi vîzyona dibe ku di warê bi temamî cuda, li geodesy, photogrammetry lîder.
Qûna dikarin "bibînin"
Û di dawiyê de - li ber vê dîtiniya machine e. Di bin dîtiniyekê de makîneyeke wateya di dîtiniyekê * de ji robotan. Ku biryar ji hin pirsgirêkên hilberîn e. Em dikarin bêjin ku vîzyona dibe - yek zanist mezin e. Ev yekê hinek ji yên ku beşa zanistên din. Û di gava ku vîzyona computer, taku tu serlêdana taybetî, ew dîtiniyekê de makîna nav nafikire.
herêmê vîzyona Computer heye a girseyî yên sepanên pratîk. Ev e, bi automation yên hilberînê re têkildar. Li hewildan bibe bandorkar zêdetir bo ku şûna kar manual bi makîne. Aparata nade get ne westiyayî, di xew de ne, wê hebû karnameyek irregular, wê jî xwest ku ji bo xebatê salê 365 rojan e. Bi vî awayî, bi bikaranîna karê makînê de, em dikarin di encama garantîkirin di demekê de hinek bistînin, û ew pir balkêşe. Hemû erkên xwedî bikaranîna zelal ji bo sîstemên dîtiniyekê de dibe. E û tiştekî baştir ji bo dîtina encaman di cih de li ser picture tenê di qonaxa hesab û li wê derê.
Li benda ên cîhanê yên çêkirî
Plus li herêma - zehmet e! A, beşeke girîng a di mejî de ji bo vîzyona, û bawerî ew e, ku, eger hûn hîn komputera te ji bo "bibînin", ku tê de vîzyon bikaranîna komputerê full, ev yek ji armancên wê yên îstîxbaratê full çêker e. Eger em vê pirsgirêkê li ser asta mirovan çareser bike, bi îhtîmaleke mezin di heman demê de, em ê vê pirsgirêkê ji AI çareser bike. Ku pir baş e! An jî pir baş ne, eger tu binêre, "Terminator 2".
Çima dîtiniyekê de ye - lê zehmet e? Ji ber ku wêneyê object heman dikarin Herçiqas li gor faktorên derve. Dimîne li ser armanca xalên çavdêriya binêrin cuda.
Ji bo nimûne, yek û hejmara same, ji lîstên cuda. Û çi ye herî zêde li hejmara balkêş bibin yek çav, bi herdu çavan û nîv. Û gor mijarê (eger ev image Mirov di shirt bi çavên boyaxkirin), çav, nikare bibe bêtir ji du.
The computer hê jî fêm nake, di heman demê de ev "dibîne"
faktoreke din a ku zehmet jî - ku ev ronahîkirina ye. Li cihê bûyerê heman bi ronahîkirina cuda cuda wê binêrin. size object guhertin. Ji bilî vê, tiştên ku ti class. Çawa dibe ku tu li ser yekî re dibêjim ku height xwe ya 2 metre? Tu tiştek. mezinbûna mirovan û dibe ku 2.3 m, û 80 cm. Wekî ku bi cureyên din yên ne paqij, lê belê, tiştên ku di heman polê de yî.
Bi taybetî tiştên jîndar êşan cîhêreng ên çûye. Hair gel, werzişvan, heywanên. li pictures of hesp Va ye, diyar, tiştê ku bi mane wan diqewimin û dûvikê e nepêkan e. A objects gihîjte li image? Ger tu Hook wêneyekî dibe, heta li machine herî hêzdar peyda zehmetiyan bidin biryareke rast bidin.
view Next - ew a Rûhayê ye. Hinek tiştên, heywanên boyaxkirî wek jîngehê, û pir xweş. Û ew deq û coloring heman. Lê dîsa jî, em wan dibînin, tevî ku ne her dem ji dûr ve.
Din jî pirsgirêka - tevgera. Objekt li motion însanek êşan Ogut.
Gelek tiştên ku pir variable in. Li vir, ji bo nimûne, di nava du photos jêr eserê yên "BDP'ê".
Û li ser vê tu rûnin. Lê belê ji bo hîn makîneyeke, weha ku tiştên cuda li shape, reng, maddî, tişt an object "Serokê" e - gelek zehmet e. Ev meydan e. Ji bo întegra rêbazên dîtiniyekê de dibe - e ku hîn makîneyeke fêm, analîz bike, bikim.
Întegrasyonê ya dîtiniya dibe di platformên cuda
Girse ji dîtiniyekê de dibe dest bi şimitandina zêdetir di sala 2001 de, dema ku ew tên afirandin cara yekem detector rûyê. Viola, Jones: Em jî du nivîskarên çêkirin. Ev cara yekemîn bi lez û pêbawer algorithm bes, ku hêza rêbazên fêrbûna machine nîşan bû.
Niha dîtiniyekê de dibe têra xwe xwedî pêkanînên pratîk nû - naskirina rûyê mirovan.
Lê belê ji bo naskirina mirov wek ku di filman de - li angles random, şert û mercên ronahîkirina cuda - ne mimkun e. Lê belê ji bo çareserkirina vê pirsgirêkê, an yê ku kesên cuda ye, bi ronîkirina cuda an di pêkhênerên cuda, mîna ku di wêne de di pasaporta, ku ev gengaz bi pileya bilind ên bawerî ye.
a pêdiviyên pasaporta photo bêhtir bi vê taybetiyê ji algorîtmayan naskirina rû.
Ji bo nimûne, Eger te wêneyek pasaporta biyometrîk, li hin balafirgehên modern, tu dikarî sîstema kontrola pasaportê otomatîk bi kar tînin.
pirsgrêkeke girîng ên dîtiniyekê de dibe - bi kapasîteya nas ti text
Belkî yekî sîstema OCR bikaranîn. Yek ji wan - a Reader Fine, gelekî populer di sîstema RuNet e. in, bi gelek awayên cihê ku tu di welat tije, ew bi awayekî nuwaze çavan, agahiyên ku ji aliyê sîstema naskirin gelekî baş heye. Lê belê, bi ti text in the picture rewşa gelekî xerabtir e. Ev pirsgirêk hîn jî çareser nebûye.
Games tevlêkirina dîtiniyekê de dibe, girtina motion
herêma mezin cuda - afirandinê de li ser modelên sê-alî û girtina motion (ya ku pir bi serkeftî li lîstikên komputerî pêkanîn) e. The yekem bernameya, ku bi kar tîne dîtiniyekê de dibe - a li sîstema interaction bi ya kompîturê de bi kar bêbandor bike. Dema ku ew hatibû afirandin, lê gelek tişt vekirî bû.
Daneya hatiye dîzaynkirin ku pir bi hêsanî, di heman demê de ji bo veavakirina ew girt, ji bo afirandina a generator ji images sentetîk ên gel ji bo bidestxistina milyon pictures. Supercomputer bi wan re ji bo hilbijartina Parametreyên ji algorithm, ji bo ku ew niha baş dixebite.
Ji ber vê yek milyon images û hefteya dem supercomputer jimarnav mimkin ji bo ku Rêbaza ku dixwe û 12% ji kapasîteya yek processor û dihêle ku mirovek bi hevra li ser helwesta di dema rast. Ev sîstema Microsoft Kinect (2010).
Search for images bi naveroka destûrê dide te ku upload photos to the system, û encamên wê hemû pictures bi naveroka eynî bidin û pêk ji hêla heman.
Wergerandî yên dîtiniyekê de dibe: sê-alî û maps du-alî bi niha bi çêkiriye. Maps ji bo cars navîgasyon, bi rêkûpêk, li gor DVR ve.
e ku heye bi mîlyaran photos Geotagged hene. By daxistina li picture di nav HTMLê da heye, tu dikarî diyar bike ku ew, pêk hat û heta bi hin perspektîfa. Bê guman, ne, ku li wê derê bes ku gel li yek dem de geştyar e û made a number of photos of herêma wê derê.
robotan li her deverê
Robotics di dema niha de, li her derê, bêyî ku ew bi ti awayî. Niha in wesayîtên ku kamerayên taybet e ku xelk û nîşanan rê nas bike bo vîdeoyên emrên ji driver (ev di rêya bernameyeke komputerê ji bo dîtina, alîkarî ya bi qezen) heye. E û a wesayîtên robotîk bi temamî otomatîk, heye, lê belê ew ne tenê li ser sîstema camera video bêyî bikaranîna beşekê mezin ji agahiyên zêdetir xwe hispartîye.
camera Modern - ev an obscura camera analogue e
Werin em li ser image dîjîtal biaxivin. Kamêrayên dîjîtal Modern bi ser esasê obscura camera li darxistin. Tenê li şûna li ser hole ku bi rêya ronahiyê re dikevê, ew girş û projeya li ser dîwarê dîsa ji odeya circuit mijarê de, em xwedî sîstemeke optîk taybet bi navê lens. object xwe e bi berhevkirina girş mezin ronahî û misilmankirina, da ku hemû bi tîrêjên bi riya xala virtual ji bo bidestxistina li projection û avakirna image li ser fîlm an matrix re derbas bûn.
Kamêrayên dîjîtal Modern (Matrix) ji hêmanên şexsî pêk tê - pixels. Her pixel, dikare enerjiya ronahiyê de ye, ku bûyer li ser total pixel de bipîvin, û pirsgirêka Kurd yek hejmara encam. Ji ber vê yekê, di digital camera, em li şûna ku ji ber şewqa image pîvana set ronahî, girtin di pixel bitenê - kompîturê warê bibîne. Ji ber vê yekê, dema ku wêneyê de em dibînin ji xeta û xetên zelal, û a grid ji meydanan bi reng di rengên cuda diherikin ne - pixels.
Li jêr tu yê pêşî image dîjîtal di cîhanê de bibînin.
Lê belê di vê picture e ne? Color. reng çi ye?
têgihîştina Psîkolojîk ên color
Color - ev e, tiştê ku em nabînin. Rengê yek û heman tiştî ji bo mirov û pisîk cuda be. Ji ber ku em (mirov) û sîstemeke optîk animal - di dîtiniyekê de cuda ye. Ji ber vê yekê, ku bi rengê - ew bi kalîte psîkolojîk ên nêrîna me ku pêşwîste dema çavderiyê de objects û ronahiyê ye. Û ne xanî a fizîkî yên ku object û ronahiyê de. Color - Di encama danûstandina di pêkhateyên ronahiyê, û cihê bûyerê ji sîstema dîtbarî me ye.
Programming Vision Computer di Python bikaranîna pirtûkxaneyên
Ger tu biryar da ku teşebusên bi giranî di xebatê de ji dîtiniyekê de dibe, di cih de, divê ji bo hejmareke mezin ji zehmetiyên amade bike, ev zanist e ya herî hêsan ne û veşartî, hejmarek ji dahfikên. Lê belê, "Programming Computer Vision li ser Python" ya nivîskarê Jan Erik Solema - pirtûkek ku hemû zimanekî hêsan herî, çarçove dike. Li vir, tu dê çawa bi rêbazên naskirina tiştên cuda li 3D nas, hîn ji bo hevkariya bi image stereo, rastiya nîgaşî û gelek sepanên din ji vîzyona dibe. Di pirtûkê de wergerandî bes di Python in. Lê belê şiroveyên bi pêşkêşkirin, da ku bipeyive, gelemperî, da ku overload lêkolîn jî gelek û daneyên hişk ne. Karê minasib ji bo xwendekaran, amateurs, û bi heyecan. Download vê pirtûkê û yên din li ser vîzyona dibe (pdf-format) dikarin li ser torê be.
Vê gavê, ne pirtûkxaneya a çavkaniya vekirî ya ji algorîtmayan dîtiniyekê de dibe û muamelekirina image û algorîtmayên hejmarî OpenCV hene. Ew li ser zimanên herî bernameyên modern meşandin, çavkaniya vekirî ye. Heke em li ser vîzyona dibe Gotûbêja, Python tîne, wek zimanê bernameyên, ev jî heye, bi piştgiriya hatî pirtûkxaneyê, ji bilî ev e, her tim mabû a civaka mezin û.
Kompanya "Microsoft" xizmetên xwe Api-karibin perwerde tora jittery ji bo ku ev kar bi images of gelê pêşkêş dike. e bi derfet serî dîtiniyekê de dibe heye, Python tîne, wek zimanê bernameyên.
Similar articles
Trending Now