Kas ir Deep Learning AF: kā darbojas Canon ar AI darbināms autofokuss?

Canon ir radījis lielu troksni par savu jauno Deep Learning AF sistēmu, kas atrodas ražotāja jaunākās profesionālās fotokameras centrā. Tas izklausās neticami gudri, bet ir daudz jautājumu - kas ir dziļa mācīšanās? Kas māca? Vai sistēma mācās, kad fotografējat? Vai tas tiešām ir mākslīgais intelekts kamerā? Vai tas faktiski uzlabo autofokusu?

Ja esat izlasījis mūsu Canon EOS-1D X Mark III pārskatu, jūs zināt, ka atbilde uz pēdējo jautājumu ir pārliecinoša. Kas attiecas uz atbildēm uz citiem jautājumiem par Deep Learning AF, paņemiet sev dzērienu un uzkodas un lasiet tālāk …

Canon EOS-1D X Mark III autofokusa mehānika ir neticami gudra, atbalstot divas atsevišķas AF sistēmas. Pirmkārt, optiskā sistēma, kas caur skatu meklētāju uzņem 16 kadrus sekundē, izmantojot 400 000 pikseļu mērīšanas sensoru kopā ar īpašu Digic 8 procesoru, 191 punktu AF, kas spēj izsekot sejai.

Tad ir Live View sistēma, kas spēj uzņemt 20 kadrus sekundē, izmantojot visus 20,1 miljonus attēla sensora pikseļu apvienojumā ar jauno Digic X procesoru 3869 Dual Pixel CMOS punktiem, kas var veikt pilnu acu noteikšanas AF.

Abu šo sistēmu barošana ir Canon galvenā EOS iTR AFX tehnoloģija - jaunākā tās viedās izsekošanas un atpazīšanas automātiskās fokusēšanas atkārtojums, kas debitēja sākotnējā EOS-1D X (un pēc tam nonāca 7D Mark II un 5D saimes). Un tās shēmās ir apglabāts Deep Learning algoritms.

Dziļa mācīšanās NAV tas pats, kas AI

Pirmkārt, ir svarīgi precizēt, ka dziļu mācīšanos nevajag jaukt ar mākslīgo intelektu (AI). AI sistēma ir kaut kas pastāvīgs attīstības stāvoklis. Dziļa mācīšanās jeb mašīnmācīšanās ir AI apakškopa.

Atšķirībā no patiesā AI, dziļa mācīšanās ir slēgts process. Tas ir pirms montāžas algoritms, kas ļauj kameras arhitektūrai būtībā iemācīt sevi, daudz ātrāk, nekā to varētu manuāli ieprogrammēt inženieri inženieri. Kad šī mācība ir pabeigta, tā tiek bloķēta un ievietota kamerā.

No šī brīža vairs nav iespējams mācīties; neskatoties uz nosaukumu - un padziļināta mācīšanās ir tehnoloģijas nosaukums, nevis procesa apraksts - kamera nepārtraukti nemācās un nepaliks “labāka”, jo vairāk fotografēsit (tiešām, patiesa AI sistēma iemācītos tik daudz jūsu sliktajiem ieradumiem, tāpat kā tas būtu jūsu labajiem!).

"Tas ir iemācīts," skaidro Maiks Burnhils, Canon Europe tehniskā atbalsta vadītājs. "Jūs to ievietojat datorā, un tas izveido algoritmu, kas pēc tam tiek ielādēts kamerā. Tātad tas atšķiras no AI - AI ir nepārtraukta mācīšanās; dziļa mācīšanās būtībā ir tā, ka tā māca sevi un dod jums gala rezultātu, kas pēc tam tiek ielādēts. kamerā. "

Kas rada jautājumu: vai tik daudz uzņēmumu kliedz par AI balstītām funkcijām, vai kamera tiešām spēj atbalstīt mākslīgo intelektu?

"Apstrādes jauda, ​​lai veiktu patiesu AI, nav iespējama kamerā," saka Burnhils. "Ja vēlaties to izdarīt, ir tālruņi - taču dati nav jūsu tālrunī, tie ir Silīcija ielejā. Tur atrodas AI sistēma. Vienkārši ar to savienojas jūsu tālruņa savienojums - tas nav šeit, tas ir tur mākonis), jo jums ir nepieciešams serveris. Mēs varētu darīt kameru, bet jūs visu laiku nēsātu līdzi milzīgu lidojuma lietu. "

Kā dziļa mācīšanās māca pati sevi?

Tātad, Deep Learning algoritms māca pats - bet no kurienes tas patiesībā mācās? Atbilde, vienkārši sakot, ir "no labākajiem".

"Canon strādāja ar mūsu aģentūrām," stāsta mums Burnhils. "Mēs no visām lielākajām aģentūrām saņēmām piekļuvi visai viņu sporta fotogrāfiju attēlu datubāzei, mēs sadarbojāmies ar saviem vēstniekiem, kuri šauj sportu, un viņi sniedza savus dažādu priekšmetu attēlus, un tas mums ļāva iemācīt šai AF sistēmai, kā atpazīt cilvēki sportā. "

Sports, protams, ir mērķtiecīga mācību metode, jo Canon EOS-1D X Mark III galvenokārt ir sporta kamera. Problēma ir tā, vai tas ir basketbolists, kas vērsts pretī kamerai, slēpotājs, kas valkā aizsargbrilles, vai Pirmās formulas braucējs, kas valkā ķiveri. Sporta cilvēkiem bieži ir aizsegtas sejas - tas nozīmē, ka tradicionālā sejas vai pat acu noteikšanas AF nedarbojas ” Tas nedarbosies, un kamera tā vietā bloķēsies, piemēram, numuriem uz spēlētāja formas tērpa.

Piešķirot Deep Learning algoritmam piekļuvi plašai attēlu bibliotēkai, sākot no otrādi vingrotājiem un beidzot ar hokejistiem, kas nēsā paliktņus un ķiveres, tas spēj iemācīties un atšķirt cilvēka formu bezgalīgās dažādās situācijās - un galu galā spēj veikt šo “galvas noteikšanu” tā, ka pat tad, ja personas seja nav redzama, galva vienmēr ir galvenais fokusa punkts.

"Dziļa mācīšanās pamatā ir attēli, jūs izveidojat noteikumu kopumu, lai tas varētu mācīties, un pēc tam tas notiek, un tas izveido pats savu algoritmu," turpina Burnhils. "Tātad jūs iestatāt parametrus tam, kā cilvēks izskatītos, jūs ejat:" Šeit ir persona ", tad tas analizē visus cilvēku attēlus un saka:" Šī ir persona "," Tas ir cilvēks ". laika gaitā iziet cauri miljoniem attēlu un izveido šo datu bāzi, un tā pati mācās. "

Faktiski algoritms faktiski izveido divas datu bāzes - vienu, lai apkalpotu optiskā skatu meklētāja AF sistēmu un mērīšanu, izmantojot Digic 8, un otru, lai apkalpotu Live View AF sistēmu, kas izmanto Digic X. Tā kā visu Digit X veic visu aprēķinu galvas izsekošana, kad AF algoritms rāmī atklāj cilvēku, viss tiek virzīts uz jauno procesoru.

"Kad esat pieņēmis personu, faktiski notiek divkārša apstrāde," saka Burnhils. "Šeit ir divas datu bāzes, jo ieeja no abiem sensoriem būs nedaudz atšķirīga, tāpēc tas, kā tas tiks atpazīts, būs nedaudz atšķirīgs, tāpēc tās ir viena un tā paša algoritma apakškopas. Abu datu pamatdati ir vienādi, vienkārši kā tas tiks atpazīts un tam piemēroti pareizie dati. "

Ja tā nevar iemācīties jaunas lietas … kā ar dzīvnieku AF?

Protams, Canon EOS-1D X Mark III nav tikai sporta kamera - tā cita galvenā auditorija ir savvaļas šāvēji. Tomēr kamerai nav dzīvnieku automātiskās fokusēšanas iespējas, un mēs esam noskaidrojuši, ka dziļa mācīšanās faktiski nevar iemācīties nekādus jaunus trikus, kad tā ir iespiesta kamerā. Tā tas ir? Vai ar visu šo izdomāto jauno tehnoloģiju kamera netiks koncentrēta pat uz ģimenes suni?

Tiesa, patlaban kamerā nav redzams dzīvnieku (vai dzīvnieku acu) AF. "Būtībā mēs koncentrējamies uz cilvēkiem, no kuriem sākt, lai vispirms iegūtu šāda veida algoritmu," atbild Burnhils. "Tāpēc mēs esam koncentrējušies uz sportu, jo tas ir noteikts parametrs, un mēs to varam iemācīt noteiktā laika periodā,"

Tad atbilde slēpjas programmaparatūrā. Burnhils apstiprināja, ka kamerai ir iespējama padziļināta mācīšanās, piemēram, putni un savvaļas dzīvnieki, un šo atjaunināto algoritmu lietotājiem var izplatīt, izmantojot programmaparatūras atjauninājumus, lai gan nav konkrētu plānu paziņot.

"Mēs to attīstīsim visu laiku, tāpēc šobrīd vēl nav izlemts, kā un kurp mēs ejam. Bet izstrādes komanda dodas un skata citas dzīvnieku fotogrāfijas - mēs saprotam, ka ir vesela virkne lauku, taču acīmredzami lielie šīs kameras uzmanības centrā ir sports un savvaļas dzīvnieki, un acīmredzot ar Tokiju 2022-2023 tā bija prioritāte. "

Tā ir taisnība; ja Canon gaidītu, kamēr Deep Learning visu iemācīsies, kameras izlaišana būtu prasījusi ilgāku laiku. Lai gan ražotāji, piemēram, Sony, savās fotokamerās lepojas ar kādu selektīvu dzīvnieku AF, Burnhill atzīmē, ka Canon daudz drīzāk izlaiž pilnīgu dzīvnieku AF risinājumu, nevis selektīvu, pa daļām. Un tieši šeit dziļa mācīšanās kļūs nenovērtējama.

"Problēmas ir ar savvaļas dzīvniekiem, tur ir daudz dažādu dzīvnieku - jums acīmredzami ir plēsēji ar acīm priekšā, un tad jums ir trušu (acis) sānos, jums ir čūskas, jums ir putni … nav sistēmas, kas atpazīst visu dzīvnieku sejas. Un tur jūs nonākat šajā visā Dziļajā mācībā, mācot sistēmai atpazīt šīs sarežģītās lietas. "

Tātad, lai gan jūsu Sony var izsekot jūsu suni vai kaķi, bet ne salamandru vai flamingo, Canon vēlas ražot kameru, kas dara visu vai neko. "Ja mēs to darītu, mēs gribētu to darīt pēc iespējas plašākam spektram - mēs nevēlamies izgatavot suņiem draudzīgu kameru un kaķiem draudzīgu kameru, mēs vēlamies izgatavot dzīvnieku draudzīgu kameru kas der visdažādākajiem dzīvniekiem, kurus (profesionāļi) nošautu. "

Canon EOS-1D X Mark III pārskats
Kā Canon izgatavoja visu laiku ātrāko DSLR? Pārveidojot spoguļa lodziņu
102 atjauninājumi Canon EOS-1D X Mark III

Interesanti raksti...