Înconjurând pătratul

Russell Kirsch spune că îi pare rău.

CLARIT Înainte de a transforma imaginea cu pixeli pătrați, un prim plan al unei urechi apare ca o stivă blocată. Tratamentul cu pixeli de formă variabilă îl transformă înapoi într-o ureche. NIST

PRIMA POZĂ Această imagine a bebelușului, scanată în 1957, a fost prima imagine digitală. La 176 pe 176 pixeli, dimensiunea sa a fost limitată de capacitatea de memorie a computerului. NIST

Cu mai bine de 50 de ani în urmă, Kirsch a făcut o poză fiului său și a scanat-o într-un computer. A fost prima imagine digitală: o imagine granulată, alb-negru, pentru bebeluș care a schimbat literalmente modul în care vedem lumea. Odată cu el, netezimea imaginilor capturate pe film a fost distrusă în bucăți.

Pixelul pătrat a devenit norma, în parte datorită lui Kirsch, iar lumea a devenit puțin mai aspră în jurul marginilor.

Ca om de știință la Biroul Național de Standarde în anii 1950, Kirsch a lucrat cu primul computer programabil din Statele Unite. „Singurul lucru care ne-a constrâns a fost ceea ce ne-am imaginat”, spune el. „Deci au fost multe lucruri pe care ne-am gândit să le facem. Unul dintre acestea a fost, ce s-ar întâmpla dacă computerele ar putea vedea lumea așa cum o vedem noi?”

Kirsch și colegii săi nu au putut ști răspunsul la această întrebare. Munca lor a pus bazele imaginilor prin satelit, scanărilor CT, realității virtuale și Facebook.

Kirsch a realizat prima imagine digitală folosind un aparat care i-a transformat imaginea în limbajul binar al computerelor, o grilă obișnuită de zerouri și unu. Cu doar 176 pe 176 pixeli, prima imagine a fost construită dintr-o mică parte din informațiile din imaginile capturate cu camerele digitale de astăzi. Pe atunci, capacitatea de memorie a computerului limita dimensiunea imaginii. Dar astăzi, bițurile au devenit atât de ieftine încât o persoană se poate plimba cu mii de fotografii digitale ale bebelușilor stocate pe un dispozitiv de buzunar care efectuează și apeluri telefonice, navighează pe internet și chiar face fotografii.

Cu toate acestea, știința încă se confruntă cu limitele stabilite de pixelul pătrat.

„Squares a fost lucrul logic de făcut”, spune Kirsch. „Desigur, logica nu a fost singura posibilitate… dar am folosit pătrate. A fost ceva foarte prostesc de care suferă toată lumea de atunci.”

Acum pensionar și care locuiește în Portland, Oregon, Kirsch și-a propus recent să-și repare. Inspirat de constructorii de mozaic ai antichității, care au construit scene cu detalii uimitoare cu bucăți de țiglă, Kirsch a scris un program care transformă pătratele groase și grele ale unei imagini digitale într-o imagine mai netedă făcută din pixeli cu forme variabile.

El a aplicat programul la o poză mai recentă a fiului său, acum în vârstă de 53 de ani, care apare împreună cu analiza lui Kirsch în numărul mai/iunie al revistei. Jurnalul de Cercetare al Institutului Național de Standarde și Tehnologie.

„În cele din urmă”, spune el, „la vârsta mea înaintată de 81 de ani, am decis că în loc să mă plâng doar de ceea ce am făcut, ar trebui să fac ceva în privința asta”.

Metoda lui Kirsch evaluează o imagine cu pixeli pătrați cu măști care sunt de 6 pe 6 pixeli fiecare și caută cea mai bună modalitate de a împărți acest pixel mai mare în două zone cu cel mai mare contrast. Programul încearcă două măști diferite pe fiecare zonă – într-una, o cusătură împarte masca în două triunghiuri aspre, iar în cealaltă o cusătură creează două dreptunghiuri aspre. Fiecare mască este apoi rotită până când programul găsește configurația care împarte zona de 6 pe 6 în secțiuni care contrastează cel mai mult. Apoi, pixeli similari de ambele părți ale cusăturii sunt topiți.

Kirsch a folosit, de asemenea, programul pentru a curăța o scanare RMN a capului său. Programul poate găsi o casă în comunitatea medicală, spune el, unde este standard să introduci imagini precum raze X într-un computer.

Abordarea lui Kirsch abordează o enigmă cu care domeniul fotografiei computaționale continuă să se confrunte, spune David Brady, șeful programului de imagistică și spectroscopie al Universității Duke din Durham, NC.

Imaginile construite din pixeli pot arăta o cantitate incredibilă de detalii, spune Brady. „Este distractiv să vorbesc cu copiii despre asta pentru că ei nu mai știu despre ce vorbesc, dar zăpada de pe televiziunea analogică – un imager bazat pe blocuri poate reconstrui exact acest model.”

Dar imaginile luate din viața reală nu arată niciodată așa, spune Brady. De obicei, au mai multe secțiuni mari uniforme – frunte, cămașă roșie, cravată albastră. Aceasta înseamnă că există o probabilitate mare ca un pixel dintr-o imagine să arate la fel ca pixelul de lângă el. Nu este nevoie să trimiteți toți acești pixeli asemănătoare ca informații unice; informația care este cu adevărat importantă este acolo unde lucrurile sunt diferite.

„Întotdeauna glumesc că este ca vremea în Los Angeles”, spune Brady. „Dacă ai fi meteorolog în Los Angeles, aproape întotdeauna ai avea dreptate dacă ai spune că mâine va fi aceeași vreme ca azi. Deci, un lucru pe care îl puteți face este să spuneți, voi presupune că următorul pixel este ca acesta. Nu vorbi cu mine, nu-mi spune nimic despre imagine, până nu obții ceva diferit. Un meteorologic bun din Los Angeles vă spune când vine o furtună mare. Într-o imagine, aceasta este o margine. Vrei să asumi netezime, dar să ai un sistem de măsurare capabil să găsească cu precizie unde sunt marginile.”

Acolo unde Kirsch folosește măști pentru a îndeplini această sarcină, cercetătorii de astăzi folosesc în mod obișnuit ecuații mult mai complexe decât ale lui pentru a găsi echilibrul între eliminarea informațiilor inutile și păstrarea detaliilor. Pixelii sunt încă punctul de plecare al imaginilor digitale astăzi, dar matematica – în special teoria wavelet – este cea care transformă pixelii în imagine. Teoria wavelet ia un număr mic de măsurători și le transformă în cea mai bună reprezentare a ceea ce a fost măsurat. Această cea mai bună estimare a unei imagini permite ca o imagine megapixel să fie stocată ca simpli kiloocteți de date.