📻 Kamery: jak nas widzą, tak nas znają

Adam Liberacki o tym, dokąd prowadzi funkcja rozpoznawania twarzy i emocji  

AUDIO REO. Posłuchaj tekstu artykułu na podcaście:


 

fot. pixabay.com, geralt

Od dawna mówi się o masowej inwigilacji obywateli przez rządy swoich krajów, zwłaszcza tych wysoko rozwiniętych. Uzyskiwane dane pochodzą zarówno z rejestratorów wideo, jak i audio. Pytanie, które nasuwa się niemal od razu, jest takie, w jaki sposób te ogromne ilości danych są analizowane. Co więcej, w jaki sposób kamery montowane na rogu każdej ulicy większych miast są w stanie rozpoznać przestępcę albo zwykłego człowieka w drodze do pracy.

Ostatnio technologię rozpoznawania twarzy przybliżyła firma Apple, która w swoim najnowszym urządzeniu iPhone X zaimplementowała moduł pozwalający na odblokowanie telefonu w wyniku skanu twarzy. Technologia ta sprzęga ze sobą poziom hardware’owy, a więc urządzenia emitujące fale elektromagnetyczne, m.in. z zakresu podczerwieni, światło laserowe (monochromatyczne) oraz kamery odczytujące naniesione przez emitery punkty/linie. Im większa rozdzielczość emitowanych fal świetlnych (zdolność skupienia), a także rozdzielczość kamer, tym większe odwzorowanie obiektu 3D. To z kolei przekłada się na dokładność analizowanych danych oraz efekty obliczeń.

Przykładowo, technologia użyta przez koncern Apple wykorzystuje światło podczerwone, które emitowane jest w postaci około 30 tysięcy punktów na twarz użytkownika. Następnie na podstawie analizy odległości względnej między punktami, uzależnionej od krzywizny, na którą pada wiązka punktów, tworzona jest sieć punktów ulokowanych w przestrzeni kartezjańskiej. Inne technologie wykorzystują wiązkę laserową, która pada na analizowany przedmiot i na nim się zakrzywia. Kamera, stosowana na kolejnym etapie analizy, odczytuje położenie monochromatycznych punktów, które w przestrzeni komputera przekształcane są w mapy wektorowe.

Wszystkie te zabiegi mają za zadanie zbieranie ogromnej ilości danych, big data, które trzeba przekształcić na dane wyjściowe. Podczas gdy w przypadku przedmiotu do celów inżynierii odwrotnej analiza obrazu jest przeprowadzona w celach czysto technicznych, tak do analizy obrazu do celów identyfikacyjnych, inwigilacyjnych, a także behawioralnych, uczenie maszynowe zaprzęgane zostaje do analizy skomplikowanych przypadków. Dotyczą one głównie rozpoznawania twarzy zmodyfikowanej poprzez czynniki naturalne, jak i te materialne, fizyczne. Czym innym jest bowiem analiza obrazu w warunkach laboratoryjnych, wyidealizowanych, a czym innym świat rzeczywisty, w którym więcej jest odstępstw niż reguł.

Rozpoznawanie twarzy, a także emocji przez nią przejawianych związane jest bezpośrednio z analizą położenia względnego szeregu punktów na twarzy, różniących się relatywnym położeniem, a także barwą. Na przykład punkty, które komputer analizuje jako zależne od siebie, to te, które położone są w okolicach ust, oczu oraz brwi. Stosując uczenie maszynowe do tworzenia paternów emocji, tj. smutku, żalu, radości, złości itd., można analizować kształt i ruch punktów charakterystycznych, a na tej podstawie określać nastrój, czy zamiary badanej osoby. Jak to działa? Przykład działania algorytmów prezentuje Kairos, jedna z firm specjalizujących się w odczytywaniu emocji:

Obszary zastosowań analizy obrazu, głównie w dziedzinie rozpoznawania twarzy i emocji są dosyć rozległe i niezwiązane wyłącznie z inwigilacją społeczeństwa. Jest to m.in. branża medyczna, w której funkcjonalność ta może być wykorzystywana do prowadzenia ewidencji przyjmowania odpowiednich medykamentów przez osoby chore i niedomagające. Inne obszary to marketing czy finanse. Autoryzacja transakcji bezgotówkowych przy pomocy własnej… twarzy? Czemu nie. Umożliwia to aplikacja MasterCard Identity Check Mobile app.

Ale czy to wszystko jest bezpieczne? Kiedy przyjdzie moment, że wszystkie dane, charakteryzujące każdego z nas, będą magazynowane na serwerach i będą służyć do analizy naszego zachowania i śledzenia nas w każdym miejscu, w którym bywamy? Kiedy prywatność przestanie istnieć? Myślę, że każdy powinien sam zadecydować, czy udostępnianie odcisku palca oraz skanu twarzy urządzeniom mobilnych będzie służyć naszemu bezpieczeństwu czy też odwrotnie: to bezpieczeństwo nam odbierać.