Systém pro rozpoznávání tváře

Systém na rozpoznávání tváře (či systém pro rozpoznávání obličeje) je počítačový program na identifikaci osob z fotografií či videí. Rozpoznávání tváří se provádí podle geometrických charakteristik obličeje a porovnává se s databází. Lze určovat i pohlaví a odhadovat věk osob.[1] Automatické rozpoznávání tváří však nefunguje stoprocentně a lze jej zmást.[2][3] Pomocí speciálně navržených brýlí se lze vydávat za někoho jiného.[4] Systém rozpoznávání tváře je používán i bez vědomí uživatelů.[5] Fotografie lze ale upravit tak, aby rozpoznávání tváře selhalo, a to díky speciálnímu softwaru, který obrázek jemně zkreslí, aniž by to pouhé lidské oko rozpoznalo.[6]

Vlastní tvář (AT&T).

Regulace ohledně rozpoznávání se ve skutečnosti úplně nedodržuje.[7] Evropský inspektor ochrany údajů (EDPS) navrhuje úplný zákaz této technologie k obecným účelům.[8]

Historie

editovat

Historie rozpoznávání obličejů sahá až do 60. let 20. století, kdy byly první pokusy o automatické zpracování obličejů prováděny ručně. V roce 1964 začal výzkum na poli rozpoznávání obličejů, kde byly použity geometrické metody k analýze tváří. Významný pokrok přišel v 90. letech 20. století, kdy začaly být zaváděny pokročilé statistické metody a strojové učení. Tyto metody se staly základem pro dnešní algoritmy, které umožňují rozpoznávání obličejů i za složitějších podmínek.[9]

Základní principy technologie rozpoznávání obličeje

editovat

Technologie rozpoznávání obličejů zahrnuje několik kroků, které společně zajišťují úspěšnou identifikaci nebo ověření identity na základě obrazu obličeje. Tento proces lze rozdělit do čtyř hlavních fází: detekce obličeje, předzpracování obrazu, extrakce rysů a klasifikace.[10]

 
Haar Funkce, která vypadá podobně jako hřbet nosu, je aplikována na tvář.

Detekce obličeje je první a nejdůležitější fází systému rozpoznávání obličejů, která určuje, zda se na obrázku nebo videu nachází obličej.[11] Tato fáze obvykle využívá algoritmy pro zpracování obrazu, které identifikují rysy typické pro obličej, jako jsou oči, nos a ústa. Algoritmy jako Haarův kaskádový klasifikátor nebo modernější metody založené na hlubokém učení (například konvoluční neuronové sítě) hrají roli v detekci obličeje i v dynamických podmínkách, například na přeplněných veřejných místech.[12]

Předzpracování obrazu zahrnuje techniky, které připravují obraz pro další analýzu. Techniky zahrnují normalizaci, která transformuje obrazy různých velikostí a měřítek do jednotné podoby, a zarovnání obličeje, které lokalizuje body, jako jsou oči, nos a ústa, pro standardizaci orientace obličeje.[10]

Další důležitou částí předzpracování je vylepšení obrazu, což zahrnuje odstraňování šumu a zvyšování kontrastu pro zlepšení kvality. Například osvětlení může ovlivnit jasnost a detaily obrazu, což může vést ke špatné identifikaci. Použití histogramové ekvalizace nebo Gaborových filtrů pomáhá tyto problémy řešit. Tyto techniky zajišťují, že obraz obličeje je optimální pro další analýzu.[10]

Extrakce rysů je proces, při kterém jsou z obrazu obličeje získávány charakteristiky, které reprezentují identitu jednotlivce. Cílem je redukovat velké množství dat na menší sadu informací, které jsou dostatečné pro klasifikaci. Klíčové metody zahrnují analýzu hlavních komponent (PCA) a lokální binární vzory (LBP), které zdůrazňují jedinečné rysy, jako je textura kůže nebo geometrie obličeje.[12]

Klasifikace rysů je závěrečným krokem, kde jsou extrahované rysy porovnávány s databází známých obličejů. Algoritmy jako k-nejbližší soused, podporované vektorové stroje (SVM) nebo konvoluční neuronové sítě (CNN) přiřazují obraz k příslušné třídě na základě minimální odchylky nebo pravděpodobnosti shody. Tato fáze zahrnuje jak ověřování identity (ověření jednoho obličeje), tak identifikaci (porovnání obličeje s více obrazy v databázi).[12]

Faktory ovlivňující rozpoznávání obličeje

editovat

Navzdory pokrokům v technologii rozpoznávání obličejů čelí systémy mnoha problémům, zejména v reálných a nekontrolovaných podmínkách. Tyto výzvy zahrnují osvětlení, variace póz, výrazy obličeje, plastické operace, stárnutí, nízké rozlišení a zakrytí obličeje, což často vede k nesprávné identifikaci.[10]

Osvětlení může způsobit, že obličej vypadá na snímku jinak, i když se jedná o stejnou osobu. Stíny a změny kontrastu ztěžují systémům správné rozpoznání.[11] Řešení zahrnují histogramovou ekvalizaci, 3D modely a extrakci rysů pomocí Gaborových filtrů. Přesto osvětlení zůstává jedním z hlavních problémů v nekontrolovaných podmínkách.[10]

Rozdílné úhly pohledu, například při otáčení hlavy, mohou způsobit, že systém selže. Řešením je využití 3D modelů nebo databází s různými pózami, které umožňují lepší trénink algoritmů.[13] Výrazy obličeje mění geometrii obličeje a komplikují identifikaci. Moderní přístupy využívají hluboké učení a extrakci stabilních geometrických rysů, například vzdáleností mezi klíčovými body.[13]

Plastické operace, jako je facelifting nebo úprava nosu, dramaticky mění vzhled obličeje, což ztěžuje rozpoznání.[14] Algoritmy využívající Gaborovy filtry a texturální rysy pomáhají tento problém zmírnit, ale další výzkum je stále potřeba.[12]

Stárnutí mění strukturu obličeje a vzhled vrásek, což ovlivňuje přesnost rozpoznání. Databáze, jako FGNET a MORPH, slouží k tréninku algoritmů odolných vůči stárnutí.[12] Moderní metody, například auto-enkodéry, umožňují lépe modelovat proces stárnutí a identifikovat stabilní rysy.[12]

Nízké rozlišení snímků, například z bezpečnostních kamer, vede ke ztrátě detailů obličeje, což snižuje přesnost. Metody super-rozlišení nebo přizpůsobení algoritmů nízko-rozlišovacím datům mohou tento problém částečně řešit.[9]

Metody v rozpoznávání obličejů

editovat

Metody a algoritmy v rozpoznávání obličejů se vyvíjely od tradičních přístupů až po moderní techniky založené na hlubokém učení. Tradiční metody, jako PCA a LDA, byly klíčové v raných fázích výzkumu.[10] Zatímco moderní algoritmy, například CNN, přinesly zásadní pokroky v přesnosti a robustnosti v reálných podmínkách.[12]

Analýza hlavních komponent (PCA) byla jednou z prvních technik použitých pro redukci dat při rozpoznávání obličejů. Metoda zdůrazňuje klíčové rysy, které umožňují klasifikaci, a její efektivita spočívá v jednoduchosti a rychlosti. Nicméně, PCA není schopna dostatečně dobře řešit komplexní variace v obrazech, což omezuje její použitelnost v reálném světě.[9]

Lineární diskriminační analýza (LDA) na rozdíl od PCA klade důraz na odlišnost mezi jednotlivými třídami. Tato metoda je ideální pro rozpoznávání obličejů v prostředích, kde je potřeba vysoká přesnost klasifikace. LDA však naráží na omezení při vysoké variabilitě vstupních dat, což vyžaduje její kombinaci s jinými metodami.[9]

Konvoluční neuronové sítě (CNN) jsou považovány za nejvýkonnější metodu v rozpoznávání obličejů. Automaticky extrahují klíčové rysy, což eliminuje nutnost manuálního výběru. Díky své flexibilitě zvládají širokou škálu scénářů, například rozpoznání při různých úhlech nebo osvětlení.[13]

Lokální binární vzory (LBP) poskytují efektivní reprezentaci textur a jsou často využívány v kombinaci s jinými algoritmy. Díky své jednoduchosti a nízkým výpočetním nárokům se LBP hodí pro aplikace, kde je klíčová rychlost.[12]

Nezávislá komponentní analýza (ICA) umožňuje odhalit nezávislé struktury v datech, což zlepšuje schopnost systému analyzovat obličejové rysy v prostředích s vysokou variabilitou. Tato metoda je účinná zejména tam, kde PCA selhává.[12]

Lineární reprezentace (LRC) využívá lineární kombinaci tréninkových vzorků k reprezentaci testovacího vzorku a následně určují příslušnost k třídě na základě minimální odchylky (rezidua). Tyto metody zahrnují tři kroky: kódování, při kterém se počítají koeficienty lineární kombinace, aproximaci podprostoru, kde se analyzují příslušnosti k jednotlivým třídám, a klasifikaci, která přiřazuje vzorku třídu s nejnižší odchylkou.[15]

Reference

editovat
  1. Microsoft age-estimate tool unleashed real-time virality. techxplore.com [online]. [cit. 2020-02-03]. Dostupné online. (anglicky) 
  2. Brýle pro milovníky soukromí. www.osel.cz [online]. osel.cz [cit. 2020-02-03]. Dostupné online. 
  3. VR rendering software used to trick facial security systems. techxplore.com [online]. [cit. 2020-02-03]. Dostupné online. (anglicky) 
  4. Who are you looking at? Glasses fool face recognition software. techxplore.com [online]. [cit. 2020-02-03]. Dostupné online. (anglicky) 
  5. ČTK. Facebook urovnal 550 miliony USD žalobu kvůli rozpoznávání tváří. ITBiz.cz [online]. Nitemedia, 2020-02-02 [cit. 2020-02-03]. Dostupné online. 
  6. Image cloaking tool thwarts facial recognition programs. techxplore.com [online]. [cit. 2020-08-05]. Dostupné online. (anglicky) 
  7. https://www.lupa.cz/clanky/rozpoznavani-obliceju-na-papire-regulace-praxe-je-ale-kontroverznejsi/ - Rozpoznávání obličejů: na papíře regulace, praxe je ale kontroverznější
  8. https://www.ceskenoviny.cz/zpravy/edps-technologie-rozpoznavani-obliceje-by-mela-byt-v-eu-zakazana/2027166 - EDPS: Technologie rozpoznávaní obličeje by měla být v EU zakázána
  9. a b c d LI, Dong-Lin; PRASAD, Mukesh; HSU, Sheng-Chih. Face recognition using nonparametric-weighted Fisherfaces. EURASIP Journal on Advances in Signal Processing. 2012-12, roč. 2012, čís. 1. Dostupné online [cit. 2024-12-19]. ISSN 1687-6180. DOI 10.1186/1687-6180-2012-92. (anglicky) 
  10. a b c d e f LI, Lixiang; MU, Xiaohui; LI, Siying. A Review of Face Recognition Technology. IEEE Access. 2020, roč. 8, s. 139110–139120. Dostupné online [cit. 2024-12-19]. ISSN 2169-3536. DOI 10.1109/ACCESS.2020.3011028. 
  11. a b SCHERHAG, Ulrich; RATHGEB, Christian; MERKLE, Johannes. Deep Face Representations for Differential Morphing Attack Detection. IEEE Transactions on Information Forensics and Security. 2020, roč. 15, s. 3625–3639. Dostupné online [cit. 2024-12-19]. ISSN 1556-6013. DOI 10.1109/TIFS.2020.2994750. 
  12. a b c d e f g h i OLOYEDE, Muhtahir O.; HANCKE, Gerhard P.; MYBURGH, Hermanus C. A review on face recognition systems: recent approaches and challenges. Multimedia Tools and Applications. 2020-10, roč. 79, čís. 37-38, s. 27891–27922. Dostupné online [cit. 2024-12-19]. ISSN 1380-7501. DOI 10.1007/s11042-020-09261-2. (anglicky) 
  13. a b c ALMABDY, Soad; ELREFAEI, Lamiaa. Deep Convolutional Neural Network-Based Approaches for Face Recognition. Applied Sciences. 2019-10-17, roč. 9, čís. 20, s. 4397. Dostupné online [cit. 2024-12-19]. ISSN 2076-3417. DOI 10.3390/app9204397. (anglicky) 
  14. SANCHEZ DEL RIO, Jose; MOCTEZUMA, Daniela; CONDE, Cristina. Automated border control e-gates and facial recognition systems. Computers & Security. 2016-09, roč. 62, s. 49–72. Dostupné online [cit. 2024-12-19]. DOI 10.1016/j.cose.2016.07.001. (anglicky) 
  15. ZHOU, Jianhang; ZENG, Shaoning; ZHANG, Bob. Linear Representation-Based Methods for Image Classification: A Survey. IEEE Access. 2020, roč. 8, s. 216645–216670. Dostupné online [cit. 2024-12-19]. ISSN 2169-3536. DOI 10.1109/ACCESS.2020.3041154. 

Související články

editovat


Externí odkazy

editovat