Facebook Creates Software That Matches Faces Almost as Well as You Do | MIT Technology Review
Facebook maakt software die overeenkomt met Gezichten Bijna net zo goed als jij
Nieuwe AI onderzoeksgroep Facebook meldt een belangrijke verbetering in de face-processing software.
- Door Tom Simonite op 17 maart 2014
Waarom dat van belang
Vooruitgang in de relatief nieuwe kunstmatige intelligentie gebied bekend als diep leren kon fundamenteel te hervormen wat computers kunnen doen.
Gevraagd of twee onbekende foto's van gezichten tonen dezelfde persoon, zal een mens het goed 97,53 procent van de tijd. Nieuwe software die is ontwikkeld door onderzoekers van Facebook kan 97,25 procent scoren op dezelfde uitdaging, ongeacht variaties in de verlichting of dat de persoon op de foto wordt direct geconfronteerd met de camera.
Dat is een belangrijke stap vooruit ten opzichte van vorige face-matching software, en het toont de kracht van een nieuwe benadering van kunstmatige intelligentie bekend als diep leren, die Facebook en zijn concurrenten zwaar op zijn inzet in het afgelopen jaar (zie "Deep Learning"). Dit gebied van AI omvat software die netwerken gesimuleerde neuronen gebruikt leren patronen in grote hoeveelheden data te herkennen.
"Je normaal niet ziet dat soort verbetering", zegt Yaniv Taigman, een lid van Facebook's AI team, een onderzoeksgroep opgericht vorig jaar om te onderzoeken hoe diep leren zou kunnen helpen het bedrijf (zie "Facebook lanceert geavanceerde AI inspanning"). "Wij werken nauw benaderen menselijke prestaties", zegt Taigman van de nieuwe software. Hij merkt op dat het foutenpercentage is verminderd met meer dan een kwart ten opzichte van eerdere software die op dezelfde taak kan nemen.
Hoofd beurt: DeepFace maakt gebruik van een 3-D model om gezichten te draaien, bijna, zodat ze het gezicht van de camera. Afbeelding (a) geeft het oorspronkelijke beeld, en (g) toont de uiteindelijke gecorrigeerde versie.
Nieuwe software Facebook, bekend als DeepFace, presteert wat de onderzoekers noemen gezicht verificatie (het erkent dat twee beelden tonen hetzelfde gezicht), niet gezichtsherkenning (het zetten van een naam aan een gezicht). Maar sommige van de onderliggende technieken kunnen worden toegepast op dat probleem, zegt Taigman, en zou daarom verbeteren de nauwkeurigheid van Facebook op suggereren die gebruikers moeten taggen in een nieuw geüploade foto.
Echter, DeepFace blijft puur een onderzoeksproject voor nu. Facebook bracht een onderzoek papier aan het project van vorige week, en de onderzoekers zal het werk in de huidige IEEE-conferentie over Computer Vision en Pattern Recognition in juni. "Wij publiceren onze resultaten om feedback te krijgen van het onderzoek gemeenschap", zegt Taigman, die DeepFace ontwikkeld samen met Facebook collega Yang Ming en Marc'Aurelio Ranzato en Tel Aviv University professor Lior Wolf.
DeepFace verwerkt afbeeldingen van gezichten in twee stappen. Eerst corrigeert de hoek van een gezicht zodat de persoon in het beeld naar voren gericht, met een 3-D-model van een "gemiddelde" forward-looking gezicht. Dan komt de diepe leren in een gesimuleerde neuraal netwerk werkt een numerieke beschrijving van de geheroriënteerd gezicht. Als DeepFace komt met soortgelijke genoeg beschrijvingen van twee verschillende beelden, hij beslist dat ze moeten hetzelfde gezicht te laten zien.
De prestaties van de uiteindelijke software werd getest tegen een standaardgegevens die onderzoekers gebruiken om referentie face-processing software, die ook is gebruikt om te meten hoe mensen tarief op bijpassende gezichten.
Neeraj Kumar, een onderzoeker aan de Universiteit van Washington, die heeft gewerkt aan het gezicht verificatie en erkenning, zegt dat de resultaten van Facebook laten zien hoe het vinden van voldoende gegevens te voeden in een groot neuraal netwerk kunnen zorgen voor een aanzienlijke verbetering van de machine-learning software. "Ik zou wedden dat een groot deel van de winst komt hier van wat diep leren over het algemeen biedt: de mogelijkheid om grote hoeveelheden data buiten benutten in een veel hogere capaciteit leermodel," zegt hij.
The deep-learning deel van DeepFace bestaat uit negen lagen van eenvoudige gesimuleerde neuronen, met meer dan 120 miljoen verbindingen daartussen. Met dat netwerk te trainen, onderzoekers Facebook tikte een klein stukje van de gegevens van de schat van de gebruiker beelden-vier miljoen foto's van gezichten die tot bijna 4000 mensen van hun bedrijf. "Omdat ze toegang tot tal van gegevens van dit formulier hebben, kunnen ze met succes een high-capacity model te trainen", zegt Kumar.
Source: www.technologyreview.com