Если вам посчастливилось достать билет на мероприятие в «Мэдисон-сквер-гарден» в Нью-Йорке — скажем, на матч финальной серии НБА, — один из этапов вашего визита будет заключаться в сканировании лица системой распознавания.
Крупные площадки для проведения мероприятий всё чаще внедряют эту технологию. Некоторые, как тот же «Мэдисон-сквер-гарден», используют ее для наблюдения, а некоторые, как «Ситизенс-банк-парк» в Филадельфии, предлагают посетителям опциональный безбилетный вход.
Сфера применения технологии распознавания лиц расширяется, она становится привычнее в повседневной жизни: от общественных автобусов до госучреждений. Администрация транспортной безопасности США развернула новейшие системы на пунктах досмотра во множестве аэропортов. Ведомство сообщает, что система будет использоваться в городах по всей стране, принимающих матчи Чемпионата мира по футболу 2026 года.
Распространение технологии усугубляет обеспокоенность вопросами точности и предвзятости. Однако в своем исследовании в Лаборатории зрения Университета Дейтона я обнаружил, что продвинутые модели глубокого обучения сделали системы распознавания лиц значительно точнее и надежнее. Модели ИИ, обученные на сотнях миллионов изображений лиц, работают с точностью более 99% в контролируемых условиях, таких как смартфоны, аэропорты и пограничные пункты пропуска.
Основы распознавания лиц
Процесс включает три шага: обнаружить лицо на изображении или в видеокадре; создать «слепок» лица, каталогизирующий ключевые черты, включая форму лица и опорные точки — глаза, нос, рот, и зафиксировать текстуру кожи. Затем слепок сравнивается с базой данных, которая может находиться внутри смартфона, в банке или больнице, чтобы подтвердить личность или предоставить доступ.
В физическом мире эти системы быстрее и проще, чем требование показать удостоверение личности. В мире онлайн они проще, чем ввод логина и пароля. Кроме того, распознавание лиц значительно снижает вероятность подделки или мошенничества по сравнению с идентификационными картами и паролями.
Улучшения в технологии стали возможны благодаря целому ряду исследовательских проектов. FaceNet, модель глубокого обучения от Google, усовершенствовала узнавание лиц, частично скрытых на изображениях. DeepFace, знаковая система на основе ИИ от Facebook AI Research, достигла того же высокого уровня верификации, что демонстрируют люди. NeoFace, высокоточный алгоритм от NEC, встроен в Mobile Fortify — мобильную систему, используемую Иммиграционной и таможенной полицией США для установления личности.
Меньше ложных тревог и пропусков
Реальные условия — плохое освещение, неудобный ракурс, экстремальная мимика, маски, очки и низкое качество снимка — всё еще могут ухудшать производительность и приводить к ошибочным опознаниям. Ложноположительные и ложноотрицательные срабатывания — два главных типа ошибок. Ложноположительное — это когда человека неверно сопоставляют с другой личностью в базе. Ложноотрицательное — когда индивида не находят в базе, хотя его изображение там есть.
Ложноположительные ошибки критичнее в приложениях для безопасности. Они способны привести к несправедливым обвинениям, дискриминации или задержанию. В 2025 году 50-летнюю женщину в Теннесси арестовали и продержали в тюрьме полгода из-за ИИ-системы, ошибочно связавшей её с расследованием банковского мошенничества в Северной Дакоте. Ложноотрицательные срабатывания могут заставить власти отказать людям в услугах, которые им положены.
Точность страдает, если модели обучаются на данных, не отражающих реальную демографию. Исследование 2025 года показало: системы, натренированные на публичных базах с нехваткой людей с тёмным тоном кожи, демонстрируют худшую точность. Подобная неосознанная предвзятость обучающих данных ведёт к ошибкам в распознавании женщин, цветных людей, а также очень молодых и пожилых. Согласно одному отчёту, системы, используемые 42 федеральными агентствами США, ложно идентифицировали лица африканского и азиатского происхождения в 10–100 раз чаще, чем белые лица, что иногда приводило к неправомерным арестам.
Точность также падает, когда на людях плотный макияж, а также у маленьких детей и стариков, потому что их ключевые черты меняются быстрее, чем у взрослых людей среднего возраста. Сбалансированность наборов данных за счёт сбора более репрезентативных изображений по возрасту, полу и этносу, а также частое обновление баз способны повысить точность и давать более справедливые результаты. Предварительная корректировка снимков, например изменение яркости, тоже улучшает работу. Люди щурятся в темноте или на очень ярком свету — продвинутое программное обеспечение способно имитировать эту особенность, помогая системе лучше извлекать черты лица.
Полное лицо из частичных данных
Люди неплохо узнают друг друга, даже если часть лица скрыта очками или маской: мозг придаёт большее значение видимым деталям. Если программы научатся тому же, это снизит количество ложных тревог, в том числе когда камеры захватывают лишь фрагмент лица.
Динамика тоже способна прийти на помощь. Трудно мгновенно узнать школьного приятеля, с которым не виделись много лет, но если старый друг улыбнётся, эта перемена в выражении моментально улучшит воспоминание. Исследователи разрабатывают метод, известный как объёмное направленное паттернирование: он улавливает тонкие движения лицевых мышц и моргание век в последовательных кадрах видео, отслеживая смещение опорных точек с течением времени, а также контекст наблюдения, что способно улучшить точность.
Учёные также создают более точные трёхмерные ИИ-системы, фиксирующие геометрию лица, включая контуры глазниц, носа и подбородка. Подобные разработки могут привести к технологиям защиты от подделок, не позволяющим системам попадаться на фальшивые лица, сгенерированные компьютерами и их операторами.
Меньше ошибок в установлении личности
Оставляя в стороне вопросы приватности, кибербезопасности и сохраняющиеся проблемы предвзятости, ясно одно: технология распознавания лиц совершенствуется. А это обещает меньше ошибок — и меньше связанных с ними серьезных последствий.
На пороге бесшовного мира — что ждёт нас завтра
За горизонтом лабораторных тестов вырисовывается реальность, в которой процедура идентификации растворится в воздухе, став незаметной и вездесущей. Уже сегодня инженеры работают над системами, способными узнавать человека по походке и силуэту задолго до того, как он приблизится к камере на расстояние вытянутой руки. Интеграция лидаров, как в новых iPhone, позволит строить карту лица в инфракрасном спектре, не спутав живого человека ни с силиконовой маской, ни с дипфейком на экране ноутбука. Главная революция, однако, произойдет не в «железе», а в философии данных: на смену централизованным базам, наполненным паспортными снимками, приходит федеративное обучение, где модель учится на миллионах устройств, не покидая их пределов. Ваш цифровой слепок останется зашифрованным в чипе телефона, а в момент оплаты или прохода через турникет система лишь получит зашифрованный ответ «да» или «нет», никуда не передавая вашу биометрию. Это обещает мир, в котором кража личности по селфи станет технически бессмысленной, а очередь на паспортном контроле превратится в архаичный ритуал прошлого. Парадоксальным образом, чем совершеннее становится электронный глаз, тем более невидимой и подконтрольной человеку должна становиться сама технология наблюдения.

Ваш комментарий