Как мы разрабатывали систему для распознавания 700 000 человек — кейс российской компании
Один раз в году город, что находится в 80 километрах от Красного моря, наполняется сотнями тысяч людей. Плотный поток прибывших следует определенному маршруту. Речь о Мекке и хадже — известном паломничестве мусульман к главной святыне ислама.
В прошлом году к нам поступил запрос на разработку системы учета и верификации людей в местах массовых мероприятий. Иными словами, нужна недорогая и четко работающая автоматизация на основе искусственного интеллекта и видеоаналитики, которая посчитает всех участников и проследит за их передвижением.
Если быть точнее, необходимо проконтролировать, что все зашедшие в Запретную Мечеть паломники из нее вышли. В Мечеть аль-Харам обязательно стекаются все, совершающие хадж, чтобы помолиться и семь раз обойти Каабу — мусульманскую святыню в виде кубической постройки во внутреннем дворе мечети.
С чем имеем дело?
Уточним немного контекста для понимания уровня сложности решаемой задачи.
Хадж — это порядка 700 тысяч людей одновременно. Паломничество включает в себя строгие правила. В частности, одежда мусульман во время хаджа — ихрам — строго регламентирована.
Мужчины надевают два простых белых покрывала: одно закрывает ноги от бедер до колен, а другое накидывается на левое плечо. Женщины надевают просторные белые одеяния и покрывают голову платком, чтобы видимыми остались только лицо, кисти рук и ступни ног. На практике ортодоксальные мусульманки могут оставлять открытыми только глаза, а мужчины — добавлять элементы европейской одежды, солнечные очки и различные головные уборы.
Мечеть имеет 48 входов: четыре главных с воротами и 44 второстепенных. Именно в мечети находится начальная и конечная точки обязательного маршрута паломника.
Как это выглядит с точки зрения нейронной сети? Сотни тысяч однотипных, схожих между собой геометрических фигур, которые находятся в движении очень плотно друг к другу, не задерживающихся на прикладывании пальцев к считывателю отпечатков и тем более не использующие RFID-пропуски. Часть объектов — без лица, еще часть могут иметь физические недостатки.
Напоминаем задачу для нейронной сети: точно увидеть на картинке объект, отделить его от других тысяч рядом, определить, проследить за ним в двух точках — идентифицировать на входе и узнать на выходе. Раздача средств учета вроде карт доступа или номеров неприемлема как в силу замедления движения и снижения комфорта человека, так и в силу высокой стоимости решения.
Если бы искусственный интеллект был школьником, то учет и верификация паломников во время хаджа стали бы его олимпиадным заданием.