WIDER FACE — один из самых известных и востребованных датасетов в области компьютерного зрения, специально разработанный для задач обнаружения лиц. Он был представлен исследователями из Китайского университета Гонконга и быстро стал эталоном, на котором тестируются современные алгоритмы детекции. Его популярность объясняется масштабом, разнообразием и высоким уровнем сложности данных, что делает его идеальной площадкой для проверки устойчивости моделей в реальных условиях. Датасет содержит более 32 тысяч изображений и около 393 тысяч размеченных лиц. Все изображения собраны из открытых источников и охватывают огромный спектр сценариев — от уличных фотографий и спортивных мероприятий до концертов, митингов и торжественных церемоний. Такое разнообразие делает WIDER FACE значительно более сложным по сравнению с предшественниками вроде FDDB или AFW, где условия съёмки были более однородными. Особенностью датасета является его структура по уровням сложности. Изображения распределены по 61 категории событий, а внутри каждой категории данные делятся на три подмножества: Easy, Medium и Hard. Такое деление позволяет оценить, как модель справляется с лицами разного размера, ориентации, освещения и степени перекрытия. Подмножество Hard, в частности, включает в себя крайне мелкие лица, частично закрытые объектами или развёрнутые под нестандартными углами, что ставит перед алгоритмами серьёзные испытания. Разметка в WIDER FACE отличается высокой детализацией. Каждое лицо снабжено ограничивающей рамкой, а также атрибутами, описывающими степень размытости, выражение, наличие очков, позу головы и уровень окклюзии. Эти аннотации позволяют не только обучать детекторы, но и проводить углублённый анализ их слабых мест, выявляя, в каких именно условиях модель допускает ошибки. За годы существования датасет стал основой для разработки и сравнения множества архитектур — от классических подходов вроде SSH и S3FD до современных решений на базе трансформеров и нейросетей с механизмами внимания. Лидерборд WIDER FACE традиционно отражает прогресс всей отрасли: каждый новый метод, претендующий на звание state-of-the-art, обязан показать конкурентные результаты именно здесь, особенно на подмножестве Hard. Помимо чисто академического значения, WIDER FACE активно применяется и в индустриальных разработках. На его основе обучаются модели для систем видеонаблюдения, биометрической аутентификации, модерации контента и пользовательских приложений с автофокусом на лицах. Универсальность данных позволяет создавать решения, способные работать в самых разных условиях эксплуатации.