ShuffleNet — это семейство компактных сверточных нейронных сетей, созданное для эффективной работы на устройствах с ограниченными вычислительными ресурсами. Его основная область применения связана с мобильным компьютерным зрением: классификацией изображений, детекцией объектов, распознаванием сцен и другими задачами, где важны скорость, низкое энергопотребление и приемлемая точность. Главная идея ShuffleNet заключается в снижении вычислительной нагрузки без полного отказа от выразительности модели. В классических сверточных сетях значительная часть затрат приходится на операции свертки, особенно если модель обрабатывает большое число каналов. ShuffleNet использует групповые свертки и специальную операцию перемешивания каналов, чтобы уменьшить количество вычислений и при этом сохранить обмен информацией между группами признаков. Первая версия ShuffleNet была представлена как альтернатива более тяжелым архитектурам для мобильных процессоров. Групповые свертки позволяют делить каналы на независимые блоки, что резко снижает число операций. Однако у такого подхода есть недостаток: каналы внутри разных групп хуже взаимодействуют друг с другом. Channel shuffle решает эту проблему, переставляя каналы так, чтобы следующие слои получали более разнообразные комбинации признаков. Позже появилась ShuffleNet V2, где авторы сделали акцент не только на количестве операций FLOPs, но и на реальной скорости выполнения на аппаратуре. Это важный момент: две модели с похожим числом арифметических операций могут работать с разной скоростью из-за особенностей памяти, параллелизма и структуры вычислительного графа. ShuffleNet V2 предлагает более практичные правила проектирования легких сетей, включая сбалансированную ширину каналов и уменьшение фрагментации операций. В сравнении с крупными архитектурами ShuffleNet обычно уступает по максимальной точности, особенно на сложных наборах данных и при задачах, требующих глубокого контекстного понимания. Зато он выигрывает там, где нужно быстро обрабатывать изображения прямо на смартфоне, камере, встроенном контроллере или edge-устройстве. Такая архитектура полезна в системах видеонаблюдения, мобильных приложениях, робототехнике и промышленной автоматизации.