Nvidia представила Granary — крупнейший открытый датасет для распознавания и перевода речи в Европе

Компания Nvidia анонсировала масштабный проект — Granary. Это открытый датасет для обучения систем искусственного интеллекта задачам распознавания и перевода речи. Инициатива закрывает ключевой пробел в индустрии - качественных речевых корпусов для европейских языков катастрофически не хватало. 📊 Масштаб данных поражает: Теперь у ИИ будет что послушать — хватит даже для бесконечных «подкастов в пустоту». 🌍 Лингвистическое покрытие: Granary включает все 24 официальных языка ЕС, а также русский и украинский. Более того, впервые на таком уровне представлены «редкие» языки вроде хорватского, эстонского и мальтийского. Для них раньше попросту не существовало промышленных датасетов — теперь это упущение закрыто. 🤝 Кто помогал Nvidia: К разработке подключились исследователи из Университета Карнеги-Меллона и Фонда Бруно Кесслера. Совместная работа позволила собрать и обработать огромный массив открытых аудиозаписей. ⚙️ Технологическая основа: За обработку данных отвечает NeMo Speech Data Processor — инструмент, который превращает неструктурированные записи в удобный для машинного обучения формат. Это снижает необходимость ручной разметки и экономит ресурсы. Granary может стать катализатором для прорыва в сфере распознавания и перевода речи на европейских языках. Теперь даже редкие языковые группы получат «голос» в мире ИИ, а разработчики смогут создавать более точные и универсальные модели. 💬 Можно сказать, что Nvidia решила устроить «европейский караоке-марафон для ИИ» — и теперь у нейросетей точно не будет отмазки, что они «не понимают по-мальтийски».