Исследовательское подразделение Seed Team компании ByteDance представило новое семейство больших языковых моделей Seed-OSS-36B. Главное достижение — рекордное контекстное окно в 512 тысяч токенов. Это значит, что модель может «держать в голове» огромные объемы текста. Целые книги, базы данных или корпоративные документы. Другими словами, она наконец-то может дочитать «Войну и мир» без закладок. 📖 Для сравнения - GPT-4 ограничен максимум 128 тысячами. Две версии для разных задач Линейка Seed-OSS-36B разделена на несколько конфигураций: Такое архитектурное разнообразие позволяет Seed-OSS-36B закрывать сразу несколько сегментов. От научных исследований и прототипирования до реальных промышленных внедрений. Выход Seed-OSS-36B от ByteDance показывает, что Китай серьезно намерен конкурировать на рынке больших языковых моделей. Если раньше основное внимание было приковано к OpenAI и Anthropic, то теперь в игру активно входит и ByteDance, предлагая не только открытый доступ, но и технические преимущества.