Приветствую тебя дорогой читатель. Если ты открыл это руководство, значит тебе интересно, как создавать видео через ИИ, и что вообще сегодня происходит в этой нише. Небольшое вступление о ИИ моделях и их топ На сегодняшний день безусловным лидером в этой нише является модель Sora 2 от OpenAI. Эта модель поддерживает генерацию видео начиная с 10 секунд и заканчивая 15, 20, и 25 секундами. Более того, она может делать видео с таким уровнем реализма, что это будет неотличимо от реальности. Также в модель легко можно указать разные сцены или ракурсы, чтобы получить видео сделанное не в один дубль. После идет модель Veo 3 от Google. В принципе она может все то, что может Sora, но только если говорить о видео сделанных в один дубль и не более 8 секунд. Топ закрывает модель kling – она умеет делать хорошие видео, но без озвучки. Т.е если делать видео с каким-нибудь персонажем или человеком, который должен будет говорить в видео – то это будет невозможно и не профессионально. Видео можно делать так же до 8 секунд. Поэтому если ваша цель делать качественные видео (будь то мультики, мемы или реалистичные видео приколы) и делать это легко, то самый лучший и единственный вариант - использовать модель Sora 2. Veo, kling и прочие модели по сути нахрен не нужны. В большинстве своем они стоят дороже, качество у них ниже, а возможностей меньше. Что по деньгам и сколько стоят генерации видео Да, к сожалению каждая генерация видео стоит денег. Можно рассматривать любые модели генераций - цены будут колебаться от 50 до 100 рублей за генерацию. Что касается Sora 2 то цена 10 секундного видео колеблется на уровне около 30 рублей если покупать через API без посредников. Что в принципе невозможно для обычных людей. Если через посредников, то цены начинаются от 50 рублей за 10 секунд. 70-80 рублей за 15 секунд. И 120-150 рублей за 20 и 25 секунд. (20 и 25 секунд мало где есть, так как в данный момент эти возможности дорабатываются OpenAI и доступны узкому кругу лиц). В целом, если получать видео, которые соответствуют вашему запросу и ожиданиям с первого раза – это были бы оправданные траты. Но реальность такова, что для хорошего видео, нужно делать несколько генераций. Чем сложнее видео в плане сюжета и происходящих на нем действий, тем больше генераций нужно для идеального варианта. Особенно если нужен максимальный реализм В чем проблема этих нейросетей и почему цена не оправдывает результат К примеру (видео приведенные в пример вы можете посмотреть в моем тик ток или на стене - https://gptml.ru/u/CyberDog На видео где толпа животных врывается в дом или в магазин я тратил в среднем около 30-50 генераций. (И нет, я не тратил на каждое видео в сумме по несколько тысяч рублей, но об этом позже). Видео с младенцами, людьми и отсутствием хаоса и глобального разрушения занимали у меня около 10-20 генераций. На всяких курсах и в официальных руководствах нам втирают – что чем идеальнее промпт, тем лучше будет сгенерированное видео. Чем точнее вы опишите промпт – тем точнее получите качество. Промпт (для тех кто не знал) – это техническое описание или иначе говоря ваш запрос. Т.е мы пишем нейросети: Создай мне видео в реалистичном формате, где машина едет по дороге, у нее отлетают колеса и она начинает взлетать Это является промптом. Так вот. Промпты действительно нужно составлять точно и по определенным критериям. НО! Какой бы точный и правильный промпт вы бы не написали с вероятностью в 99% вы не получите идеальное и даже приблизительно идеальное видео с первого раза. Все эти сказки про – составляйте промпт точнее! Улучшайте промпт! Составляйте грамотное описание! - Это лишь отмазки официалов и посредников, чтобы не возвращать деньги за корявые результаты. Мол виноваты вы, а не нейросети. И об этом мало кто говорит. На самом деле нейросети создающие видео такие же ленивые и глупые, как и текстовые модели по типу ChatGPT и ему подобных. Например - ты составил промпт в стиле максимального реализма, а тебе нейросеть будет пихать объекты на видео уровня – монтаж любителя. Не реалистичные действия, разный цвет вещей и вообще видно, что объект тупо вырезан откуда-то и просто наложен на видео. Или же ты пишешь в промпте – человек или персонаж говорит … (И определенные слова). Нейросеть без проблем может впихать туда свои слова, изменить речь и сделать деревянной мимику рта. Т.е звук идет, а губы не шевелятся. Хотя в промпте все четко указано и про речь, и про мимику и вообще все настолько профессионально и подробно расписано, что хоть кожу рви. И согласитесь, не приятно отдать 50-100 рублей за сырое видео, которое вы нигде не будете использовать. Потому что оно корявое и не соответствует вашим запросам. Как же тогда генерировать максимально дешево Чтобы генерации видео вам выходили в копейки их нужно покупать массово и искать тарифы и сервисы посредников, которые будут полностью покрывать ваши нужды. Ведь экономика проста. Чем больше ты покупаешь генераций, тем дешевле выходит одна генерация. Этот принцип работает и для сервисов посредников. Например если сервис покупает у OpenAI для Sora 2 сразу миллион генераций, будьте уверены они платят гораздо меньше чем 50 рублей, 40 и даже 30 за 1 штуку. Тем самым они могут продавать генерации по более приятной цене. Лично я пользуюсь сервисом https://syntx.ai/ Покупая у них тариф Elite за 5000 рублей в месяц я получаю полный безлимит на генерации видео в Sora 2 и Veo 3. Бонусом идет бесплатный безлимитный доступ к текстовым моделям ChatGPT, Claude, Gemini, Grok и прочим топовым нейросетям (приятно, но по сути кроме ChatGPT они не нужны). Так же безлимитная генерация изображений в модели Sora Image. Проще говоря - за 5000 рублей вы получаете набор инструментов на месяц. И тут уже можно генерировать на полную. Не считая генерации и не боясь, что не хватит денег или вы выйдете за рамки дозволенного бюджета. Любое видео, которое вы придумали, легко можно будет создать и довести до идеала. Поэтому, если ваша цель освоить на полную создание ИИ видео или даже начать зарабатывать на подобных услугах или блогах – это единственный возможный и бюджетный вариант на сегодняшний день. Как оформить подписку Для этого вам необходим аккаунт в телеграме. Сначала открывайте сам сайт Syntx по этой ссылке https://syntx.ai и жмите войти в систему через телеграм. Дальше жмите войти в телеграм (если делаете это все с мобильного телефона) или же телеграм веб (если делаете это все с компьютера). В открывшемся окне присоединяетесь к боту синтакса в телеграм и если видите сообщение со скриншота, то возвращаетесь к ним на сайт и оформляете подписку. Дальше нужно будет нажать на кнопку – купить подписку Выбрать тариф Elite и убрать шильдик с года на месяц. Так же выбрать 0 токенов, чтобы цена была 5 тысяч. Либо оставить с токенами и переплатить 1000 рублей, чтобы проверить дополнительные услуги сервиса или генерировать видео длительностью 15 и более секунд (безлимит действует только на видео 10 секунд в Sora 2 и видео до 20 секунд в Sora первой версии). Покупка токенов по желанию. После этого выбираете способ оплаты и через несколько минут ваша подписка будет активирована. Работать вы можете несколькими способами. Через ПК в веб версии, через телефон в официальном приложении либо же через телефон в веб версии или через телеграм. Для меня самое удобное это через мобильное приложение. Оплата подписки доступна только через приложение или веб версию. Скачать приложение на телефон можно с веб-версии сайта. Итак, когда подписка у вас готова. Можно начинать делать видео. Но сначала проведу небольшой экскурс по интерфейсу и инструментам, которые вам доступны. Экскурс по платформе Вызвав главное меню по специальной кнопке вы увидите 5 главных разделов. Это: 1. GPT агенты2. Текст3. Дизайн 4. Видео 5. Аудио GPT Агенты В GPT агентах можно создать своего GPT помощника ориентированного под любые задачи. Т.е это будет персональный чат с ChatGPT, который будет работать с вами по заранее составленному плану и стилю общения. Его можно использовать, как например – промпт-инженера для ваших видео или в целом как помощника по вдохновению. Чтобы создать своего агента действуем по следующей схеме: 1. Выбираем создать нового агента 2. Заполняем поля - название агента (любое название, которое хотите. Например Джарвис, Олег, Оля и тому подобное). Описание (это строка для вас. Опять же можете описать – например агент для создания промптов к видео). Системные инструкции (тут пишем следующее. Промпт-инженер работающий в сфере создания видео промптов для Sora 2, Sora, Veo 3. Опыт работы 10 лет. Детальное и последовательное описание всех действий, которые происходят на видео по моим инструкциям). Стиль ответа (Грамотный и последовательный стиль составления промптов и дружелюбное общение). Все галочки ниже лучше оставить включенными. Чтобы если вдруг вы захотите создать картинки для генерации видео или сгенерировать песни для них, бот мог без труда взять технологию составления промптов для видео и применить ее на другом виде контента. Так же можете дополнительно загрузить туда любые книги, пдф обучения или сторонние руководства по созданию промптов. В данном случае я советую туда загрузить эту книгу (она бесплатная) https://www.litres.ru/book/professor-33609013/gptml-spravochnik-po-prompt-inzhiniringu-72685729/ 3. Жмем кнопку создать и получаем своего чат бота. Дополнительно вы можете скормить ему промпты для видео, в стиле которых вы планируете сами создавать контент. Например, если у вас в планах создавать реалистичные видео более менее похожие на те, что вы видели у меня на канале, то вы можете взять все мои промпты, которые я периодически выкладываю бесплатно в свой блог – https://gptml.ru/u/CyberDog Берите все промпты и отправляйте их в своего чат агента как примеры того, как описываются промпты для ваших будущих видео. Текст Этот раздел по сути то же самое что и общение со своим GPT агентом. Только в данном случае вы здесь можете создавать чаты со всеми топовыми моделями. ChatGPT, Claude, Gemini, Grok, DeepSeek, Perplexity. И разные версии этих моделей. Для этого выбираете нейронку которая вам нужна и открываете с ней диалог. Так же обратите внимание на 2 иконки в диалоге. Одна из них открывает настройки чата, где можно выбрать модель и узнать цену (в нашем случае она будет 0 токенов). Другая открывает список ваших диалогов в этом текстовом инструменте. Тут вы можете создавать бесконечное количество чатов с разными нейронками или переключаться между созданными чатами. Иконки как на скриншоте 2 присутствуют в диалогах во всех дальнейших инструментах (картинки, видео, аудио). Поэтому, когда в дальнейшем вы будете лазить и тестировать инструменты, обязательно смотрите цену этого инструмента (как на скрине, где написано 0 токенов). Если у вас написано 0 токенов, значит на этот инструмент у вас безлимит. Дизайн В этой вкладке находятся нейронки, которые генерируют картинки. По сути все они платные, кроме Sora Image. На него у вас безлимит в рамках тарифа Elite. Эта нейронка считается одной из топовых по генерации изображений и умеет делать картинки и фотографии профессионального уровня. На скрине ниже вы можете увидеть, что вам доступно 3 размера для генерации 3:2 (он же 16:9) 1:1 (квадратные картинки) 2:3 (он же 9:16). Так же обратите внимание на модели выделенные желтым цветом на скрине выше. (это значит что данный инструмент на обновлении). Поэтому если вдруг вы увидите что Sora Image или любой другой нужный вам инструмент выделен этим цветом и недоступен – не пугайтесь. Попробуйте вернуться через несколько часов, и вероятно он уже будет доступен. В общем, выбираете формат изображения, вставляете промпт (если нужно то добавляете к промпту фотографии или картинки в качестве референсов) и отправляете. Через пару минут получаете сгенерированное изображение. Видео Здесь вам доступно 3 топовых моделей для безлимитных генераций. Sora 2 (видео 10 секунд) Sora (видео 5, 10, 15, 20 секунд) и Google Veo 3.1 Так же выбираем в разделе видео нужную нейронку. Открываем с ней чат и выбираем настройки. Для Соры выбираем сора. В меню модель можно переключаться между Sora 1 и Sora 2. Когда меняете длительность генерируемого видео обязательно смотрите чтобы цена была 0 токенов. Качество к сожалению возможно только 720р на безлимитном тарифе, но после генерации его можно будет улучшить до 1080р бесплатно. Но об этом позже. Так же выбираете соотношение сторон вашего видео это либо 9:16 в формате рилсов и шортсов, либо 16:9 в формате широкоугольных видео. Дальше вставляете промпт или промпт + картинка и спустя несколько минут получаете сгенерированное видео. Для вео тут немножко иначе. Вам в разделе модель надо выбрать Veo 3.1 Fast Relax и указать режим. Их 3. Видео по текстовому промпту. Видео по промпту + картинка. Видео по промпту плюс несколько картинок. 3 режим нужен для видео превращений. Наверняка вы видели видео, как кот превращается в тигра или наоборот. Т.е тут работает режим первый кадр – последний кадр. Все что происходит между первым и последним кадром генерирует нейронка. Аудио В принципе полностью бесполезный раздел в котором нет безлимита ни на что. В приложении и на веб-версии есть 2 инструмента, платных. Суно (нейронка для генерации песен) в синтаксе платно. И видео в аудио (который по факту является аудио в видео). Т.е вы можете вставить любое видео без звука и согласно описанию этого инструмента туда сгенерируется подходящий звук. Тоже за кредиты. Инструмент этот пробовал и могу сказать, что это полная лажа! Так же в телеграм боте синтакса предоставляется озвучка. Текст в аудио с выбором голосов и переозвучка аудиофайла на другой голос. Это все стоит кредитов, причем много. А переозвучка аудио на другой голос работает коряво и искажает голос. В общем, что касается аудио, то синтакс здесь я использовать крайне не рекомендую. 1. Суно. Если вы захотите сгенерировать песню, то лучше сделать это в самом суно. Там бесплатный тариф позволяет генерировать до 20 песен в день. Бесплатно! Сделать это можно по ссылке https://suno.com/ 2. Озвучка. Вся озвучка синтакса подключена к елевен лабс. И накинута наценка на это примерно х20. Элевен лабс это самая переоцененная нейросеть по озвучке. И кстати даже переозвучка готового аудиофайла на определенный голос у них отсутствует. Хотя даже в том же самом синтаксе она есть, хоть и корявая. Озвучку вы можете делать тут - https://voispark.com При регистрации даются кредиты для бесплатной озвучки, которой хватит примерно на 15 минут. Если есть гугл аккаунты, регистрируйтесь, бесплатно юзайте кредиты в 0 и так по кругу. Есть много голосов. Иностранные голоса спокойно могут разговаривать по-русски. Есть возможность переозвучить аудио выбранным голосом из каталога и работает это намного лучше чем у синтакса. Если нужен клон голоса, то тут его тоже можно сделать, правда уже на платном тарифе и стоить это будет дешевле, чем у синтакса, который берет около 30 рублей за 1 минуту озвучки. При этом обязательно должна быть активна подписка, иначе ваши кредиты будут просто пустышкой. В общем как я и сказал выше, синтакс идеален в плане видео и картинок, но до безобразия ужасен в плане озвучек. Как генерировать видео по шагам Итак, например я хочу сгенерировать видео, где мужчина в панике забегает в магазин магнит, орет – Нам всем крышка! Спасайтесь! и по моей любимой традиции за ним забегает огромная орда животных. Пусть это будут – волки, олени, курицы, гиены и парочка слонов. Животные забегают в магазин, снося все на своем пути по очереди, а когда забегает слон, он подскальзывается и падает лицом вниз, проскальзывая мордой по полу. Я просто беру вот это вот описание, которое вам только что сказал и вставляю его в диалог в ChatGPT в синтакс, который у меня отвечает за создание реалистичных промптов. Через несколько секунд я получил готовый промпт по всем правилам, которые были уже обговорены с чатджпт при создании чата. И полученный промпт я отправил в Sora 2. Спустя 3 минуты я получил готовое видео. Разумеется, меня оно не удовлетворило, и я отправил его на перегенерацию нажатием кнопки повторить, так же выделенной на скрине ниже. На момент написания этого мануала и создания идеального варианта этого видео я потратил 17 генераций. Что заняло у меня около 1 часа по времени. Результат сможете посмотреть на моем канале в тик ток. Промпт для этого видео выглядил так: Читать его весь не нужно. Отсюда вы должны только понять, что промпт для видео это большое объемное описание действий и характеристик написанных на английском языке. По-русски пишется только речь, которую кто-то кричит или говорит в видео. Format: CCTV security camera footage, 9:16, 1080p. Style: Ultra-realism. Everything must look, move, and behave exactly as in real life, with perfect material physics, lighting, human and animal body mechanics, environmental reactions, sound, and chaos. No stylization or digital artifacts. Location: Authentic Russian “Magnit” supermarket entrance. Wide automatic glass doors, checkout area, shopping carts, branded price tags, promo stands, product shelves, fluorescent lights, tile floor. Camera: fixed high, wide angle, showing the full entrance and several meters inside. Audio: Genuine mono CCTV mic — doors sliding, footsteps, echoing speech, glass, plastic, fur, feathers, trampling, naturalistic roars/calls, objects breaking, authentic human panic, all as a single documentary recording. Scene Description: - Camera: Static, wide, high in the store corner, capturing the entrance and interior. - Sudden panic: a man runs into the frame, out of breath, wild with fear, eyes wide. He shouts at the top of his lungs, in Russian: "Нам всем крышка! Спасайтесь!" — the camera picks up his raw, echoing voice clearly. - Without pause, a massive, realistic stampede begins in sequence: - First, a pack of large, true-to-life wolves bursts through the doors, claws tapping across tile, pushing aside baskets, snarling, and scattering shoppers. - Next, a group of deer bounds in, hooves slipping on the smooth floor, some bumping baskets and knocking over stands as they zigzag through the crowded entry. - Then, a chaotic mob of chickens surges inside, flapping and clucking, feathers flying, rushing through legs and under carts, pecking and scattering loose produce. - A large pack of hyenas barrels through next, yelping and laughing, crashing into displays and promo stands, scattering goods with their scrambling feet. - Finally, two massive elephants burst inside. One elephant immediately loses its balance on the slick tile floor, slips, and falls with its face and trunk sliding across the ground, knocking over shopping carts, shelves, and product stands, causing a spectacular wave of debris and chaos. - Pieces of plastic, food, feathers, dust, packaging, and products fly through the air with total physical realism. People scream and sprint away; some drop their phones or bags as they dodge the stampede. Store staff try to run or dive for cover. Every reaction (movement, face, gesture) is purely realistic — never exaggerated or artificial. - Animals interact accurately with all surfaces: claws, hooves, paws, and feathers respond to friction, collisions, and gravity as in a real documentary. Lighting and sound fit a genuine “Magnit” supermarket. - All destruction, displacement, and animal/human movements render with perfect everyday physics: shelves bending or toppling, baskets rolling, food and wrappers flying, feathers scattering, fractured promo stands, glass and plastic snapping or shattering with each impact. - Lighting: stark fluorescent, bright, casting bold supermarket shadows and reflections on tiles and glass; dust and particles swirl where chaos is greatest. - Audio: all echoes, animal calls, metal, packaging, furniture and panicked voices are seamless and naturally mono-mixed, exactly as real security audio. Camera: One single, unmoving, continuous shot, no zoom, no edits, overlays, or special effects. Hyper-realistic viral CCTV footage — as if captured raw in a real summer day emergency. Summary (for inspiration): Near the “Magnit” supermarket entrance, a terrified man bursts in, yells “Нам всем крышка! Спасайтесь!”, immediately followed by a strictly ordered stampede: wolves, deer, chickens, hyenas, and finally two elephants (one crashing and sliding face-first across the entrance) devastate the store, crushing shelves, scattering goods and people, in an unbroken, perfectly documentary-realistic sequence. Итог и поддержка Итак, вы прочитали это руководство, ознакомились с платформой синтакс и решили действовать… Что вам для этого нужно. Отвечаю еще раз, кратко и по шагам. 1. Определитесь с темой видео которые вы хотите создавать. Вариантов тут бесчисленное множество. И они не ограничены 10 секундами. Наверняка вы уже видели в тиктоке или в ютубе много роликов сделанные через ИИ. Например такие:https://www.tiktok.com/@eyesfromhistory?_r=1&_t=ZT-91mOCTSReo9 https://www.tiktok.com/@lifeeko?_r=1&_t=ZT-91mO38x67Fvhttps://www.tiktok.com/@sun_arsen?_r=1&_t=ZT-91mO8PnuJZNhttps://www.tiktok.com/@chimpvlogofficial?_r=1&_t=ZT-91mOPDgJzA5https://www.tiktok.com/@a.ainsanov?_r=1&_t=ZT-91mOPdunrn4https://www.tiktok.com/@zacktyanka?_r=1&_t=ZT-91mOapDj44d Или просто 10-20 секундные приколы, все это можно генерировать через Sora 2 и Veo 3. Причем делать это сколько угодно всего-лишь в рамках одной подписки. Да хоть мультики или аниме создавать. Все это упирается лишь в ваше желание… 2. Придумать несколько идей для ваших первых видео и найти похожие. 3. Подготовить своего GPT агента для создания промптов и составить стратегию создания. Например, если у вас видео будут с одним и тем же персонажем, нужно будет нагенерировать картинки с подобрать подходящий голос под озвучку. Если персонажи будут разные, то доп озвучка не обязательна 4. Купить подписку тарифа Elite – запастись свободным временем и желанием 5. Начать действовать. Ну а если у вас остались вопросы или необходима поддержка и помощь в составлении стратегии или первых генераций вы всегда можете обратиться ко мне за поддержкой в телеграм - @adporob P.S я не возьму с вас денег и ничего не буду продавать вам. Поддержка бесплатная и я с радостью отвечу вам и помогу в порядке очереди и как будет свободное время. Помогу выработать стратегии, объясню то, что вам осталось не понятно и даже помогу составить промпты, к вашим первым видео. С вами был Кибер Пёс (Илья). Всем удачи и до встречи!