OpenSMM AI Academy

Понятный AI: от ChatGPT до AI-агентов

Модуль 6

Мультимодальный AI

Ученик пробует изображения, видео, звук, транскрибацию и проверку качества результата.

intermediate

Генерация изображений

Промпт изображения описывает объект, сцену, стиль, кадр и ограничения.

ВидеоТекстПроверкаОбъяснение прощеРефлексияПрактический артефактAI-проверкаУсложнениеPeer review

Генерация видео

Видео требует движения, кадра, длительности и контроля артефактов.

ВидеоТекстПроверкаОбъяснение прощеРефлексияИтог

Работа со звуком

Аудио-пайплайн включает запись, очистку, транскрипцию и summary.

ВидеоТекстПроверкаОбъяснение прощеРефлексияИтог

Транскрибация видео

Транскрипт ценен, когда по нему можно задавать вопросы и принимать решения.

ВидеоТекстПроверкаОбъяснение прощеРефлексияИтог

Проверка качества результата

Качество проверяется по задаче, точности и возможности повторить результат.

ВидеоТекстПроверкаОбъяснение прощеРефлексияИтог