новости

сора устарела? «сильнейшая видеомодель меты» не использует dit, а использует llama, чтобы творить чудеса

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

автор|ван чжаоян

в тот момент, когда главный технический руководитель openai сора обратился в google и во многих отчетах указывалось, что у openai sora возникли проблемы с внутренним качеством, meta бесцеремонно выпустила свою видеомодель «movie gen» и напрямую использовала полную систему оценки. он победил сору.

что еще более жестоко, так это то, что мета также «убивает людей». хотя эта модель не является открытой для публики, как сора, она подготовила 95-страничный технический отчет о новой модели (не в открытом доступе, но содержит много подробностей). ) публично и сказал всем:

эта модель не только фактически победила сору, но и использовала новый технический маршрут, что доказало, что технический маршрут соры на сегодняшний день уже не является самым продвинутым.

дорогие видеоплееры vincent, пожалуйста, не «копируйте» сору.

1

«модель медиа-постамента»

если быть точным, meta выпустила серию моделей, комбинацию, созданную для достижения «медиаконтента, генерируемого искусственным интеллектом». это также означает название данного технического документа: «поколение кино: состав моделей media foundation».

в этот набор входят:

самая крупная базовая модель поколения gen video, movie gen video, имеет 30 миллиардов параметров.

самая крупная базовая аудиомодель генерации видео, movie gen audio, имеет 13 миллиардов параметров.

персонализированное видео movie gen, полученное в результате дальнейшего обучения модели movie gen video, используется для создания персонализированных видеороликов на основе отдельных лиц. и новый процесс постобучения, который генерирует movie gen edit для точного редактирования видео.