Sora文生视频发布，多模态大模型成生成式AI重点方向，向通用人工智能迈进。-ReadCai

要点：
1. Sora文生视频模型发布，能够用文本指令生成视频，具有惊人效果，促进大模型厂商加大对多模态大模型研发投入。

2. 多模态大模型能够同时处理文本、图片、音频、视频等多类信息，与人类交互方式更加灵活，表现得更加智能，有望推动AI迈向通用人工智能（AGI）。

3. Sora的发布将促使多模态大模型成为生成式AI的重点发展方向，未来人机交互将通过文字、视觉、语音等多维度沟通，进而提升效率，逐渐向AGI方向迈进。

4. Sora适用于短视频、广告、互娱、影视、媒体等领域，可辅助人类员工生成视频，提高生产速度和数量，创造全新视觉感受，实现降本增效、提升用户体验。

5. AI视频对算力的需求呈几何式增长，算力限制是影响文生视频类应用开放使用的重要因素。

6. 多模态大模型对算力的消耗更高，算力可获取性和成本是挑战之一。

7. 2023年文生视频大模型数量达到数十个，全球用户数量超百万级别，但多数视频模型仍处于产品早期阶段。

Sora文生视频发布，多模态大模型成生成式AI重点方向，向通用人工智能迈进。