你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Sora 是 OpenAI 的 AI 模型,它基于文本说明和/或输入图像或视频创建真实和富有想象力的视频场景。 模型可以生成广泛的视频内容,包括逼真的场景、动画和特殊效果。 它支持多个视频分辨率和持续时间。
支持的功能
Sora 可以生成具有多个角色、多种动态和详细背景的复杂场景。
文本转视频:模型结合对上下文和现实场景的理解来解释提示,从而实现精准的场景构建,并确保角色在多个镜头中保持一致性。 Sora 展示了强大的语言理解能力,能够精准解析提示词并生成富有情感表现力的角色。
图像到视频:Sora 从静止图像生成视频内容。 可以指定图像在生成视频中的显示位置(不一定是第一帧),以及要使用图像的哪个区域。
视频转视频:Sora 可以根据现有视频剪辑生成新的视频内容。 可以在生成的视频中指定输入视频的显示位置(它不需要是开头)。
工作原理
视频生成是一个异步过程。 使用文本提示和视频格式规范创建作业请求,模型在后台处理请求。 可以检查视频生成作业的状态,完成后,通过下载 URL 检索生成的视频。
提示的最佳做法
以英语或其他拉丁语脚本语言编写文本提示,以获得最佳视频生成性能。
局限性
内容质量限制
Sora 在理解复杂的物理学、因果关系(例如饼干上的咬痕)、空间推理(例如区分左右)以及精确的基于时间的事件顺序(例如相机移动)方面可能会遇到困难。
技术限制
Sora 有一些技术限制需要注意:
- Sora 支持以下输出分辨率尺寸:480x480、480x854、854x480、720x720、720x1280、1280x720、1080x1080、1080x1920、1920x1080。
- Sora 可以制作长达 1 到 20 秒的视频。
- 可以在单个作业中请求多个视频变体:对于 1080p 分辨率,此功能处于禁用状态;对于 720p,最大值为两个变体;对于其他分辨率,最大值为四个变体。
- 可以同时运行两个视频创建作业。 必须先等待其中一个作业完成,然后才能创建另一个作业。
- 作业在创建后最多 24 小时可用。 之后,必须创建新作业才能再次生成视频。
- 最多可以使用两个图像作为输入(生成的视频将内容插在它们之间)。
- 最多可以使用一个视频 5 秒作为输入。
负责任的人工智能
Sora 具有可靠的安全堆栈,包括内容筛选、滥用监视、敏感内容阻止和安全分类器。
索拉不会生成包含暴力行为的场景,但可以生成相关内容,例如逼真的战争画面。