你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

使用 Sora 生成视频（预览版）

Sora 是 OpenAI 的 AI 模型，它基于文本说明和/或输入图像或视频创建真实和富有想象力的视频场景。模型可以生成广泛的视频内容，包括逼真的场景、动画和特殊效果。它支持多个视频分辨率和持续时间。

支持的功能

Sora 可以生成具有多个角色、多种动态和详细背景的复杂场景。

文本转视频：模型结合对上下文和现实场景的理解来解释提示，从而实现精准的场景构建，并确保角色在多个镜头中保持一致性。 Sora 展示了强大的语言理解能力，能够精准解析提示词并生成富有情感表现力的角色。

图像到视频：Sora 从静止图像生成视频内容。可以指定图像在生成视频中的显示位置（不一定是第一帧），以及要使用图像的哪个区域。

视频转视频：Sora 可以根据现有视频剪辑生成新的视频内容。可以在生成的视频中指定输入视频的显示位置（它不需要是开头）。

视频生成是一个异步过程。使用文本提示和视频格式规范创建作业请求，模型在后台处理请求。可以检查视频生成作业的状态，完成后，通过下载 URL 检索生成的视频。

以英语或其他拉丁语脚本语言编写文本提示，以获得最佳视频生成性能。

Sora 在理解复杂的物理学、因果关系（例如饼干上的咬痕）、空间推理（例如区分左右）以及精确的基于时间的事件顺序（例如相机移动）方面可能会遇到困难。

Sora 有一些技术限制需要注意：

Sora 支持以下输出分辨率尺寸：480x480、480x854、854x480、720x720、720x1280、1280x720、1080x1080、1080x1920、1920x1080。
Sora 可以制作长达 1 到 20 秒的视频。
可以在单个作业中请求多个视频变体：对于 1080p 分辨率，此功能处于禁用状态;对于 720p，最大值为两个变体;对于其他分辨率，最大值为四个变体。
可以同时运行两个视频创建作业。必须先等待其中一个作业完成，然后才能创建另一个作业。
作业在创建后最多 24 小时可用。之后，必须创建新作业才能再次生成视频。
最多可以使用两个图像作为输入（生成的视频将内容插在它们之间）。
最多可以使用一个视频 5 秒作为输入。

Sora 具有可靠的安全堆栈，包括内容筛选、滥用监视、敏感内容阻止和安全分类器。

索拉不会生成包含暴力行为的场景，但可以生成相关内容，例如逼真的战争画面。

此页面是否有帮助？