你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Projects - List Datasets

获取指定项目的数据集列表。

GET {endpoint}/speechtotext/v3.2-preview.2/projects/{id}/datasets
GET {endpoint}/speechtotext/v3.2-preview.2/projects/{id}/datasets?skip={skip}&top={top}&filter={filter}

URI 参数

名称 必需 类型 说明
endpoint
path True

string

支持的认知服务终结点(协议和主机名,例如:https://westus.api.cognitive.microsoft.com)。

id
path True

string (uuid)

项目的标识符。

filter
query

string

用于选择可用数据集子集的筛选表达式。

        - Supported properties: displayName, description, createdDateTime, lastActionDateTime, status, locale, kind.

        - Operators:

          - eq, ne are supported for all properties.

          - gt, ge, lt, le are supported for createdDateTime and lastActionDateTime.

          - and, or, not are supported.

        - Example:

          filter=createdDateTime gt 2022-02-01T11:00:00Z
skip
query

integer (int32)

将跳过的数据集数。

top
query

integer (int32)

跳过后将包含的数据集数。

响应

名称 类型 说明
200 OK

PaginatedDatasets

还行

标头

Retry-After: integer

Other Status Codes

Error

发生错误。

安全性

Ocp-Apim-Subscription-Key

在此处提供认知服务帐户密钥。

类型: apiKey
在: header

Authorization

提供来自此区域的 STS 返回的 JWT 的访问令牌。 通过将以下查询字符串添加到 STS URL,确保将管理范围添加到令牌: ?scope=speechservicesmanagement

类型: apiKey
在: header

示例

Get all datasets

示例请求

GET {endpoint}/speechtotext/v3.2-preview.2/projects/abc46f33-90b8-443d-adad-4870517356e0/datasets?skip=0&top=2&filter=createdDateTime%20ge%202018-01-24T09:54:39Z

示例响应

{
  "values": [
    {
      "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
      "kind": "Acoustic",
      "contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
      "links": {
        "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
      },
      "properties": {
        "textNormalizationKind": "Default",
        "acceptedLineCount": 11,
        "rejectedLineCount": 2,
        "duration": "PT4M12S"
      },
      "lastActionDateTime": "2019-01-07T11:36:07Z",
      "status": "Succeeded",
      "createdDateTime": "2019-01-07T11:34:12Z",
      "locale": "en-US",
      "displayName": "Acoustic dataset"
    },
    {
      "self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/cdc91c24-3972-496d-a12f-209c35f4cc6c",
      "kind": "Language",
      "contentUrl": "https://www.contoso.com/LanguageData/SourceLocation",
      "links": {
        "files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/cdc91c24-3972-496d-a12f-209c35f4cc6c/files"
      },
      "properties": {
        "textNormalizationKind": "Default",
        "acceptedLineCount": 11,
        "rejectedLineCount": 2
      },
      "lastActionDateTime": "2019-01-07T11:36:07Z",
      "status": "Succeeded",
      "createdDateTime": "2019-01-07T11:34:12Z",
      "locale": "en-US",
      "displayName": "Language dataset"
    }
  ],
  "@nextLink": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets?skip=2&top=2&filter=createdDateTime%20ge%202018-01-24T09:54:39Z"
}

定义

名称 说明
Dataset

数据集

DatasetKind

DatasetKind

DatasetLinks

DatasetLinks

DatasetProperties

DatasetProperties

DetailedErrorCode

DetailedErrorCode

EntityError

EntityError

EntityReference

EntityReference

Error

错误

ErrorCode

ErrorCode

InnerError

InnerError

PaginatedDatasets

PaginatedDatasets

Status

状态

TextNormalizationKind

TextNormalizationKind

Dataset

数据集

名称 类型 说明
contentUrl

string (uri)

数据集数据的 URL。

createdDateTime

string (date-time)

创建对象的时间戳。 时间戳编码为 ISO 8601 日期和时间格式(“YYYY-MM-DDThh:mm:ssZ”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations)。

customProperties

object

此实体的自定义属性。 允许的最大密钥长度为 64 个字符,允许的最大值长度为 256 个字符,允许的条目计数为 10。

description

string

对象的说明。

displayName

string

minLength: 1

对象的显示名称。

kind

DatasetKind

DatasetKind
数据导入的类型。

lastActionDateTime

string (date-time)

输入当前状态时的时间戳。 时间戳编码为 ISO 8601 日期和时间格式(“YYYY-MM-DDThh:mm:ssZ”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations)。

links

DatasetLinks

DatasetLinks

locale

string

minLength: 1

包含数据的区域设置。

project

EntityReference

EntityReference

properties

DatasetProperties

DatasetProperties

self

string (uri)

此实体的位置。

status

Status

状态
描述 API 的当前状态

DatasetKind

DatasetKind

说明
Language

语言数据集。

Acoustic

声学数据集。

Pronunciation

发音数据集。

AudioFiles

音频文件数据集。

LanguageMarkdown

语言 markdown 数据集。

OutputFormatting

包含用于自定义反向文本规范化、大写、重整、亵渎以及定义数据集验证测试的数据集

DatasetLinks

名称 类型 说明
commitBlocks

string (uri)

使用块上传数据集时提交块列表的位置。 有关详细信息,请参阅作“Datasets_CommitBlocks”。

files

string (uri)

获取此实体的所有文件的位置。 有关详细信息,请参阅作“Datasets_ListFiles”。

listBlocks

string (uri)

使用块上传数据集时列出此实体已上传块的位置。 有关更多详细信息,请参阅作“Datasets_GetBlocks”。

uploadBlocks

string (uri)

使用块上传数据集时要上传到块的位置。 有关详细信息,请参阅作“Datasets_UploadBlock”。

DatasetProperties

DatasetProperties

名称 类型 说明
acceptedLineCount

integer (int32)

此数据集接受的行数。

duration

string

数据集包含音频文件时的总持续时间。 持续时间编码为 ISO 8601 持续时间(“PnYnMnDTnHnMnS”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Durations)。

email

string

要发送电子邮件通知的电子邮件地址,以防作完成。 成功发送电子邮件后,将删除该值。

error

EntityError

EntityError

rejectedLineCount

integer (int32)

此数据集被拒绝的行数。

textNormalizationKind

TextNormalizationKind

TextNormalizationKind
文本规范化的类型。

DetailedErrorCode

DetailedErrorCode

说明
InvalidParameterValue

参数值无效。

InvalidRequestBodyFormat

请求正文格式无效。

EmptyRequest

空请求。

MissingInputRecords

缺少输入记录。

InvalidDocument

无效的文档。

ModelVersionIncorrect

模型版本不正确。

InvalidDocumentBatch

文档批处理无效。

UnsupportedLanguageCode

不支持的语言代码。

DataImportFailed

数据导入失败。

InUseViolation

在使用冲突中。

InvalidLocale

区域设置无效。

InvalidBaseModel

基本模型无效。

InvalidAdaptationMapping

适应映射无效。

InvalidDataset

数据集无效。

InvalidTest

测试无效。

FailedDataset

失败的数据集。

InvalidModel

无效的模型。

InvalidTranscription

听录无效。

InvalidPayload

有效负载无效。

InvalidParameter

参数无效。

EndpointWithoutLogging

没有日志记录的终结点。

InvalidPermissions

权限无效。

InvalidPrerequisite

先决条件无效。

InvalidProductId

产品 ID 无效。

InvalidSubscription

订阅无效。

InvalidProject

项目无效。

InvalidProjectKind

项目类型无效。

InvalidRecordingsUri

录制 URI 无效。

OnlyOneOfUrlsOrContainerOrDataset

只有一个 URL 或容器或数据集。

ExceededNumberOfRecordingsUris

超过录制 URI 数。

ModelMismatch

模型不匹配。

ProjectGenderMismatch

项目性别不匹配。

ModelDeprecated

模型已弃用。

ModelExists

模型存在。

ModelNotDeployable

模型不可部署。

EndpointNotUpdatable

终结点不可更新。

SingleDefaultEndpoint

单个默认终结点。

EndpointCannotBeDefault

终结点不能为默认值。

InvalidModelUri

模型 URI 无效。

SubscriptionNotFound

找不到订阅。

QuotaViolation

配额冲突。

UnsupportedDelta

不支持的增量。

UnsupportedFilter

不支持的筛选器。

UnsupportedPagination

不支持的分页。

UnsupportedDynamicConfiguration

不支持的动态配置。

UnsupportedOrderBy

不受支持的订单依据。

NoUtf8WithBom

没有带有 bom 的 utf8。

ModelDeploymentNotCompleteState

模型部署未完成状态。

SkuLimitsExist

SKU 限制存在。

DeployingFailedModel

部署失败的模型。

UnsupportedTimeRange

不支持的时间范围。

InvalidLogDate

日志日期无效。

InvalidLogId

无效的日志 ID。

InvalidLogStartTime

无效的日志开始时间。

InvalidLogEndTime

日志结束时间无效。

InvalidTopForLogs

日志顶部无效。

InvalidSkipTokenForLogs

日志的跳过令牌无效。

DeleteNotAllowed

不允许删除。

Forbidden

禁止。

DeployNotAllowed

不允许部署。

UnexpectedError

意外错误。

InvalidCollection

集合无效。

InvalidCallbackUri

回调 URI 无效。

InvalidSasValidityDuration

SAS 有效期无效。

InaccessibleCustomerStorage

无法访问客户存储。

UnsupportedClassBasedAdaptation

不支持的基于类的适应。

InvalidWebHookEventKind

Web 挂钩事件类型无效。

InvalidTimeToLive

生存时间无效。

InvalidSourceAzureResourceId

源 Azure 资源 ID 无效。

ModelCopyOperationExists

模型复制作存在。

EntityError

EntityError

名称 类型 说明
code

string

此错误的代码。

message

string

此错误的消息。

EntityReference

EntityReference

名称 类型 说明
self

string (uri)

引用实体的位置。

Error

错误

名称 类型 说明
code

ErrorCode

ErrorCode
高级错误代码。

details

Error[]

有关错误和/或预期策略的其他支持详细信息。

innerError

InnerError

InnerError
符合认知服务 API 准则的新内部错误格式,可在 https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow获取。 这包括必需的属性 ErrorCode、消息和可选属性目标、详细信息(键值对)、内部错误(可嵌套)。

message

string

高级错误消息。

target

string

错误的源。 例如,如果文档无效,则为“documents”或“document id”。

ErrorCode

ErrorCode

说明
InvalidRequest

表示无效的请求错误代码。

InvalidArgument

表示无效的参数错误代码。

InternalServerError

表示内部服务器错误代码。

ServiceUnavailable

表示服务不可用的错误代码。

NotFound

表示找不到的错误代码。

PipelineError

表示管道错误代码。

Conflict

表示冲突错误代码。

InternalCommunicationFailed

表示内部通信失败的错误代码。

Forbidden

表示禁止的错误代码。

NotAllowed

表示不允许的错误代码。

Unauthorized

表示未经授权的错误代码。

UnsupportedMediaType

表示不支持的媒体类型错误代码。

TooManyRequests

表示请求错误代码过多。

UnprocessableEntity

表示无法处理的实体错误代码。

InnerError

InnerError

名称 类型 说明
code

DetailedErrorCode

DetailedErrorCode
详细的错误代码枚举。

details

object

有关错误和/或预期策略的其他支持详细信息。

innerError

InnerError

InnerError
符合认知服务 API 准则的新内部错误格式,可在 https://microsoft.sharepoint.com/%3Aw%3A/t/CognitiveServicesPMO/EUoytcrjuJdKpeOKIK_QRC8BPtUYQpKBi8JsWyeDMRsWlQ?e=CPq8ow获取。 这包括必需的属性 ErrorCode、消息和可选属性目标、详细信息(键值对)、内部错误(可嵌套)。

message

string

高级错误消息。

target

string

错误的源。 例如,如果文档无效,则为“documents”或“document id”。

PaginatedDatasets

PaginatedDatasets

名称 类型 说明
@nextLink

string (uri)

如果有更多实体可用,则指向下一组分页结果的链接;否则为 null。

values

Dataset[]

受传递的查询参数“skip”和“top”或其默认值限制的实体列表。

使用分页和并行删除实体循环访问列表时,将在结果中跳过某些实体。 建议在客户端上生成列表,并在提取完整列表后将其删除。

Status

状态

说明
NotStarted

长时间运行的作尚未启动。

Running

长时间运行的作当前正在处理。

Succeeded

长时间运行的作已成功完成。

Failed

长时间运行的作失败。

TextNormalizationKind

TextNormalizationKind

说明
Default

默认文本规范化(例如“2 到 3”)在 en-US中被“两到三”替换。

None

不会将文本规范化应用于输入文本。 这是一个重写选项,仅在上传前对文本进行规范化时才使用。