Projects - List Datasets
获取指定项目的数据集列表。
GET {endpoint}/speechtotext/v3.2-preview.2/projects/{id}/datasets
GET {endpoint}/speechtotext/v3.2-preview.2/projects/{id}/datasets?skip={skip}&top={top}&filter={filter}
URI 参数
| 名称 | 在 | 必需 | 类型 | 说明 |
|---|---|---|---|---|
|
endpoint
|
path | True |
string |
支持的认知服务终结点(协议和主机名,例如:https://westus.api.cognitive.microsoft.com)。 |
|
id
|
path | True |
string (uuid) |
项目的标识符。 |
|
filter
|
query |
string |
用于选择可用数据集子集的筛选表达式。
|
|
|
skip
|
query |
integer (int32) |
将跳过的数据集数。 |
|
|
top
|
query |
integer (int32) |
跳过后将包含的数据集数。 |
响应
| 名称 | 类型 | 说明 |
|---|---|---|
| 200 OK |
还行 标头 Retry-After: integer |
|
| Other Status Codes |
发生错误。 |
安全性
Ocp-Apim-Subscription-Key
在此处提供认知服务帐户密钥。
类型:
apiKey
在:
header
Authorization
提供来自此区域的 STS 返回的 JWT 的访问令牌。 通过将以下查询字符串添加到 STS URL,确保将管理范围添加到令牌: ?scope=speechservicesmanagement
类型:
apiKey
在:
header
示例
Get all datasets
示例请求
GET {endpoint}/speechtotext/v3.2-preview.2/projects/abc46f33-90b8-443d-adad-4870517356e0/datasets?skip=0&top=2&filter=createdDateTime%20ge%202018-01-24T09:54:39Z
示例响应
{
"values": [
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1",
"kind": "Acoustic",
"contentUrl": "https://www.contoso.com/acousticdata/sourcelocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/9d5f4100-5f8e-4dd6-bd83-9bbbf50d57f1/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2,
"duration": "PT4M12S"
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Acoustic dataset"
},
{
"self": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/cdc91c24-3972-496d-a12f-209c35f4cc6c",
"kind": "Language",
"contentUrl": "https://www.contoso.com/LanguageData/SourceLocation",
"links": {
"files": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets/cdc91c24-3972-496d-a12f-209c35f4cc6c/files"
},
"properties": {
"textNormalizationKind": "Default",
"acceptedLineCount": 11,
"rejectedLineCount": 2
},
"lastActionDateTime": "2019-01-07T11:36:07Z",
"status": "Succeeded",
"createdDateTime": "2019-01-07T11:34:12Z",
"locale": "en-US",
"displayName": "Language dataset"
}
],
"@nextLink": "https://westus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/datasets?skip=2&top=2&filter=createdDateTime%20ge%202018-01-24T09:54:39Z"
}
定义
| 名称 | 说明 |
|---|---|
| Dataset |
数据集 |
|
Dataset |
DatasetKind |
|
Dataset |
DatasetLinks |
|
Dataset |
DatasetProperties |
|
Detailed |
DetailedErrorCode |
|
Entity |
EntityError |
|
Entity |
EntityReference |
| Error |
错误 |
|
Error |
ErrorCode |
|
Inner |
InnerError |
|
Paginated |
PaginatedDatasets |
| Status |
状态 |
|
Text |
TextNormalizationKind |
Dataset
数据集
| 名称 | 类型 | 说明 |
|---|---|---|
| contentUrl |
string (uri) |
数据集数据的 URL。 |
| createdDateTime |
string (date-time) |
创建对象的时间戳。 时间戳编码为 ISO 8601 日期和时间格式(“YYYY-MM-DDThh:mm:ssZ”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations)。 |
| customProperties |
object |
此实体的自定义属性。 允许的最大密钥长度为 64 个字符,允许的最大值长度为 256 个字符,允许的条目计数为 10。 |
| description |
string |
对象的说明。 |
| displayName |
string minLength: 1 |
对象的显示名称。 |
| kind |
DatasetKind |
|
| lastActionDateTime |
string (date-time) |
输入当前状态时的时间戳。 时间戳编码为 ISO 8601 日期和时间格式(“YYYY-MM-DDThh:mm:ssZ”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Combined_date_and_time_representations)。 |
| links |
DatasetLinks |
|
| locale |
string minLength: 1 |
包含数据的区域设置。 |
| project |
EntityReference |
|
| properties |
DatasetProperties |
|
| self |
string (uri) |
此实体的位置。 |
| status |
状态 |
DatasetKind
DatasetKind
| 值 | 说明 |
|---|---|
| Language |
语言数据集。 |
| Acoustic |
声学数据集。 |
| Pronunciation |
发音数据集。 |
| AudioFiles |
音频文件数据集。 |
| LanguageMarkdown |
语言 markdown 数据集。 |
| OutputFormatting |
包含用于自定义反向文本规范化、大写、重整、亵渎以及定义数据集验证测试的数据集 |
DatasetLinks
DatasetLinks
| 名称 | 类型 | 说明 |
|---|---|---|
| commitBlocks |
string (uri) |
使用块上传数据集时提交块列表的位置。 有关详细信息,请参阅作“Datasets_CommitBlocks”。 |
| files |
string (uri) |
获取此实体的所有文件的位置。 有关详细信息,请参阅作“Datasets_ListFiles”。 |
| listBlocks |
string (uri) |
使用块上传数据集时列出此实体已上传块的位置。 有关更多详细信息,请参阅作“Datasets_GetBlocks”。 |
| uploadBlocks |
string (uri) |
使用块上传数据集时要上传到块的位置。 有关详细信息,请参阅作“Datasets_UploadBlock”。 |
DatasetProperties
DatasetProperties
| 名称 | 类型 | 说明 |
|---|---|---|
| acceptedLineCount |
integer (int32) |
此数据集接受的行数。 |
| duration |
string |
数据集包含音频文件时的总持续时间。 持续时间编码为 ISO 8601 持续时间(“PnYnMnDTnHnMnS”,请参阅 https://en.wikipedia.org/wiki/ISO_8601#Durations)。 |
|
string |
要发送电子邮件通知的电子邮件地址,以防作完成。 成功发送电子邮件后,将删除该值。 |
|
| error |
EntityError |
|
| rejectedLineCount |
integer (int32) |
此数据集被拒绝的行数。 |
| textNormalizationKind |
TextNormalizationKind |
DetailedErrorCode
DetailedErrorCode
| 值 | 说明 |
|---|---|
| InvalidParameterValue |
参数值无效。 |
| InvalidRequestBodyFormat |
请求正文格式无效。 |
| EmptyRequest |
空请求。 |
| MissingInputRecords |
缺少输入记录。 |
| InvalidDocument |
无效的文档。 |
| ModelVersionIncorrect |
模型版本不正确。 |
| InvalidDocumentBatch |
文档批处理无效。 |
| UnsupportedLanguageCode |
不支持的语言代码。 |
| DataImportFailed |
数据导入失败。 |
| InUseViolation |
在使用冲突中。 |
| InvalidLocale |
区域设置无效。 |
| InvalidBaseModel |
基本模型无效。 |
| InvalidAdaptationMapping |
适应映射无效。 |
| InvalidDataset |
数据集无效。 |
| InvalidTest |
测试无效。 |
| FailedDataset |
失败的数据集。 |
| InvalidModel |
无效的模型。 |
| InvalidTranscription |
听录无效。 |
| InvalidPayload |
有效负载无效。 |
| InvalidParameter |
参数无效。 |
| EndpointWithoutLogging |
没有日志记录的终结点。 |
| InvalidPermissions |
权限无效。 |
| InvalidPrerequisite |
先决条件无效。 |
| InvalidProductId |
产品 ID 无效。 |
| InvalidSubscription |
订阅无效。 |
| InvalidProject |
项目无效。 |
| InvalidProjectKind |
项目类型无效。 |
| InvalidRecordingsUri |
录制 URI 无效。 |
| OnlyOneOfUrlsOrContainerOrDataset |
只有一个 URL 或容器或数据集。 |
| ExceededNumberOfRecordingsUris |
超过录制 URI 数。 |
| ModelMismatch |
模型不匹配。 |
| ProjectGenderMismatch |
项目性别不匹配。 |
| ModelDeprecated |
模型已弃用。 |
| ModelExists |
模型存在。 |
| ModelNotDeployable |
模型不可部署。 |
| EndpointNotUpdatable |
终结点不可更新。 |
| SingleDefaultEndpoint |
单个默认终结点。 |
| EndpointCannotBeDefault |
终结点不能为默认值。 |
| InvalidModelUri |
模型 URI 无效。 |
| SubscriptionNotFound |
找不到订阅。 |
| QuotaViolation |
配额冲突。 |
| UnsupportedDelta |
不支持的增量。 |
| UnsupportedFilter |
不支持的筛选器。 |
| UnsupportedPagination |
不支持的分页。 |
| UnsupportedDynamicConfiguration |
不支持的动态配置。 |
| UnsupportedOrderBy |
不受支持的订单依据。 |
| NoUtf8WithBom |
没有带有 bom 的 utf8。 |
| ModelDeploymentNotCompleteState |
模型部署未完成状态。 |
| SkuLimitsExist |
SKU 限制存在。 |
| DeployingFailedModel |
部署失败的模型。 |
| UnsupportedTimeRange |
不支持的时间范围。 |
| InvalidLogDate |
日志日期无效。 |
| InvalidLogId |
无效的日志 ID。 |
| InvalidLogStartTime |
无效的日志开始时间。 |
| InvalidLogEndTime |
日志结束时间无效。 |
| InvalidTopForLogs |
日志顶部无效。 |
| InvalidSkipTokenForLogs |
日志的跳过令牌无效。 |
| DeleteNotAllowed |
不允许删除。 |
| Forbidden |
禁止。 |
| DeployNotAllowed |
不允许部署。 |
| UnexpectedError |
意外错误。 |
| InvalidCollection |
集合无效。 |
| InvalidCallbackUri |
回调 URI 无效。 |
| InvalidSasValidityDuration |
SAS 有效期无效。 |
| InaccessibleCustomerStorage |
无法访问客户存储。 |
| UnsupportedClassBasedAdaptation |
不支持的基于类的适应。 |
| InvalidWebHookEventKind |
Web 挂钩事件类型无效。 |
| InvalidTimeToLive |
生存时间无效。 |
| InvalidSourceAzureResourceId |
源 Azure 资源 ID 无效。 |
| ModelCopyOperationExists |
模型复制作存在。 |
EntityError
EntityError
| 名称 | 类型 | 说明 |
|---|---|---|
| code |
string |
此错误的代码。 |
| message |
string |
此错误的消息。 |
EntityReference
EntityReference
| 名称 | 类型 | 说明 |
|---|---|---|
| self |
string (uri) |
引用实体的位置。 |
Error
错误
| 名称 | 类型 | 说明 |
|---|---|---|
| code |
ErrorCode |
|
| details |
Error[] |
有关错误和/或预期策略的其他支持详细信息。 |
| innerError |
InnerError |
|
| message |
string |
高级错误消息。 |
| target |
string |
错误的源。 例如,如果文档无效,则为“documents”或“document id”。 |
ErrorCode
ErrorCode
| 值 | 说明 |
|---|---|
| InvalidRequest |
表示无效的请求错误代码。 |
| InvalidArgument |
表示无效的参数错误代码。 |
| InternalServerError |
表示内部服务器错误代码。 |
| ServiceUnavailable |
表示服务不可用的错误代码。 |
| NotFound |
表示找不到的错误代码。 |
| PipelineError |
表示管道错误代码。 |
| Conflict |
表示冲突错误代码。 |
| InternalCommunicationFailed |
表示内部通信失败的错误代码。 |
| Forbidden |
表示禁止的错误代码。 |
| NotAllowed |
表示不允许的错误代码。 |
| Unauthorized |
表示未经授权的错误代码。 |
| UnsupportedMediaType |
表示不支持的媒体类型错误代码。 |
| TooManyRequests |
表示请求错误代码过多。 |
| UnprocessableEntity |
表示无法处理的实体错误代码。 |
InnerError
InnerError
| 名称 | 类型 | 说明 |
|---|---|---|
| code |
DetailedErrorCode |
|
| details |
object |
有关错误和/或预期策略的其他支持详细信息。 |
| innerError |
InnerError |
|
| message |
string |
高级错误消息。 |
| target |
string |
错误的源。 例如,如果文档无效,则为“documents”或“document id”。 |
PaginatedDatasets
PaginatedDatasets
| 名称 | 类型 | 说明 |
|---|---|---|
| @nextLink |
string (uri) |
如果有更多实体可用,则指向下一组分页结果的链接;否则为 null。 |
| values |
Dataset[] |
受传递的查询参数“skip”和“top”或其默认值限制的实体列表。 使用分页和并行删除实体循环访问列表时,将在结果中跳过某些实体。 建议在客户端上生成列表,并在提取完整列表后将其删除。 |
Status
状态
| 值 | 说明 |
|---|---|
| NotStarted |
长时间运行的作尚未启动。 |
| Running |
长时间运行的作当前正在处理。 |
| Succeeded |
长时间运行的作已成功完成。 |
| Failed |
长时间运行的作失败。 |
TextNormalizationKind
TextNormalizationKind
| 值 | 说明 |
|---|---|
| Default |
默认文本规范化(例如“2 到 3”)在 en-US中被“两到三”替换。 |
| None |
不会将文本规范化应用于输入文本。 这是一个重写选项,仅在上传前对文本进行规范化时才使用。 |