你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 内容理解在多个地理区域中提供多语言支持,使用户能够以自然的方式与内容理解应用程序进行通信,并增强全球外展能力。 以下部分介绍可用区域和支持的语言/区域设置。
区域支持
若要使用 Azure AI 内容理解,请在受支持的区域中创建 Azure AI 服务资源。 静态所有数据都存储在所选区域中。 为了降低延迟或增加容量,可以指定分析所在的处理位置。 内容理解在以下区域中可用。 当处理位置设置为 geography 或 data zone显示相应的位置时。
| 标识符 | 区域 | 地区 | 数据区域 |
|---|---|---|---|
westus |
美国西部 | 美国 | 美国 |
swedencentral |
瑞典中部 | 瑞典 | 欧盟 |
australiaeast |
澳大利亚东部 | 澳大利亚 | N/A † |
†澳大利亚东部不支持数据区域作为处理位置。
注释
Pro 模式 目前仅支持数据区域和全局作为处理位置。
语言支持
借助 Azure AI 内容理解,可以同时处理多种语言的数据。 我们的语言支持功能使用户能够以自然的方式与应用程序进行通信,并触达全球用户。
内容理解应用支持各种语言的 Azure OpenAI 模型 。 虽然没有明确的受支持语言列表,但用户可以期望大多数常用语言具有强大的语言功能。 有关与语音听录相关的 OCR 特定语言支持和语音听录,请参阅有关这些形式支持的语言的相应部分。
文本光学字符识别(OCR)
重要
- 以下受支持语言列表对在处理后启用的单词具有区域设置感知规范化。
- 内容理解支持不同的语言,因此我们鼓励你尝试它,专注于内容,而不是值本身。
| 语言 | 语言代码 | 语言 | 语言代码 |
|---|---|---|---|
| 阿非利卡语 | af |
哈萨克语(拉丁语) | kk, kk-latn |
| 阿尔巴尼亚语 | sq |
哈林语 | klr |
| Angika | anp |
卡西语 | kha |
| 阿拉伯语 | ar |
吉尔吉斯语 | ky |
| 阿斯图里亚斯语 | ast |
韩语 | ko |
| 阿瓦德语 | awa |
科尔库语 | kfq |
| 阿塞拜疆语 | az |
科里亚克语 | kpy |
| 巴格里语 | bfy |
科斯拉伊语 | kos |
| 巴斯克语 | eu |
库尔德语(阿拉伯语) | ku-arab |
| 白俄罗斯语(西里尔语) | be, be-cyrl |
库尔德语 (拉丁语) | ku, ku-latn |
| 白俄罗斯语(拉丁语) | be-latn |
Kurukh | kru |
| 比哈尔语 | bho |
Kölsch | ksh |
| 比斯拉马语 | bi |
拉科塔语 | lkt |
| 博多语 | brx |
拉丁语 | la |
| 波斯尼亚语 | bs |
立陶宛语 | lt |
| Braj | bra |
下索布语 | dsb |
| 布列塔尼语 | br |
沃拉普克语 | smj |
| 保加利亚语 | bg |
卢森堡语 | lb |
| 本德利语 | bns |
马哈苏·帕哈里 | bfz |
| Buriat | bua |
马来语 | ms |
| Camling | rab |
马尔托 | kmj |
| 加泰隆语 | ca |
马恩岛语 | gv |
| 宿雾语 | ceb |
毛利语 | mi |
| 查莫罗语 | ch |
马拉地语 | mr |
| 恰蒂斯加尔语 | hne |
蒙古语 | mn |
| 中文(简体) | zh, zh-hans |
蒙特内哥罗语(西里尔语) | cnr-cyrl |
| 中文(传统) | zh-hant |
蒙特内哥罗语(拉丁语) | cnr, cnr-latn |
| 康沃尔语 | kw |
那不勒斯语 | nap |
| 柯西嘉语 | co |
尼泊尔语 | ne |
| 克里米亚鞑靼语 | crh |
纽埃语 | niu |
| 克罗地亚语 | hr |
Nogai | nog |
| 捷克语 | cs |
北萨米 | sme |
| 丹麦语 | da |
挪威语 | no |
| 达里语 | prs |
奥克西唐语 | oc |
| Dhimal | dhi |
奥塞梯 | os |
| Dogri | doi |
旁遮普语 | pa |
| 荷兰语 | nl |
波斯语 | fa |
| 英语 | en-US, en-AU, en-CA,en-GB, en-IN |
波兰语 | pl |
| Erzya | myv |
葡萄牙语 | pt |
| 爱沙尼亚语 | et |
Pushto | ps |
| 法罗语 | fo |
罗马尼亚语 | ro |
| 斐济语 | fj |
罗曼什语 | rm |
| 菲律宾语 | fil |
俄语 | ru |
| 芬兰语 | fi |
萨德里 | sck |
| 法语 | fr |
萨摩亚语 | sm |
| 弗留利语 | fur |
梵语 | sa |
| Gagauz | gag |
桑塔利语 | sat |
| 加利西亚语 | gl |
苏格兰语 | sco |
| 德语 | de |
苏格兰盖尔语 | gd |
| 吉尔伯特斯语 | gil |
塞尔维亚语(拉丁语) | sr, sr-latn |
| 冈迪 | gon |
Sirmauri | srx |
| 古隆 | gvr |
斯科特萨米语 | sms |
| 海地语 | ht |
斯洛伐克语 | sk |
| 哈尔比 | hlb |
斯洛文尼亚语 | sl |
| 哈尼语 | hni |
索马里语 | so |
| 哈里亚维 | bgc |
南萨米语 | sma |
| 夏威夷语 | haw |
西班牙语 | es |
| 印地语 | hi |
斯瓦希里语 | sw |
| 白苗文 | mww |
瑞典语 | sv |
| HO | hoc |
塔吉克语 | tg |
| 匈牙利语 | hu |
鞑靼语 | tt |
| 冰岛语 | is |
德顿语 | tet |
| 伊纳里萨米语 | smn |
唐米 | thf |
| 印度尼西亚语 | id |
泰语 | th |
| 国际语 | ia |
汤加 | to |
| 因纽特语 | iu |
土耳其语 | tr |
| 爱尔兰语 | ga |
图维尼亚语 | tyv |
| 意大利语 | it |
维吾尔语 | ug |
| 日语 | ja |
上索布语 | hsb |
| Jaunsari | jns |
乌尔都语 | ur |
| 爪哇语 | jv |
乌兹别克语(阿拉伯语) | uz-arab |
| 基切 | quc |
乌兹别克语 (西里尔文) | uz-cyrl |
| 卡布维尔第亚努 | kea |
乌兹别克语(拉丁语) | uz, uz-latn |
| 卡钦 | kac |
沃拉普克语 | vo |
| 格陵兰语 | kl |
瓦尔瑟 | wae |
| 康里 | xnr |
威尔士语 | cy |
| 卡拉卡巴克语(西里尔语) | kaa-cyrl |
西弗里斯兰语 | fy |
| 卡拉卡巴克语(拉丁语) | kaa, kaa-latn |
Yucateco | yua |
| 卡拉恰伊-巴尔卡尔语 | krc |
壮族 | za |
| 卡舒比语 | csb |
祖鲁语 | zu |
| 哈萨克语(西里尔语) | kk-cyrl |
下表列出了 手写 文本支持的语言/区域设置。
| 语言 | 语言代码 | 语言 | 语言代码 |
|---|---|---|---|
| 英语 | en |
日语 | ja |
| 简体中文 | zh-Hans |
韩语 | ko |
| 法语 | fr |
葡萄牙语 | pt |
| 德语 | de |
西班牙语 | es |
| 意大利语 | it |
俄语 | ru |
| 泰语 | th |
阿拉伯语 | ar |
语音听录
内容理解将 Azure AI 语音应用于文本 以转录输入中的口语。 对于受支持语言的子集,它使用 快速听录 来减少处理延迟。
下表列出了快速听录支持的语言/区域设置。
| 语言 | 语言代码 | 语言 | 语言代码 |
|---|---|---|---|
| 中文(普通话,简体) | zh-CN |
印度尼西亚语(印度尼西亚) | id-ID |
| 丹麦语(丹麦) | da-DK |
意大利语(意大利) | it-IT |
| 英语(印度) | en-IN |
日语(日本) | ja-JP |
| 英语(英国) | en-GB |
韩语(韩国) | ko-KR |
| 英语(美国) | en-US |
波兰语(波兰) | pl-PL |
| 芬兰语(芬兰) | fi-FI |
葡萄牙语(巴西) | pt-BR |
| 法语(法国) | fr-FR |
葡萄牙语(葡萄牙) | pt-PT |
| 德语(德国) | de-DE |
西班牙语(墨西哥) | es-MX |
| 希伯来语(以色列) | he-IL |
西班牙语(西班牙) | es-ES |
| 印地语(印度) | hi-IN |
瑞典语(瑞典) | sv-SE |
下表列出了所有支持的语言/区域设置。
| 语言 | 语言代码 | 语言 | 语言代码 |
|---|---|---|---|
| 南非语(南非) | af-ZA |
匈牙利语(匈牙利) | hu-HU |
| 阿尔巴尼亚语(阿尔巴尼亚) | sq-AL |
冰岛语(冰岛) | is-IS |
| 阿姆哈拉语(埃塞俄比亚) | am-ET |
印度尼西亚语(印度尼西亚) | id-ID |
| 阿拉伯语(阿尔及利亚) | ar-DZ |
爱尔兰语(爱尔兰) | ga-IE |
| 阿拉伯语(巴林) | ar-BH |
祖鲁语(南非) | zu-ZA |
| 阿拉伯语(埃及) | ar-EG |
意大利语(意大利) | it-IT |
| 阿拉伯语(伊拉克) | ar-IQ |
意大利语(瑞士) | it-CH |
| 阿拉伯语(以色列) | ar-IL |
日语(日本) | ja-JP |
| 阿拉伯语(约旦) | ar-JO |
爪哇语(拉丁语、印度尼西亚) | jv-ID |
| 阿拉伯语(科威特) | ar-KW |
卡纳达语(印度) | kn-IN |
| 阿拉伯语(黎巴嫩) | ar-LB |
哈萨克语(哈萨克斯坦) | kk-KZ |
| 阿拉伯语(利比亚) | ar-LY |
高棉语(柬埔寨) | km-KH |
| 阿拉伯语(摩洛哥) | ar-MA |
斯瓦希里语(肯尼亚) | sw-KE |
| 阿拉伯语(阿曼) | ar-OM |
斯瓦希里语(坦桑尼亚) | sw-TZ |
| 阿拉伯语(巴勒斯坦权力机构) | ar-PS |
韩语(韩国) | ko-KR |
| 阿拉伯语(卡塔尔) | ar-QA |
老挝 (老挝) | lo-LA |
| 阿拉伯语(沙特阿拉伯) | ar-SA |
拉脱维亚语(拉脱维亚) | lv-LV |
| 阿拉伯语(叙利亚) | ar-SY |
立陶宛语(立陶宛) | lt-LT |
| 阿拉伯语(突尼斯) | ar-TN |
马其顿语(北马其顿) | mk-MK |
| 阿拉伯语(阿拉伯联合酋长国) | ar-AE |
马来语(马来西亚) | ms-MY |
| 阿拉伯语(也门) | ar-YE |
马拉雅拉姆语(印度) | ml-IN |
| 亚美尼亚语(亚美尼亚) | hy-AM |
马耳他语(马耳他) | mt-MT |
| 阿萨姆语(印度) | as-IN |
马拉地语(印度) | mr-IN |
| 阿塞拜疆语(拉丁语,阿塞拜疆) | az-AZ |
蒙古语(蒙古) | mn-MN |
| 巴斯克语 | eu-ES |
尼泊尔语(尼泊尔) | ne-NP |
| 孟加拉语(印度) | bn-IN |
挪威博克mål | nb-NO |
| 波斯尼亚语(波斯尼亚和黑塞哥维那) | bs-BA |
奥迪亚 (印度) | or-IN |
| 保加利亚语(保加利亚) | bg-BG |
普什图语(阿富汗) | ps-AF |
| 缅甸语(缅甸) | my-MM |
波斯语(伊朗) | fa-IR |
| 加泰隆语 | ca-ES |
波兰语(波兰) | pl-PL |
| 中文(粤语,简体) | yue-CN |
葡萄牙语(巴西) | pt-BR |
| 中文(粤语,繁体) | zh-HK |
葡萄牙语(葡萄牙) | pt-PT |
| 中文(冀鲁官话,简体) | zh-CN-shandong |
旁遮普语(印度) | pa-IN |
| 中文(普通话,简体) | zh-CN |
罗马尼亚语(罗马尼亚) | ro-RO |
| 中文(西南普通话,简体) | zh-CN-sichuan |
俄语(俄罗斯) | ru-RU |
| 中文(台湾普通话,繁体) | zh-TW |
塞尔维亚语(西里尔文,塞尔维亚) | sr-RS |
| 汉语(吴方言,简体) | wuu-CN |
僧伽罗语(斯里兰卡) | si-LK |
| 克罗地亚语(克罗地亚) | hr-HR |
斯洛伐克语(斯洛伐克) | sk-SK |
| 捷克语(捷克) | cs-CZ |
斯洛文尼亚语(斯洛文尼亚) | sl-SI |
| 丹麦语(丹麦) | da-DK |
索马里语(索马里) | so-SO |
| 荷兰语(比利时) | nl-BE |
西班牙语(阿根廷) | es-AR |
| 荷兰语(荷兰) | nl-NL |
西班牙语(玻利维亚) | es-BO |
| 英语(澳大利亚) | en-AU |
西班牙语(智利) | es-CL |
| 英语(加拿大) | en-CA |
西班牙语(哥伦比亚) | es-CO |
| 英语(加纳) | en-GH |
西班牙语(哥斯达黎加) | es-CR |
| 英语(香港特別行政区) | en-HK |
西班牙语(古巴) | es-CU |
| 英语(印度) | en-IN |
西班牙语(多米尼加共和国) | es-DO |
| 英语(爱尔兰) | en-IE |
西班牙语(厄瓜多尔) | es-EC |
| 英语(肯尼亚) | en-KE |
西班牙语(萨尔瓦多) | es-SV |
| 英语(新西兰) | en-NZ |
西班牙语(赤道几内亚) | es-GQ |
| 英语(尼日利亚) | en-NG |
西班牙语(危地马拉) | es-GT |
| 英语(菲律宾) | en-PH |
西班牙语(洪都拉斯) | es-HN |
| 英语(新加坡) | en-SG |
西班牙语(墨西哥) | es-MX |
| 英语(南非) | en-ZA |
西班牙(尼加拉瓜) | es-NI |
| 英语(坦桑尼亚) | en-TZ |
西班牙语(巴拿马) | es-PA |
| 英语(英国) | en-GB |
西班牙语(巴拉圭) | es-PY |
| 英语(美国) | en-US |
西班牙语(秘鲁) | es-PE |
| 爱沙尼亚语(爱沙尼亚) | et-EE |
西班牙语(波多黎各) | es-PR |
| 菲律宾语(菲律宾) | fil-PH |
西班牙语(西班牙) | es-ES |
| 芬兰语(芬兰) | fi-FI |
西班牙语(美国)1 | es-US |
| 法语(比利时) | fr-BE |
西班牙语(乌拉圭) | es-UY |
| 法语(加拿大)1 | fr-CA |
西班牙语(委内瑞拉) | es-VE |
| 法语(法国) | fr-FR |
瑞典语(瑞典) | sv-SE |
| 法语(瑞士) | fr-CH |
泰米尔语(印度) | ta-IN |
| 加利西亚语 | gl-ES |
泰卢固语(印度) | te-IN |
| 格鲁吉亚语(格鲁吉亚) | ka-GE |
泰语(泰国) | th-TH |
| 德语(奥地利) | de-AT |
土耳其语 (Türkiye) | tr-TR |
| 德语(德国) | de-DE |
乌克兰语(乌克兰) | uk-UA |
| 德语(瑞士) | de-CH |
乌尔都语(印度) | ur-IN |
| 希腊语(希腊) | el-GR |
乌兹别克语(拉丁语,乌兹别克斯坦) | uz-UZ |
| 古吉拉特语(印度) | gu-IN |
越南语(越南) | vi-VN |
| 希伯来语(以色列) | he-IL |
威尔士语(英国) | cy-GB |
| 印地语(印度) | hi-IN |
字段值规范化
不同的区域设置有不同的方法来表示数字、日期和时间。 内容理解支持将这些不同的表示形式规范化为以下区域设置的标准化 ISO 表单。
| 语言 | 语言代码 | 语言 | 语言代码 |
|---|---|---|---|
| 阿拉伯语 |
ar-AE、ar-EG、ar-SA |
日语 | ja-JP |
| 孟加拉语 | bn-IN |
韩语 | ko-KR |
| 保加利亚语 | bg-BG |
拉脱维亚语 | lv-LV |
| 加泰隆语 | ca-ES |
立陶宛语 | lt-LT |
| 中文(简体) | zh-CN |
马来语 | ms-MY |
| 中文(传统) | zh-TW |
马拉地语 | mr-IN |
| 克罗地亚语 | hr-HR |
尼泊尔语 | ne-IN |
| 捷克语 | cs-CZ |
挪威语 | no-NO |
| 丹麦语 | da-DK |
波兰语 | pl-PL |
| 荷兰语 | nl-NL |
葡萄牙语 |
pt-BR、pt-PT |
| 英语 |
en-AU、en-CA、en-GB、en-IL、en-IN、en-MY、en-US |
罗马尼亚语 | ro-RO |
| 爱沙尼亚语 | et-EE |
俄语 | ru-RU |
| 芬兰语 | fi-FI |
塞尔维亚语 | sr-RS |
| 法语 |
fr-CA、fr-FR |
斯洛伐克语 | sk-SK |
| 加利西亚语 | gl-ES |
斯洛文尼亚语 | sl-SI |
| 德语 | de-DE |
西班牙语 |
es-AR、es-ES、es-MX |
| 希腊语 | el-GR |
瑞典语 | sv-SE |
| 希伯来语 | he-IL |
泰米尔语 | ta-IN |
| 印地语 | hi-IN |
泰语 | th-TH |
| 匈牙利语 | hu-HU |
土耳其语 | tr-TR |
| 冰岛语 | is-IS |
乌克兰语 | uk-UA |
| 印度尼西亚语 | id-ID |
越南语 | vi-VN |
| 意大利语 | it-IT |