MicrosoftLanguageStemmingTokenizer interface
使用特定于语言的规则划分文本,并将单词减少到其基形式。
属性
| is |
一个值,指示如何使用 tokenizer。 如果用作搜索标记器,则设置为 true,如果用作索引标记器,则设置为 false。 默认值为 false。 |
| language | 要使用的语言。 默认值为英语。 |
| max |
最大令牌长度。 拆分长度超过最大长度的令牌。 可以使用的最大令牌长度为 300 个字符。 长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌,然后根据设置的最大令牌长度拆分每个令牌。 默认值为 255。 |
| odatatype | 多态鉴别器,它指定此对象可以的不同类型的 |
继承属性
| name | tokenizer 的名称。 它只能包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,并且限制为 128 个字符。 |
属性详细信息
isSearchTokenizer
一个值,指示如何使用 tokenizer。 如果用作搜索标记器,则设置为 true,如果用作索引标记器,则设置为 false。 默认值为 false。
isSearchTokenizer?: boolean
属性值
boolean
language
要使用的语言。 默认值为英语。
language?: MicrosoftStemmingTokenizerLanguage
属性值
maxTokenLength
最大令牌长度。 拆分长度超过最大长度的令牌。 可以使用的最大令牌长度为 300 个字符。 长度超过 300 个字符的令牌首先拆分为长度为 300 的令牌,然后根据设置的最大令牌长度拆分每个令牌。 默认值为 255。
maxTokenLength?: number
属性值
number
odatatype
多态鉴别器,它指定此对象可以的不同类型的
odatatype: "#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
属性值
"#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer"
继承属性详细信息
name
tokenizer 的名称。 它只能包含字母、数字、空格、短划线或下划线,只能以字母数字字符开头和结尾,并且限制为 128 个字符。
name: string
属性值
string