Unicode 字符数据库为 General Category 属性指定了许多可能值,并且提供从代码数据点到特定字符属性的映射。 下表指定 General Category 属性的可以识别的值。
IsCategory
语法
IsCategory ::= Letters | Marks | Numbers | Punctuation | Separators | Symbols | Others
字母
语法
Letters ::= 'L' [ultmo]?
下表说明字母的属性
| 属性 | 说明 | 
|---|---|
| L | 所有字母 | 
| Lu | 大写 | 
| Ll | 小写 | 
| Lt | 词首字母大写 | 
| Lm | 修饰符 | 
| Lo | 其他 | 
标记
语法
Marks ::= 'M' [nce]?
下表说明标记的属性。
| 属性 | 说明 | 
|---|---|
| M | 所有标记 | 
| Mn | 无间距 | 
| Mc | 空格合并 | 
| Me | 封闭 | 
数字
语法
Numbers ::= 'N' [dlo]?
下表说明数字的属性。
| 属性 | 说明 | 
|---|---|
| N | 所有数字 | 
| Nd | 十进制数字 | 
| Nl | 字母 | 
| No | 其他 | 
标点
语法
Punctuation ::= 'P' [cdseifo]?
下表说明标点的属性。
| 属性 | 说明 | 
|---|---|
| P | 所有标点 | 
| Pc | 连接符 | 
| Pd | 短划线 | 
| Ps | 开始 | 
| Pe | 结束 | 
| Pi | 左引号(根据具体使用情况,作用可能像 Ps 或 Pe) | 
| Pf | 右引号(根据具体使用情况,作用可能像 Ps 或 Pe) | 
| Po | 其他 | 
分隔符
语法
Separators ::= 'Z' [slp]?
下表说明分隔符的属性。
| 属性 | 说明 | 
|---|---|
| Z | 所有分隔符 | 
| Zs | 空格 | 
| Zl | 行 | 
| Zp | 段落 | 
符号
语法
Symbols ::= 'S' [mcko]?
下表说明符号的属性。
| 属性 | 说明 | 
|---|---|
| S | 所有符号 | 
| Sm | 数学 | 
| Sc | 货币 | 
| Sk | 修饰符 | 
| So | 其他 | 
其他
语法
Others ::= 'O' [cfon]?
下表说明其他的属性。
| 属性 | 说明 | 
|---|---|
| O | 所有其他属性 | 
| Cc | 控制 | 
| Cf | 格式 | 
| Co | 专用 | 
| Cn | 未分配 | 
提示
此处未包括 Cs 属性。 Cs 属性标识代理项字符,这些代理项字符在 XML 实例文档使用的字符抽象级别不出现。