Stanza Notes
文章目录
数据对象和注解 Data Objects and Annotations
- Document
- Sentence
- Token
- Word
- Span
- others …
POS (part of speech)
- POSProcessor
upos
- 包含 universal pos 标记
Universal pos tags 类型
官方资料
个人理解
标注词性,词的类型
- 是名词还是动词
- 并不说明跟其它词的关系
xpos
- tree bank-specific POS 标记
- 用于语法树解析
xpos 类型
官方资料
- …
宾州树库
个人理解
- 基于语法树库
- 说明单个词的词性(更清楚具体)
- 说明在句子语法树中的位置
- 说明了和其它词的关系
ufeat
Token
包含 ner 信息
ner 标记类型
- https://en.wikipedia.org/wiki/Inside%E2%80%93outside%E2%80%93beginning_(tagging)
mwt 模型
英语和汉语没有 mwt 模型
文章作者
上次更新 2022-03-24 (d2bfef1)