作者热门文章
- 使用 Spring Initializr 创建 Spring Boot 应用程序
- 在Spring Boot中配置Cassandra
- 在 Spring Boot 上配置 Tomcat 连接池
- 将Camel消息路由到嵌入WildFly的Artemis上
接口名 | 描述 |
---|---|
ResponseResult getWordPos(String requestData, int requestType) | 采用同步方式进行词性标注 |
ResponseResult getWordPos(final String requestData, final int requestType, final OnResultListener listener) | 采用异步方式进行词性标注 |
void init(Context context, OnResultListener listener, boolean isLoadModel) | 初始化NLU服务。在调用NLU等功能接口前需要先调用此接口,在OnResultListener的onResult(T)方法中获取到回调结果后,再调用NLU功能接口。开发者传入listener参数作为回调,用于等待NLU功能接口的调用过程和结果 |
void destroy(Context context) | 取消所有NLU任务,销毁NLU引擎服务。调用此方法后,无法再使用NLU服务。如果需要重新使用NLU服务,需要重新调用init(Context, OnResultListener, boolean)}来初始化NLU服务 |
类型 | 说明 |
---|---|
static int | REQUEST_TYPE_LOCAL = 0 本地请求 |
参数名 | 是否必选 | 类型 | 说明 |
---|---|---|---|
text | true | String | 待分析的文本,UTF-8编码,限制500个字符以内 |
type | false | long | 分词的粒度,默认为0。<br>0:基本词,粒度较小。例如:“我要看速度与激情”,分成“我/要/看/速度/与/激情”。<br>1:在基本词的基础上,做实体合并。例如:“我要去江宁万达广场看速度与激情”分成“我/要/去/江宁万达广场/看/速度/与/激情”。<br>对于没有可合并实体的文本信息,其分词效果与type为0的分词效果相同。例如:“明天下午3点一起看电影”分成“明天/下午/3点/一起/看/电影”。<br>9223372036854775807(2的63次方减1):在type为1的基础上,把实体时间、地点等整体结构合并(出现符号隔开则不合并),并把一些常用短语合并。<br>例如:“形容词+的”,“单字动词+单字名词”等,简化句子成分。根据以上原则,“明天下午三点到五点我在江宁瑞都金逸影城看电影”将分成“明天下午三点/到/五点/我/在/江宁瑞都金逸影城/看/电影” |
callPkg | false | String | 调用者名称 |
callType | false | int | 调用者类型:<br>0:普通应用(默认)<br>1:快应用 |
callVersion | false | String | 调用者版本号 |
callState | false | int | 调用者状态:<br>-1:未知(默认)<br>0:前台<br>1:后台 |
实体类别 | 备注 |
---|---|
电影 | 依赖字典,要求真实用例,勿做修改 |
电视剧 | 依赖字典,要求真实用例,勿做修改 |
综艺 | 依赖字典,要求真实用例,勿做修改 |
动漫 | 依赖字典,要求真实用例,勿做修改 |
火车车次 | 依赖字典,要求真实用例,勿做修改 |
航班号 | 要求真实用例,勿做修改 |
球队 | 要求真实用例,勿做修改 |
球队 | 依赖字典,支持NBA、CBA、英超、西甲、德甲、意甲、法甲、中超的球队识别,要求真实用例,勿做修改 |
人名 | 要求真实用例,勿做修改 |
快递单号 | 要求真实用例,勿做修改 |
电话号码 | 要求真实用例,勿做修改 |
url | 要求真实用例,勿做修改 |
邮箱 | 要求真实用例,勿做修改 |
联赛 | NBA、CBA、英超、西甲、德甲、意甲、法甲、中超,要求真实用例,勿做修改 |
时间 | 要求真实用例,勿做修改 |
地点 | 包含酒店、餐馆、景点、学校、道路、省、市、县、区、镇等,部分依赖字典 |
验证码 | 要求真实用例,勿做修改 |
参数名 | 是否必选 | 类型 | 说明 |
---|---|---|---|
code | 是 | int | 词性标注的结果码。取值包括:<br>0:成功<br>1:系统正在初始化<br>2:参数错误<br>3:系统忙<br>4:系统异常<br>5:任务超时<br>6:其它错误 |
message | 是 | String | 错误信息 |
pos | 否 | JSONArray | 切分出的词数组,数组里的类型为JSONObject |
+word | 否 | String | 切分出的词 |
+tag | 否 | String | 词性,type为1或9223372036854775807时,人名实体的词性为nr,时间实体的词为t,地点实体的词性为ns,其他实体统一为ne |
词性 | 说明 | 词性 | 说明 | 词性 | 说明 |
---|---|---|---|---|---|
n | 名词 | rr | 人称代词 | u | 助词 |
nr | 人名 | rz | 指示代词 | uzhe | 助词“着” |
ns | 地名 | rzt | 时间指示代词 | ule | 助词“了”“喽” |
ne | 只在实体合并时使用,除人名、<br>时间、地点之前,其他实体统一返回ne | rzs | 处所指示代词 | uguo | 助词“过” |
t | 时间词 | rzv | 谓词性指示代词 | ude1 | 助词“的” |
tg | 时间词性语素 | ry | 疑问代词 | ude2 | 助词“地” |
s | 处所词 | ryt | 时间疑问代词 | ude3 | 助词”得” |
f | 方位词 | rys | 处所疑问代词 | usuo | 助词”所“ |
v | 动词 | ryv | 谓词性疑问代词 | udeng | 助词“等”“等等” |
vd | 副动词 | rg | 代词性语素 | uyy | 助词”一样”“一般”“似的”“般” |
vn | 名动词 | m | 数词 | udh | 助词“的话” |
vshi | 动词“是” | mq | 数量词 | uls | 助词“来讲”“来说”“而言”“说来” |
vyou | 动词“有” | q | 量词 | uzhi | 助词“之“ |
vf | 趋向动词 | qv | 动量词 | ulian | 助词“连” |
a | 形容词 | qt | 时量词 | e | 叹词 |
ad | 副形词 | d | 副词 | y | 语气词 |
an | 名形词 | p | 介词 | o | 拟声词 |
b | 区别词 | pba | 介词“把” | h | 前缀 |
bl | 区别词性惯用语 | pbei | 介词“被” | k | 后缀 |
z | 状态词 | c | 连词 | x | 字符串 |
r | 代词 | cc | 并列连词 | idiom | 成语 |
w | 标点符号 | - | - | - | - |
import ohos.ai.nlu.NluRequestType;
import ohos.ai.nlu.NluClient;
import ohos.ai.nlu.OnResultListener;
import ohos.ai.nlu.ResponseResult;
NluClient.getInstance().init(context, new OnResultListener<Integer>(){
@Override
public void onResult(Integer result){
// 初始化成功回调,在服务初始化成功调用该函数
}
}, true);
String requestData = "{\"text\":\"我要看速度与激情\",\"type\":0}";
ResponseResult responseResult = NluClient.getInstance().getWordPos(requestData, NluRequestType.REQUEST_TYPE_LOCAL);
NluClient.getInstance().getWordPos(requestData,
NluRequestType.REQUEST_TYPE_LOCAL, new OnResultListener<ResponseResult>() {
@Override
public void onResult(ResponseResult result) {
//异步返回处理
}
});
NluClient.getInstance().destroy(context);
我正在使用 SpaCy 进行文本分析,但我无法理解词性 (POS) 和句法依赖分析之间的区别。两者都根据单词的作用在句子中标记单词。但它们究竟有何不同? 最佳答案 我们使用词性标注来标记句子中的标记,
我正在使用 SpaCy 进行文本分析,但我无法理解词性 (POS) 和句法依赖分析之间的区别。两者都根据单词的作用在句子中标记单词。但它们究竟有何不同? 最佳答案 我们使用词性标注来标记句子中的标记,
我正在使用 openNLP 来标记 POS(词性)。 InputStream inputStream = new FileInputStream("C:/en-pos-max
抱歉,我是 Pandas 和 NLTK 的新手。我正在尝试构建一组自定义返回的 POS。我的数据内容: comment 0 [(have, VERB), (you, PRO
我正在尝试执行词性标记,并且我对任何基于 Java 的标记器持开放态度(当前使用 OpenNLP)。有没有办法“强制”标记器将特定术语(或单词组合)识别为特定标签,并据此对其他术语进行分类?有点允许标
我想将 nltk.pos_tag 返回的词性 (POS) 用于 sklearn 分类器,如何将它们转换为向量并使用它?例如 sent = "这是 POS 示例" tok=nltk.tokenize.w
我是一名优秀的程序员,十分优秀!