- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试实现一个代码来使用 OpenWeatherMap API 和 NLTK 来检查特定区域的天气状况,以查找实体名称识别。但我无法找到将 GPE 中存在的实体(给出位置)(在本例中为芝加哥)传递给我的 API 请求的方法。请帮我解决语法问题。下面给出的代码。
感谢您的帮助
import nltk
from nltk import load_parser
import requests
import nltk
from nltk import word_tokenize
from nltk.corpus import stopwords
sentence = "What is the weather in Chicago today? "
tokens = word_tokenize(sentence)
stop_words = set(stopwords.words('english'))
clean_tokens = [w for w in tokens if not w in stop_words]
tagged = nltk.pos_tag(clean_tokens)
print(nltk.ne_chunk(tagged))
最佳答案
GPE
是来自预训练 ne_chunk
模型的 Tree
对象的标签。
>>> from nltk import word_tokenize, pos_tag, ne_chunk
>>> sent = "What is the weather in Chicago today?"
>>> ne_chunk(pos_tag(word_tokenize(sent)))
Tree('S', [('What', 'WP'), ('is', 'VBZ'), ('the', 'DT'), ('weather', 'NN'), ('in', 'IN'), Tree('GPE', [('Chicago', 'NNP')]), ('today', 'NN'), ('?', '.')])
要遍历树,请参阅 How to Traverse an NLTK Tree object?
也许,您正在寻找对NLTK Named Entity recognition to a Python list稍加修改的东西
from nltk import word_tokenize, pos_tag, ne_chunk
from nltk import Tree
def get_continuous_chunks(text, label):
chunked = ne_chunk(pos_tag(word_tokenize(text)))
prev = None
continuous_chunk = []
current_chunk = []
for subtree in chunked:
if type(subtree) == Tree and subtree.label() == label:
current_chunk.append(" ".join([token for token, pos in subtree.leaves()]))
if current_chunk:
named_entity = " ".join(current_chunk)
if named_entity not in continuous_chunk:
continuous_chunk.append(named_entity)
current_chunk = []
else:
continue
return continuous_chunk
[输出]:
>>> sent = "What is the weather in New York today?"
>>> get_continuous_chunks(sent, 'GPE')
['New York']
>>> sent = "What is the weather in New York and Chicago today?"
>>> get_continuous_chunks(sent, 'GPE')
['New York', 'Chicago']
>>> sent = "What is the weather in New York"
>>> get_continuous_chunks(sent, 'GPE')
['New York']
>>> sent = "What is the weather in New York and Chicago"
>>> get_continuous_chunks(sent, 'GPE')
['New York', 'Chicago']
关于python - 如何使用 NLTK ne_chunk 提取 GPE(位置)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48660547/
我想将我的 Eclipse 谷歌插件回滚到以前的版本。我怎样才能做到这一点? 最佳答案 使用 Help>About>Installation Details>Installation History
我的 eclipse 4.2 Juno 无法安装与 Google App Engine Java SDK 和 Google Web Toolkit 相关的任何内容。我见过类似的问题和答案。他们建议使用
我尝试将 Eclipse Indigo 与 Google Plugin for Eclipse (GPE) 结合使用,但找不到 GPE 3.7。我的意思是,我会对 GPE 3.6 感到满意。 现在我在
我正在尝试实现一个代码来使用 OpenWeatherMap API 和 NLTK 来检查特定区域的天气状况,以查找实体名称识别。但我无法找到将 GPE 中存在的实体(给出位置)(在本例中为芝加哥)传递
我正在使用 SpaCy 来获取命名实体。但是,它总是将新线符号错误地标记为命名实体。 下面是输入文本。 mytxt = """ KNOW YOUR ROLE ON SUPER BOWL LIII.
我正在使用 google eclipse 插件在 Eclipse 中使用 GWT 和 GAE。有时我只想快速修复服务器。我更改了我的服务器代码中的某些内容并重新部署,但 GWT 代码也全部重新编译。此
我只需要两个与应用引擎相关的 jar(appengine-api-1.0-sdk-1.6.0.jar 和 appengine-api-labs-1.6.0.jar 准确地说)在我的 WEB-INF/l
我读了最后一篇与 maven 项目集成良好的 GPE。 因此,我使用 maven-gae-plugin 从 cmd 行创建了一个 maven 项目。 然后作为maven项目导入到eclipse中。 但
当我尝试使用 eclipse 界面生成客户端库时,我得到了这个错误: eclipse.buildId=M20120914-1800 java.version=1.7.0_25 java.vendor=
将现有 GWT 项目导入 Eclipse 后,WEB-INF/lib 目录为空并有一个红色“X”。我知道这个项目使用 GAE,所以.. 我转到项目属性 -> Google -> Web Toolkit
我是一名优秀的程序员,十分优秀!