gpt4 book ai didi

python - 查找文本中的所有位置/城市/地点

转载 作者:太空狗 更新时间:2023-10-30 00:20:16 28 4
gpt4 key购买 nike

如果我有一段文本,例如包含一篇加泰罗尼亚语报纸文章,我如何从该文本中找到所有城市?

我一直在查看 python 的 nltk 包,我已经下载了加泰罗尼亚语的语料库 (nltk.corpus.cess_cat)。

此时此刻我所拥有的:我已经从 nltk.download() 安装了所有必要的东西。我现在拥有的一个例子:

te = nltk.word_tokenize('Tots els gats son de Sant Cugat del Valles.')

nltk.pos_tag(te)

这座城市是“Sant Cugat del Valles”。我从输出中得到的是:

[('Tots', 'NNS'),
('els', 'NNS'),
('gats', 'NNS'),
('son', 'VBP'),
('de', 'IN'),
('Sant', 'NNP'),
('Cugat', 'NNP'),
('del', 'NN'),
('Valles', 'NNP')]

NNP 似乎表示首字母大写的名词。有没有办法获取地点或城市而不是所有名称? 谢谢

最佳答案

您可以使用 geotext同样的python库。

pip install geotext

就是安装这个库所需要的一切。用法很简单:

from geotext import GeoText
places = GeoText("London is a great city")
places.cities

给出结果“伦敦”

这个库中涵盖的城市列表并不广泛,但它有一个很好的列表。

关于python - 查找文本中的所有位置/城市/地点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30150047/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com