gpt4 book ai didi

python - 如何识别字符串是否是人名?

转载 作者:行者123 更新时间:2023-12-04 01:13:21 34 4
gpt4 key购买 nike

所以我有一些被乱七八糟解析的文本数据,因此我将名称与实际数据混合在一起。是否有任何类型的包/库可以帮助识别单词是否是名称? (在这种情况下,我将假设以美国/西方/欧洲为中心的名称)
否则,什么是标记它的好方法?也许在名称语料库上训练模型并为数据集中的每个单词分配一个分类?只是不确定解决这个问题的最佳方法/哪种模型适合,或者是否已经存在解决方案

最佳答案

import nltk
from nltk.tag.stanford import NERTagger
st = NERTagger('stanford-ner/all.3class.distsim.crf.ser.gz', 'stanford-ner/stanford-ner.jar')
text = """YOUR TEXT GOES HERE"""

for sent in nltk.sent_tokenize(text):
tokens = nltk.tokenize.word_tokenize(sent)
tags = st.tag(tokens)
for tag in tags:
if tag[1]=='PERSON': print tag
通过 Improving the extraction of human names with nltk

关于python - 如何识别字符串是否是人名?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64109483/

34 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com