gpt4 book ai didi

python - 如何计算数据框列中 Spacy 的名词数量?

转载 作者:行者123 更新时间:2023-12-05 02:31:08 24 4
gpt4 key购买 nike

我有一个这样的数据框(作为示例)。

<表类="s-表"><头>正文<正文>我出国了安德鲁来自美国,他喜欢苹果。

我想添加一个新列,名词数量,Spacy 应该在其中计算 NOUNS pos 标签。我如何在 Python 中转换它?

import pandas as pd
import spacy

# the dataframe

# NLP Spacy with POS tags
nlp = spacy.load("en_core_web_sm")

我的问题是,如何在“文本”列上应用 nlp,检查 pos 是否为 NOUN 并将其计数并作为特征提供?

谢谢!

最佳答案

首先我创建了一个演示数据框:

import spacy
import pandas as pd
nlp = spacy.load("en_core_web_sm")
df = pd.DataFrame([["I left the country"],["Andrew is from America and he loves apples."]],columns=["text"])

看起来像这样:

enter image description here

m=[]   # empty list to save values
for x in range(len(df['text'])): # here you can have any number of rows in dataframe
doc=nlp(df['text'][x]) #here we are applying nlp on each row from text column in dataframe.
for n in doc.noun_chunks:
m.append(n.text)
print(m)
print(len(m)) # this gives the count of number of nouns in all text rows.

enter image description here

关于python - 如何计算数据框列中 Spacy 的名词数量?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/71664985/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com