gpt4 book ai didi

python - 如何从 pandas 数据框中的文本字符串中提取所有形容词?

转载 作者:行者123 更新时间:2023-12-01 07:36:12 24 4
gpt4 key购买 nike

我正在将 CSV 加载到 pandas 数据框中。数据框中的一列是“评论”,其中包含文本字符串。我需要识别数据帧所有行中此列中的所有形容词,然后创建一个新列“形容词”,其中包含该评论中所有形容词的列表。

我尝试过使用 TextBlobs,并且能够使用发布的代码标记每个案例的词性。

import pandas as pd
from textblob import TextBlob

df=pd.read_csv('./data.csv')

def pos_tag(text):
try:
return TextBlob(text).tags
except:
return None

df['pos'] = df['reviews'].apply(pos_tag)

df.to_csv('dataadj.csv', index=False)

最佳答案

你就快到了。 TextBlob(text).tags 返回 (word, tag) 的元组列表。您只需要根据标签进行过滤(在您的情况下是JJ)。

你可以这样做:

def get_adjectives(text):
blob = TextBlob(text)
return [ word for (word,tag) in blob.tags if tag == "JJ"]

df['adjectives'] = df['reviews'].apply(get_adjectives)

编辑:为了还捕获比较/最高级形式(JJR/JJS)的形容词,请将 tag == "JJ" 替换为 tag.startswith("JJ") 应该可以。

关于python - 如何从 pandas 数据框中的文本字符串中提取所有形容词?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56980515/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com