gpt4 book ai didi

python - 在 CSV 中的每个单元格上迭代语言检测代码并在下一列中打印结果

转载 作者:行者123 更新时间:2023-12-01 01:12:46 24 4
gpt4 key购买 nike

我编写了一个程序,当我的输入被硬编码时,它会在检测后返回语言。我希望在迭代 CSV 单元格后得到相同的结果,并在下一列中打印相应的语言。

我创建了一个代码,可以在输入硬编码时检测语言。我现在有一个 Excel 工作表,其中包含一些不同语言的 ID 和文本。我希望我的程序逐个单元格地读取 Excel 并在相邻列中打印结果

from textblob import TextBlob
import pycountry
b = TextBlob("Si esta yayo si esta yayo alla voy ")
iso_code = b.detect_language()
# iso_code = "es"
language = pycountry.languages.get(alpha_2=iso_code)
print(language.name)

这是我希望程序迭代的 Excel

id  lyric language 
1 Hello how are you
2 Wie geht es dir
3 cómo estás
4 நீங்கள் எப்படி இருக்கிறீர்கள்
5 Comment vas-tu

如何重新修改我的代码以获得预期结果

预期:

id  lyric language      Detected Language
1 Hello how are you English
2 Wie geht es dir German
3 cómo estás Spanish
4 நீங்கள் எப்படி இருக்கிறீர்கள் Tamil
5 Comment vas-tu French

最佳答案

您没有表明您希望如何读取 Excel。根据库的不同,您可能有不同的读取 Excel 的方式。但假设您使用 pandas:

import pandas as pd
from textblob import TextBlob
import pycountry

def country(textstring):
b = TextBlob(textstring)
iso_code = b.detect_language()
language = pycountry.languages.get(alpha_2=iso_code)
return language.name

df = pd.read_excel("myexcel.xlsx")
df["Detected Language"] = df["lyric language"].apply(country)
print(df.to_string())

此方法使用 pandas 的 Series.apply() 方法来查找 lyric language 列中每个单元格的语言,并将结果分配给新列。

关于python - 在 CSV 中的每个单元格上迭代语言检测代码并在下一列中打印结果,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54678099/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com