gpt4 book ai didi

python - 如何在 Textblob python 语言检测库中获得语言扩展

转载 作者:行者123 更新时间:2023-12-01 08:22:43 25 4
gpt4 key购买 nike

我需要一个语言检测脚本。我尝试了 Textblob 库,它现在为我提供了该语言的两个字母缩写。如何获得完整的语言扩展?

这会检测带有两个字母缩写的语言

from textblob import TextBlob
b = TextBlob("cómo estás")
language = b.detect_language()
print(language)

实际结果:es
预期结果:西类牙语

我从此链接中获得了语言列表及其缩写
https://developers.google.com/admin-sdk/directory/v1/languages

最佳答案

您使用的代码为您提供了符合 ISO 639-2 国际协议(protocol)的两个字母缩写。您可以查找这些对应关系的列表(例如 this page 并设置一种方法来仅输入一个并输出另一个,但考虑到您正在使用 python 进行编程,有人已经为您完成了这一点。

我推荐pycountry - 用于此类任务的通用库,还包含许多其他标准。使用它解决此问题的示例:

from textblob import TextBlob
import pycountry
b = TextBlob("நீங்கள் எப்படி இருக்கிறீர்கள்")
iso_code = b.detect_language()
# iso_code = "ta"
language = pycountry.languages.get(alpha_2=iso_code)
# language = Language(alpha_2='ta', alpha_3='tam', name='Tamil', scope='I', type='L')
print(language.name)

并按预期打印Tamil。西类牙语同样适用:

>>> pycountry.languages.get(alpha_2='es').name
'Spanish'

以及您在所做的任何事情中可能会遇到的大多数其他语言..

关于python - 如何在 Textblob python 语言检测库中获得语言扩展,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54522998/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com