gpt4 book ai didi

ajax - Google AJAX Language API 中文

转载 作者:行者123 更新时间:2023-12-01 00:20:45 25 4
gpt4 key购买 nike

有谁知道是否支持中文拼音?我得到结果 here带有正确的中文拼音(参见“显示拼音”链接)。

谢谢。

最佳答案

我不知道 Google AJAX 语言 API 是否支持转换为拼音,但如果不支持,实际上在您的计算机上进行可通过的转换并不难。 (从拼音到汉字(字符)的反向转换要棘手得多,因为拼音非常有损。)

要自己进行转换,请获取 Unihan.zipUnihan database 的可下载版本.您真正关心的文件是 Unihan_Readings.txt。它还包含一堆你不关心的东西,而且它的存储方式也很低效,所以不要太担心文件太大。你应该提取你关心的东西并以更有效的方式存储它。

您会在其中找到制表符分隔的行,如下所示:

U+597D  kCantonese      hou2 hou3
U+597D kDefinition good, excellent, fine; well
U+597D kHangul 호
U+597D kHanyuPinlu hao3(6060) hao1(142) hao4(115)
U+597D kHanyuPinyin 21028.010:hǎo,hào
U+597D kJapaneseKun KONOMU SUKU YOI
U+597D kJapaneseOn KOU
U+597D kKorean HO
U+597D kMandarin HAO3 HAO4
U+597D kTang *xɑ̀u *xɑ̌u
U+597D kVietnamese háo
U+597D kXHC1983 0445.030:hǎo 0448.030:hào

左栏(“U+597D”)是unicode代码点,中间栏是属性名,右栏是属性值。您可以提取 kHanyuPinyin 属性或 kMandarin 属性。它们对基本相同的信息进行编码——只要选择一种更容易处理的格式即可。 (hǎo == HAO3,hào == HAO4,如果不是很明显的话)

您会注意到某些字符(例如我在此处选择的示例)有多种发音。这是一个棘手的问题。根据您想要的精度,您可以只使用列出的第一个罗马化,因为它们是按频率递减的顺序排列的。 (实际上,这是 kHanyuPinyin 与 kMandarin 有点不同的地方之一——它实际上有多个发音列表,每个都按频率排序。)

关于ajax - Google AJAX Language API 中文,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2029764/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com