gpt4 book ai didi

python - 如何检测网页的语言

转载 作者:太空宇宙 更新时间:2023-11-04 03:36:05 25 4
gpt4 key购买 nike

是否有提供网页原始语言的 meta 标记,或者我可以使用某些库来检测它?例如:

detect_language('https://play.google.com/store/movies/details?id=lzLX-xKfQhE')
==> DE (German)

detect_language('https://itunes.apple.com/jp/movie/gon-garu-zi-mu-ban/id944521490?l=en')
==> JP (Japanese)

最佳答案

这两个页​​面的语言可以说是英语!页面上的大部分内容都使用其他语言,但页面结构(标签、链接等)是英文的,并且每个页面上的元标记都符合此评估。

来自 Google Play 页面:

<html lang="en_US">
^^^^^^^^^^^^

从 iTunes Store 页面:

<html prefix="og: http://ogp.me/ns#" xmlns="http://www.apple.com/itms/" lang="en">
^^^^^^^^^

存在一些可以尝试执行语言检测的 API。一个这样的(商业)例子是 Google Translate's Detect Language call .不过,这样的 API 将如何处理这些页面有点令人费解;有一个强有力的论点说他们都是英国人。

关于python - 如何检测网页的语言,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29043771/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com