gpt4 book ai didi

python - 有人解析过维基词典吗?

转载 作者:IT老高 更新时间:2023-10-28 21:56:13 26 4
gpt4 key购买 nike

Wiktionary是一个涵盖多种语言的维基词典。它甚至有翻译。我有兴趣解析它并使用数据,以前有没有人做过这样的事情?有没有我可以使用的图书馆? (最好是 Python。)

最佳答案

我曾经下载过一个维基词典,试图收集斯拉夫语言的单词和定义。我使用 elementtree 通过作为转储的 xml 文件来接近它。我会避免尝试抓取或抓取该站点,而只需下载 wikimedia 为维基词典提供的 xml 转储。转至wikimedia downloads ,查找英语维基词典转储 (enwiktionary) 并转到最近的转储。您可能需要 pages-articles.xml.bz2 文件,它只是文章内容,没有历史记录或评论。使用您在 python 中喜欢的任何 xml 处理库来解析它。我个人更喜欢元素树。祝你好运。

关于python - 有人解析过维基词典吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3364279/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com