gpt4 book ai didi

php - 维基词典 - 我无法获取本地工作副本

转载 作者:行者123 更新时间:2023-11-29 21:56:50 25 4
gpt4 key购买 nike

我将是第一个承认我不是世界上最聪明的人的人,但我对此一无所知。

我想访问英语维基词典项目的单词和每个单词的详细信息。我看到他们进行数据转储,很兴奋。整个过程持续了3秒。从那时起,我所做的就是在沮丧和恼怒中咒骂和抽烟。

我使用的是 Windows 7。
我已经安装了最新版本的 xampp(64 位,安装在根目录下)。
我已经安装了最新的 Java DK。
我已将 Xampp 和 JDK 设置为以管理员身份运行。
我已经获取了文章页面文件。
我已经解压它们了。
我使用了 mwxml2sql 工具。
我无法让它运行(无论我尝试什么设置/标志)。
我使用了 GUI 版本的 mwxml2sql 工具。
它运行 - 然后在 4300 行处出错。
该错误与 name_title 中的双键有关。

我看过 wikokit - 但这似乎落后了几年。

我迷茫了。

我查看了在重复 key 错误之前进入数据库的数据。
我可以看到一些 Blob 格式的数据。
我如何通过 php 访问该信息?

没有一个像样的(如“白痴”:D)指南吗?
我真的需要获取所有文件、安装 wiki、解析文件吗?
我该如何处理重复关键问题(不像我可以打开 sql 文件并找到相关行!)?

那么,请问 - 有没有人这样做过或者知道如何做到这一点?
我唯一能想到的就是实际尝试抓取该网站 - 我宁愿不这样做(维基组也不会)。

如果相关的话 - 我特别关注词形、PoS、发音、定义、任何短语和相关单词。像词源等东西会很好,但并不那么重要。

如果有建议,是的,我已经查看了 WordNet(设法找到了 mysql 转储,并使其正常工作)。我还看过 MRC 和 CMU dict 等资源 - 但没有一个拥有正确的权限。这就是维基词典看起来如此有吸引力的原因。但似乎格式/转储远非友好:(

那么,有什么帮助或想法吗?替代资源、指南、演练……都会有所帮助。
或者,如果您能告诉我导致错误的原因以及如何解决它,以及如何访问单词数据,那就太好了。

真诚的 - 沮丧。

最佳答案

I've looked at wikokit - but that seems a few years behind.

不,wikokit 项目还活着:) 链接:https://github.com/componavt/wikokit

您可以下载已解析的英语维基词典数据库:http://whinger.krc.karelia.ru/soft/wikokit/index.html将 SQL 转储文件上传到 MySQL 并使用从英语维基词典中提取的定义、同义词和翻译。

关于php - 维基词典 - 我无法获取本地工作副本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33068572/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com