gpt4 book ai didi

python-3.x - MeCab 未正确解析

转载 作者:行者123 更新时间:2023-12-05 06:29:09 30 4
gpt4 key购买 nike

我下载了 MeCab 来解析一些日语文本。为了对其进行测试,我尝试按照一些在线示例进行操作。

例如,我逐字遵循了这个人的提示:http://www.robfahey.co.uk/blog/japanese-text-analysis-in-python/

代码如下:

import MeCab

test = "今日はいい天気ですね。遊びに行かない?新宿で祭りがある!"
mt = MeCab.Tagger("-Ochasen -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd")
parsed = mt.parseToNode(test)

components = []
while parsed:
components.append(parsed.surface)
parsed = parsed.next

print(components)

我期望的输出是:

['', '今日', 'は', 'いい', '天気', 'です', 'ね', '。', '遊び', 'に', '行か', 'ない', '?', '新宿', 'で', '祭り', 'が', 'ある', '!', '']

但是,我得到这个:

['今日はいい天気ですね。遊びに行かない?新宿で祭りがある!', '今日はいい天気ですね。遊びに行かない?新宿で祭りがある!', 'はいい天気ですね。遊びに行かない?新宿で祭りがある!', 'いい天気ですね。遊びに行かない?新宿で祭りがある!', '天気ですね。遊びに行かない?新宿で祭りがある!', 'ですね。遊びに行かない?新宿で祭りがある!', 'ね。遊びに行かない?新宿で祭りがある!', '。遊びに行かない?新宿で祭りがある!', '遊びに行かない?新宿で祭りがある!', 'に行かない?新宿で祭りがある!', '行かない?新宿で祭りがある!', 'ない?新宿で祭りがある!', '?新宿で祭りがある!', '新宿で祭りがある!', 'で祭りがある!', '祭りがある!', 'がある!', 'ある!', '!', '']

对于熟悉 MeCab 或一般解析节点的任何人,我到底做错了什么?再次感谢您的帮助!

最佳答案

你没有做错任何事,有一个bug在 11 月发布的最新版本的 mecab-python3 中。

该错误应该会尽快修复,但现在请使用 0.7 版。

关于python-3.x - MeCab 未正确解析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53804062/

30 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com