gpt4 book ai didi

python - 在 python 中导入样板管道时遇到问题

转载 作者:太空宇宙 更新时间:2023-11-03 13:50:50 26 4
gpt4 key购买 nike

我正在使用 python 构建一个应用程序,它涉及从 RSS 提要中获取新闻文章。作为我项目的一部分,我决定使用 boilerpipe 以便仅从出现文章的 html 页面中提取文章内容。

尽管 boilerpipe 最初是为 java 编写的,但它也已移植到 python。你可以在 github 上看到它的页面:https://github.com/misja/python-boilerpipe

问题是我在尝试使用以下方式导入它时遇到异常:

from boilerpipe.extract import Extractor

我得到的错误是:

Traceback (most recent call last):
File "", line 1, in
File "build\bdist.win32\egg\boilerpipe\extract__init__.py", line 12, in
File "C:\Python26\lib\site-packages\jpype_jclass.py", line 54, in JClass
raise _RUNTIMEEXCEPTION.PYEXC("Class %s not found" % name)
jpype._jexception.ExceptionPyRaisable: java.lang.Exception: Class
de.l3s.boilerpipe.sax.HTMLHighlighter not found

可能是什么导致了这个问题,我该如何解决?

最佳答案

这对我在 Mac OS X 10.8.5 和 Python 2.7.9 上有效:

pip install JPype1    # to install https://pypi.python.org/pypi/JPype1
pip install charade
git clone https://github.com/misja/python-boilerpipe.git
cd python-boilerpipe
sudo python setup.py install

那么你应该可以在 python 控制台中做

>>> from boilerpipe.extract import Extractor
>>> extractor = Extractor(extractor='ArticleExtractor', url="http://en.wikipedia.org/wiki/Main_Page")
>>> print extractor.getText()

关于python - 在 python 中导入样板管道时遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9352259/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com