- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Stackoverflow 社区您好
我遇到了以下问题。我有一个 scrapy 项目,已添加到我的项目中:
-.idea
-associate
-core
-scrapyproject
-- scrapyproject_one
--- spiders
---- __iniy.py__
---- dmoz_spider.py
-- __init__.py
-- items.py
-- pipelines.py
-- settings.py
我的 dmoz_spider.py 看起来像这样:
import scrapy
from scrapyproject.scrapyproject_one import items
class DmozSpider(scrapy.Spider):
name = "dmoz"
allowed_domains = ["dmoz.org"]
start_urls = [
"http://www.dmoz.org/Computers/Programming/Languages/Python/Books/",
"http://www.dmoz.org/Computers/Programming/Languages/Python/Resources/"
]
def parse(self, response):
for sel in response.xpath('//ul/li'):
item = items.ScrapyprojectItem()
item['title'] = sel.xpath('a/text()').extract()
item['link'] = sel.xpath('a/@href').extract()
item['desc'] = sel.xpath('text()').extract()
yield item
但是当我导航到 scrapyproject> 文件夹并执行时
scrapy dmoz crawl
我收到以下错误:
Traceback (most recent call last):
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\runpy.py", line 170, in _run_module_as_main
"__main__", mod_spec)
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\runpy.py", line 85, in _run_code
exec(code, run_globals)
File "C:\Users\Admin\AppData\Local\Programs\Python\Python35-32\Scripts\scrapy.exe\__main__.py", line 9, in <module>
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\cmdline.py", line 108, in execute
settings = get_project_settings()
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\utils\project.py", line 60, in get_proj
ect_settings
settings.setmodule(settings_module_path, priority='project')
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\settings\__init__.py", line 282, in set
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\utils\project.py", line 60, in g
et_project_settings
settings.setmodule(settings_module_path, priority='project')
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\settings\__init__.py", line 282,
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\cmdline.py", line 108, in
execute
settings = get_project_settings()
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\utils\project.py", line 60
, in get_project_settings
settings.setmodule(settings_module_path, priority='project')
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\settings\__init__.py", lin
e 282, in setmodule
ne 60, in get_project_settings
settings.setmodule(settings_module_path, priority='project')
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\settings\__init__.py"
, line 282, in setmodule
ct.py", line 60, in get_project_settings
settings.setmodule(settings_module_path, priority='project')
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\site-packages\scrapy\settings\__
init__.py", line 282, in setmodule
module = import_module(module)
File "c:\users\admin\appdata\local\programs\python\python35-32\lib\importlib\__init__.py", line 126
126, in import_module
return _bootstrap._gcd_import(name[level:], package, level)
File "<frozen importlib._bootstrap>", line 986, in _gcd_import
File "<frozen importlib._bootstrap>", line 969, in _find_and_load
File "<frozen importlib._bootstrap>", line 944, in _find_and_load_unlocked
File "<frozen importlib._bootstrap>", line 222, in _call_with_frames_removed
File "<frozen importlib._bootstrap>", line 986, in _gcd_import
File "<frozen importlib._bootstrap>", line 969, in _find_and_load
File "<frozen importlib._bootstrap>", line 956, in _find_and_load_unlocked
ImportError: No module named 'scrapyproject'
想知道是否有人知道我该如何解决这个问题。任何建议将不胜感激!
中号
最佳答案
好吧,我明白了。
我需要做的是将我的“spiderproject”文件夹声明为 PyCharm 中的“源文件夹”。
您可以通过转到"file">“设置”>“项目:[项目名称]”>“项目结构”来完成此操作。
选择 scrapy 项目的 1 级项目文件夹(在本例中为“spiderproject”),然后单击顶部的蓝色文件夹将其标记为源。
然后转到你的蜘蛛并
from spiderproject.items import [whatever you named your item class you defined in items.py ]
希望这有帮助。
中号
关于python - Scrapy 和 Pycharm - Stange 导入错误 - 没有名为 [在此处插入 scrapyproject 的名称] 的模块,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38054980/
计数器.txt 1 2 3 4 5 6 7 8 9 void split_str(char line_str[10]) { int i, j; i=0; char sub_
我无法解释这个 .append() 行为... var listTopic = $.parseJSON(data); for(i = 0; i ').append(listTopic[i].name)
我正在尝试以愚蠢的方式初始化 HashMap: HashMap myMap = new HashMap<>(); myMap .put(new BigDecimal(1.7), new BigDeci
我在尝试从 Children Collection 中删除一个元素时遇到了一个奇怪的行为。如您所见,第一次执行 remove 方法时,计数为 8(未更改),但如果我进入 remove 方法,元素将被删
这个问题在这里已经有了答案: Error parsing date string with `new Date` (1 个回答) 关闭 5 年前。 我注意到 javascript 在管理这个特定日期
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: Large numbers erroneously rounded in Javascript 在 java
我正在编写一个 DocumentFilter,它将所有输入到 JTextField 中的单词“top”替换为逻辑顶部符号。 使用这段代码很好,但是它很烦人,因为用户必须重新键入他们的空格,他们可以这样
给定这个 HTML <AddFileDialogPlaces id="RVT_2016 Places" delete_prior="true"> <Place id="Fav
(我已经知道其他语言,但是我正在准备的这个考试需要知道我以前从未真正研究过的 C。) 编辑:哇,这么多答案...给我几分钟时间阅读所有答案,非常感谢! 这是我的代码 int main(int argc
我只是一个业余程序员...在第二次阅读时,相隔两年多,kochan 的“Programming in Objective-C”,现在是第 6 版,到达指针章节时,我试图重振我开始使用 C 编程的旧时光
我看到我的全新 Rails 3.1 rc5 应用程序在生产模式下运行时出现了一些奇怪的随机崩溃。后端是具有 3 个瘦实例的 nginx。 [Exception] users#show (NoMetho
我有一个 TableViewController,它包含 2 个 ImageView,一些 UILabel。我这样设置包含: 一切似乎都很好。对于最后一个 UILabel,我想根据内容的长度显示所有内
Stackoverflow 社区您好 我遇到了以下问题。我有一个 scrapy 项目,已添加到我的项目中: -.idea -associate -core -scrapyproject -- s
我是一名优秀的程序员,十分优秀!