- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
默认情况下,Scrapy 为使用 ImagesPipeline
保存的所有图像设置 2 天(172800 秒)Cache-Control
header 。我想将该值更新为 2592000,即 30 天。
原始的 ImagesPipeline 看起来像这样:
class ImagesPipeline(FilesPipeline):
...
@classmethod
def from_settings(cls, settings):
...
s3store = cls.STORE_SCHEMES['s3']
...
...
In 继承自 FilesPipeline,它定义了 STORE_SCHEMES
class FilesPipeline(MediaPipeline):
...
STORE_SCHEMES = {
'': FSFilesStore,
'file': FSFilesStore,
's3': S3FilesStore,
}
...
S3FilesStore 看起来像这样:
class S3FilesStore(object):
...
POLICY = 'public-read'
HEADERS = {
'Cache-Control': 'max-age=172800',
}
我测试了只编辑原始 scrapy 类中的原始值并将其从 172800 更改为 2592000。这工作正常,当我测试它时,所有图像的缓存都变成 30 天。但显然这不是一个好的解决方案,我想用我的自定义类覆盖它。
因此,为了能够覆盖 S3FilesStore
HEADERS = {}
,我必须创建一个自定义类,我称之为 CustomS3FilesStore
覆盖该变量,然后创建一个将 CustomS3FilesStore
设置为 s3store
的自定义 ImagesPipeline。
我用下面的代码来做到这一点:
# Override the default headers and policies with a 30 days cache
class CustomS3FilesStore(S3FilesStore):
POLICY = 'public-read'
HEADERS = {
'Cache-Control': 'max-age=2592000',
}
# Set S3 scheme to our own override class CustomS3FilesStore
class CustomImagesPipeline(ImagesPipeline):
@classmethod
def from_settings(cls, settings):
cls.MIN_WIDTH = settings.getint('IMAGES_MIN_WIDTH', 0)
cls.MIN_HEIGHT = settings.getint('IMAGES_MIN_HEIGHT', 0)
cls.EXPIRES = settings.getint('IMAGES_EXPIRES', 90)
cls.THUMBS = settings.get('IMAGES_THUMBS', {})
# Override the default value to our CustomS3FilesStore Class
s3store = CustomS3FilesStore
s3store.AWS_ACCESS_KEY_ID = settings['AWS_ACCESS_KEY_ID']
s3store.AWS_SECRET_ACCESS_KEY = settings['AWS_SECRET_ACCESS_KEY']
cls.IMAGES_URLS_FIELD = settings.get('IMAGES_URLS_FIELD', cls.DEFAULT_IMAGES_URLS_FIELD)
cls.IMAGES_RESULT_FIELD = settings.get('IMAGES_RESULT_FIELD', cls.DEFAULT_IMAGES_RESULT_FIELD)
store_uri = settings['IMAGES_STORE']
return cls(store_uri)
然后我在 ITEM_PIPELINES
的 settings.py 文件中使用我的 CustomImagesPipeline,如下所示:
ITEM_PIPELINES = {
'condobot.pipelines.CustomImagesPipeline': 100,
...
}
结果:当我运行爬虫时,我遇到了 0 个错误,并且所有图像都已下载。但是图像的缓存 header 仍然只有 2 天,即 172800 秒。我没有成功覆盖设置。
知道我做错了什么吗?我如何实际更改 Scrapy 图像的缓存控制?
最佳答案
问题是您并没有真正覆盖 S3FilesStore
的默认值。
*FilesStore
类在 STORE_SCHEMES
中注册属性——在 from_settings
中,它仅用于获取 AWS key 。
尝试在构造函数中设置它,如下所示:
class CustomImagesPipeline(ImagesPipeline):
def __init__(self, *args, **kwargs):
super(CustomImagesPipeline, self).__init__(*args, **kwargs)
self.STORE_SCHEMES['s3'] = CustomS3FilesStore
...
关于python - 修改 Scrapy ImagesPipeline 上的缓存 header ,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30106160/
前言: 有时候,一个数据库有多个帐号,包括数据库管理员,开发人员,运维支撑人员等,可能有很多帐号都有比较大的权限,例如DDL操作权限(创建,修改,删除存储过程,创建,修改,删除表等),账户多了,管理
这个问题已经有答案了: Condition variable deadlock (2 个回答) 已关闭 5 年前。 在研究多线程时,我编写了以下代码,但在屏幕上没有观察到输出。我在这里做错了什么?我期
复制代码 代码如下: <IfModule mod_rewrite.c> RewriteEngineOn RewriteBase/ #将www.zzvips.com跳转到www.zzv
复制代码 代码如下: <IfModule mod_rewrite.c> RewriteEngine On RewriteBase / # 把 www.zzvips.com
复制代码 代码如下: Const T_GATEWAY = "1.1.1.1" '网关 Const T_NEWDNS1 = "2.2.2.2" 'DNS1
0. 修改索引 大文本字段支持排序 PUT http://localhost:9200/lrc_blog/_mapping //请求体 { "properties": { "title": { "t
仅 react 当状态发生变化时重新渲染 . 那么为什么我会直接看到我对真实 DOM 所做的更改呢? 我知道我正在修改真实的 DOM,但是当我根本没有改变状态时触发重新渲染的是什么。 import R
Xcode beta 5 推出 @FetchRequest对于 SwiftUI。 我有一个 View ,它有一个 @FetchRequest . NSFetchRequest是在管理器中创建的,该管理
关闭。这个问题需要更多 focused .它目前不接受答案。 想改进这个问题?更新问题,使其仅关注一个问题 editing this post . 7年前关闭。 Improve this questi
我有一个表达式[text][id]应替换为链接 text 解决方案是( id 是整数) $s = preg_replace("/\[([^\]]+)(\]*)\]\[([0-9]+)\]/","$1$
我在 repo 中有一个文件,我不想让任何人更新。 我能做什么? 最佳答案 你想要svn锁:http://www.linxit.de/svnbook/en/1.2/svn.ref.svn.c.lock
说我有项目 list 。我想导出到csv,但在此之前我想做一些计算/修改。 基本上,设置如下所示: PS C:\Files> gci Directory: C:\Files Mode
我有一个非常简单的问题 - 是否可以修改 Java API 的源代码,例如Junit,JABX ? 我知道这似乎是一个非常愚蠢的问题,但它一直困扰着我一段时间。 最佳答案 如果您可以掌握源代码,那么请
我有一个带有变量/列的小标题,其中包括不同形状的小标题列表。我想为其中一个变量中的每个(子)标题添加一个变量/列。 例如此类数据 library("tibble") aaa aaa # A tibb
我有几个菜单,可以在单击时向当前链接添加变量。这是一个例子: 1 2 3 x y z 我的问题是,如果我选择“y”2次,它会添加“&cord=y”2次。相反,我希望它替
我有两个项目:一个服务项目和一个服务安装程序项目。服务项目具有适合我的产品的装配信息。它包括公司信息和正确的服务名称。一旦服务实际安装,所有这些似乎都会被忽略。安装服务时,它使用在服务安装程序的ini
以下代码何时可能产生副作用? @some = map { s/xxx/y/; $_ } @some; perlcritic 将其解释为危险的,因为例如: @other = map { s/xxx/y/
我想知道以下哪种解决方案更好:我想修改一些 .class 文件,我意识到有两种方法可以做到这一点: 反编译.class文件,修改它,最后再次编译。 - 直接用十六进制编辑器修改。 谢谢 最佳答案 在这
这是我的按钮代码 onclick 我希望我的程序等待用户单击一个 JPanel,并且当用户单击 JPanel 时,它应该在控制台上打印其名称。 此按钮代码未显示输出 JPopupMenu popu
我正在使用一个具有“getName()”方法的特定 API。 getName() 返回一个字符串。是否可以修改该字符串? API 中不包含修饰符方法,并且 String getName() 返回的是私
我是一名优秀的程序员,十分优秀!