- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
所以我有一个多线程程序,简而言之,它下载网页,处理它们并存储结果。它用于处理网页的规则和其他内容存储在数据库中。最初,数据库完全崩溃了(处理每个网页需要向数据库发出 1-50 次请求)。第 1 步是在 memcached 中缓存此信息(如果域没有规则,它只会返回一个空字符串“”),这是一个巨大的改进,与为每个处理的项目敲打数据库 1-50 次相比。但我仍在研究 memcached,它增加了网络延迟(每个处理的项目有 1-50 次往返,加起来很快,即使在本地以太网上也是如此)。
所以我想将结果缓存在进程空间的数组中,基本上是在内存中复制 memcached。数据方面还不错,我将使用 Python 集来基本上复制键:值存储(足够简单)。
但事情是这样的:通常一堆线程会访问同一个站点并且需要相同的规则集,所以我想防止雷群问题(即 10 个线程都试图获取 example.com 的规则,如果不在本地缓存中,而不是在 memcached 中,将导致数据库受到攻击,虽然不是很严重,但有点)。
设置一个线程(“update_thread”)来更新内存数组,有一个工作队列,如果线程无法从本地缓存中获取域的规则,它会将域写入工作队列,并且休眠几秒钟然后再次尝试,休眠并再次尝试,直到本地内存缓存有一个空字符串“”或一组要使用的规则。线程“update_thread”读取工作队列并从 memcached 获取规则,如果不存在,则从数据库获取规则,并将它们写入 memcached 和本地缓存(如果没有规则,则在值中传播一个空字符串“”)。这样做的缺点是添加了一个线程;更多的 GIL 争用,轻微的延迟(我们必须等待 update_thread 运行,因为我们受 GIL 的支配)。再加上另一个线程和工作队列增加了复杂性。只有“update_thread”可以写入内存缓存数组,因此不需要锁定等。
我们使用锁来控制对内存中缓存数组的写访问。如果线程找不到规则集,它会尝试从 memcached 获取规则集,如果不在其中,它会访问数据库,一旦找到规则,它就会锁定内存数组并写入规则(或空字符串“”对于值)到内存缓存。缺点:我们可能仍然有雷群问题,但这可以通过为一个域写入一个特殊的值来抵消,例如“获取规则,等一下”,这会导致其他线程等待。
还有谁能想到其他解决方案,或者对我提出的两个解决方案发表评论吗?我怀疑我会选择第 2 种方法,因为锁定 + “获取规则,稍等片刻”似乎比添加线程和工作队列更简单。还是我错过了一些非常明显和简单的解决方案?
最佳答案
如果我理解正确的话,问题是多个线程倾向于同时从 memcached 检索相同的数据。您希望协调线程,以便一个线程检索数据,而其他线程等待,并在数据到达后共享数据。
为要缓存的对象制作一个包装器类。在开始通过网络检索值之前,在缓存中放置一个空包装器。如果另一个线程查找相同的数据,它将阻塞直到值到达。
这是包装器对象:
class PendingValue(object):
def __init__(self):
self._event = threading.Event()
def get(self):
self._event.wait()
return self._value
def set(self, value):
self._value = value
self._event.set()
这是缓存:
class Cache(object):
def __init__(self):
self._dict = {}
self._lock = threading.Lock()
def __getitem__(self, key):
self._lock.acquire()
try:
pv = self._dict[key]
self._lock.release()
return pv.get()
except KeyError: #key not in cache
pv = PendingValue()
self._dict[key] = pv
self._lock.release()
value = retrieve_value_from_external_source()
pv.set(value)
return value
关于多个线程共享的 Python 内存数组(想想进程空间中的 memcached),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4721285/
只是想知道是否有可能找出谁从 Windows 共享中读取了文件(最好使用 .NET,但 win32 native 可以)? 我想做的是创建类似 awstats 的东西对于 Windows 共享,这样我
是否可以列出 Intent.ACTION_SEND ?我的意思是我需要知道是否有人通过 action_send 在 Facebook 上分享或在 Twitter 上发推文。 最佳答案 也许你想要一个更
我正在使用 Google Apps 应用程序。实际上,我想在不使用密码的情况下访问另一个 ID。我使用了 OAuth,它运行良好。但我无法分享特定人的日历。我尝试了以下代码。 GoogleOAuthP
我怎样才能只创建模拟器...可能吗?我知道,设备需要分发证书。 最佳答案 您只需将应用程序目录从 iPhone 模拟器复制到另一个实例/操作系统版本,它就应该可以工作。 因此,如果您想分发 3.1.3
我想使用多阶段构建来避免每次构建应用程序时都下载我的 Java 项目所需的所有 Maven 依赖项。 我正在考虑在第一阶段解决 Maven 依赖项,然后在第二阶段构建应用程序,这将需要访问在前一阶段下
我正在寻找保护用户下载内容的初步想法。用户下载充满有趣资源的 zip 文件,这些资源被提取到本地文件系统中以供应用程序使用。我的目标是防止用户通过互联网将下载的资源共享给其他用户(假设他们获得了对文件
我想知道在具有移动和桌面版本的网站上共享身份验证、 session 管理等的最佳方法是什么。我们正在运行 Tomcat,并且更愿意将移动站点和桌面站点的应用程序保持在不同的节点上。 我看过类似的帖子,
我发现了这个单例的实现。我怎样才能创建指向它的指针或共享指针?` 为什么这不起作用?自动测试 = Singleton::Instance(); class Singleton { public: st
我有一个 heroku 项目,我想与其他人分享。作为the instructions describe ,我使用 virtualenv 来管理环境和依赖项。有没有办法在新机器上从 requiremen
Maven 将所有 jar 存储在本地存储库 ~/.m2/repository/ 下。用户多时占用空间大。 那么,是否可以由多个用户共享这个本地存储库,或许在不同的目录结构下? 最佳答案 简单的回答
为什么共享 worker 在重新加载页面时死了?应该是复活了我该如何解决这个问题? 重装前 重新加载后(在example.com上按F5) parent worker var port = new S
我正在开发多个小型应用程序,这些应用程序将共享通用和共享模块和 Assets 。 关于如何创建项目结构的部分在这里回答:https://stackoverflow.com/a/61254557/135
我在 RHEL 上安装了 jenkins (localhost:8080),我能够成功地构建代码 现在,我想设置主/从代理。 我的笔记本电脑将充当“Master Jenkins”,而我同事的笔记本电脑
我有这种方法可以根据我使用的 EXTRA_STREAM 共享文本文件或图片。我有这两个我可以选择 i.putExtra(Intent.EXTRA_STREAM, uri); i.putExtra(In
我正在使用 R 中的一个数据分析项目,我正在使用 R 中的敏感私有(private)数据进行一些逻辑和多级建模。我爱上了 。预订 包,我已经创建了一本关于我们的工作流程和分析管道的相当广泛的书。问题是
我正在构建的应用程序需要在 UITabBarController 框架内为多个 View (及其 subview )显示共享的自定义 UIToolbar。自定义工具栏的内容在所有 View 中都是相同
我有多个应用程序,我想共享相同的 eslint 配置: - project_root/ - app1/ - node_modules/ - eslint.rc
我有多个 Electron 应用程序。一个是主应用程序,其他几个功能应用程序。主应用程序上的按钮很少,这将导致功能应用程序打开。这里的问题是每个应用程序都有一个主进程,该进程导致要利用更多的CPU。是
我正在开发一个 Node.js 后端,它通过 websocket 与一些桌面客户端进行通信,而服务器端的通信是从 Web 前端发起的。一切正常,因为我将 SockJS Connection 实例存储在
我对托管多个网站的服务器上的多个用户帐户使用私有(private) SSH key 和无密码条目。 我为每个用户帐户使用相同的私钥。 (因为我很懒?或者那是“正确”的方式)。 我现在想授权该国不同地区
我是一名优秀的程序员,十分优秀!