- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在为网站开发多线程抓取工具,根据另一个问题,我决定将 ThreadPool 与 QueueUserWorkItem() 一起使用。
如何连续对工作项进行排队,而不是一次将它们全部排队?我需要排队 > 300k 项目(每个用户 ID 一个),如果我循环将它们全部排队,我将耗尽内存。
所以,我想要的是:
// 1 = startUserID, 300000 = endUserID, 25 = MaxThreads
Scraper webScraper = new Scraper(1, 300000, 25);
webScraper.Start();
// return immediately while webScraper runs in the background
在此期间,当线程可用时,webScraper 不断添加所有 300000 个工作项。
这是我目前所拥有的:
public class Scraper
{
private int MaxUserID { get; set; }
private int MaxThreads { get; set; }
private static int CurrentUserID { get; set; }
private bool Running { get; set; }
private Parser StatsParser = new Parser();
public Scraper()
: this(0, Int32.MaxValue, 25)
{
}
public Scraper(int CurrentUserID, int MaxUserID, int MaxThreads)
{
this.CurrentUserID = CurrentUserID;
this.MaxUserID = MaxUserID;
this.MaxThreads = MaxThreads;
this.Running = false;
ThreadPool.SetMaxThreads(MaxThreads, MaxThreads);
}
public void Start()
{
int availableThreads;
// Need to start a new thread to spawn the new WorkItems so Start() will return right away?
while (Running)
{
// if (!CurrentUserID >= MaxUserID)
// {
// while (availableThreads > 0)
// {
// ThreadPool.QueueUserWorkItem(new WaitCallBack(Process));
// }
// }
// else
// { Running = false; }
}
}
public void Stop()
{
Running = false;
}
public static void process(object state)
{
var userID = Interlocked.Increment(ref CurrentUserID);
... Fetch Stats for userID
}
}
这是正确的方法吗?
任何人都可以指出正确的方向,以便在调用 Start() 后在后台处理我的工作项的创建,而不是一次创建所有工作项吗?
最佳答案
如果减少从工作队列中窃取工作的工作项,是否会更好地实现这一点?仅仅因为你有 300,000 件工作要做,并不意味着你需要 300,000 个 worker 来做。显然,由于您只有几个核心,因此只有少数这些工作可以并行进行,那么为什么不将大块工作分配给更少的工作人员呢?
根据每件工作所花费的时间有多稳定,您可以将其平均分配给每个工作人员,或者有一个中央队列(您必须锁定它)并且每个工作人员都可以抓取一些工作作为它用完了。
编辑:
Joe Duffy 似乎有一系列关于在这里编写工作窃取队列的文章:http://www.bluebytesoftware.com/blog/2008/08/12/BuildingACustomThreadPoolSeriesPart2AWorkStealingQueue.aspx .看起来 .Net 4 的 Threadpool 会更智能一些。但我认为对于这种情况您不需要特别复杂的东西。
关于c# - 我怎样才能连续 QueueUserWorkItems 而不是一次排队?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1403974/
我正在尝试使用下面的代码来触发多个线程来使用 HttpWebRequest。我在所有可能的请求中做了一个foreach(每个请求都有不同的数据),但是当我将请求传递给消费方法时,它似乎总是只接收列表中
也许这个问题不会出现在这里.... 我正在使用 ThreadPool.QueueUserWorkItem 写入文件夹/文件,我的问题是当它尝试写入时我遇到了 UnauthorizedAccessExc
我在 .net 4.0 中使用 C# ThreadPool.QueueUserWorkItem 线程安全吗? 例子: Parallel.ForEach(commands, commandModel =
这可能是由于缺乏对引擎盖下发生的事情的理解,或者仅仅是缺乏对一般线程的理解。当用户登录时,我需要运行一些调用 Web 服务的任务来更新我系统中的数据。由于服务可能会花费大量时间,因此我将整个过程进行了
我正在为网站开发多线程抓取工具,根据另一个问题,我决定将 ThreadPool 与 QueueUserWorkItem() 一起使用。 如何连续对工作项进行排队,而不是一次将它们全部排队?我需要排队
为什么我会收到此错误。我的变量从请求中获取名称,我也尝试了“data.qext”,但 visual studio 给我错误。 我的 WebsiteRoot/uploads/files/test.pdf
.NET 4.5 和 VS2012 是我的目标 在我的 C# 中,我有很多这样的旧代码: var stuff; ThreadPool.QueueUserWorkItem(() => {
我刚刚注意到通过 ThreadPool.QueueUserWorkItem 排队的回调顺序不是确定性的,它肯定不是回调传入的顺序。 这可以用下面的简单程序来验证: private static
我有一个 ConcurrentQueue,其中填充了任意数量的对象,我想在单独的线程中处理这些对象。 如何等待所有排队的工作项目完成?我看到的示例使用固定的 ManualResetEvents 数组,
我实现了一个日志记录方法如下: ThreadPool.QueueUserWorkItem((state) => { lock (appendLock) { using (Str
我正在使用 C# 2.0 并且想在 ThreadPool.QueueUserWorkItem 的帮助下调用带有几个参数的方法,所以我尝试如下: ThreadPool.QueueUserWorkItem
我有一个 MonoTouch 应用程序,它使用线程池来管理后台线程的数量。如果我让 ThreadPool 产生一个线程并在该线程内,它会触发一个异步 Web 请求,那么该 Web 请求是否会产生第二个
我正在尝试以这种方式使用该方法: public void Method() { ThreadPool.QueueUserWorkItem(() => {
我有一个控制台应用程序可以将定制的电子邮件(带附件)发送给不同的收件人,我想同时发送它们。我需要创建单独的 SmtpClients 来实现这一点,因此我使用 QueueUserWorkItem 来创建
请检查下面的代码示例: public class Sample { public int counter { get; set; } public string ID; pub
每当我的 ThreadPool 中的线程抛出异常时,我的代码似乎卡在线程函数内的 catch block 中。如何将异常返回到主线程? 最佳答案 最佳实践是您的后台线程不应抛出异常。让他们自己处理异常
我创建了一个通讯系统,允许我指定哪些成员应该接收通讯。然后,我遍历满足条件的成员列表,并为每个成员生成个性化消息并异步向他们发送电子邮件。 当我发送电子邮件时,我正在使用 ThreadPool.Que
我将最大线程设置为 10。然后我使用 ThreadPool.QueueUserWorkItem 添加了 22000 个任务。很可能运行程序后22000的任务并没有全部完成。有多少任务可以排队等待可用线
如果我使用 QueueUserWorkItem 将作业添加到线程池...我如何在所有作业完成之前阻止我的程序继续运行? 我知道我可以添加一些逻辑来阻止应用程序运行,直到所有作业都完成,但我想知道是否有
我现在正在使用以下代码添加排队的线程。我不喜欢它。我的同事也不会,因为他们不太了解 C#。当然,我想要的只是将要在新线程中执行的方法排队。 private static void doStuff(st
我是一名优秀的程序员,十分优秀!