- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我已经阅读了 concurrency in practice(Limitations of shutdownNow) 中的 7.2.5 章节
shutdown的问题 现在它只返回未启动的任务。
首先我们创建 ExecutorService 来跟踪关闭后取消的任务。
跟踪执行器:
/**
* TrackingExecutor
* <p/>
* ExecutorService that keeps track of cancelled tasks after shutdown
*
* @author Brian Goetz and Tim Peierls
*/
public class TrackingExecutor extends AbstractExecutorService {
private final ExecutorService exec;
private final Set<Runnable> tasksCancelledAtShutdown =
Collections.synchronizedSet(new HashSet<Runnable>());
public TrackingExecutor(ExecutorService exec) {
this.exec = exec;
}
public void shutdown() {
exec.shutdown();
}
public List<Runnable> shutdownNow() {
return exec.shutdownNow();
}
public boolean isShutdown() {
return exec.isShutdown();
}
public boolean isTerminated() {
return exec.isTerminated();
}
public boolean awaitTermination(long timeout, TimeUnit unit)
throws InterruptedException {
return exec.awaitTermination(timeout, unit);
}
public List<Runnable> getCancelledTasks() {
if (!exec.isTerminated())
throw new IllegalStateException(/*...*/);
return new ArrayList<Runnable>(tasksCancelledAtShutdown);
}
public void execute(final Runnable runnable) {
exec.execute(new Runnable() {
public void run() {
try {
runnable.run();
} finally {
if (isShutdown()
&& Thread.currentThread().isInterrupted())
tasksCancelledAtShutdown.add(runnable);
}
}
});
}
}
然后我们创建使用 TrackingExecutor
的 Crawler:
爬虫:
/**
* WebCrawler
* <p/>
* Using TrackingExecutorService to save unfinished tasks for later execution
*
* @author Brian Goetz and Tim Peierls
*/
public abstract class WebCrawler {
private volatile TrackingExecutor exec;
@GuardedBy("this") private final Set<URL> urlsToCrawl = new HashSet<URL>();
private final ConcurrentMap<URL, Boolean> seen = new ConcurrentHashMap<URL, Boolean>();
private static final long TIMEOUT = 500;
private static final TimeUnit UNIT = MILLISECONDS;
public WebCrawler(URL startUrl) {
urlsToCrawl.add(startUrl);
}
public synchronized void start() {
exec = new TrackingExecutor(Executors.newCachedThreadPool());
for (URL url : urlsToCrawl) submitCrawlTask(url);
urlsToCrawl.clear();
}
public synchronized void stop() throws InterruptedException {
try {
saveUncrawled(exec.shutdownNow());
if (exec.awaitTermination(TIMEOUT, UNIT))
saveUncrawled(exec.getCancelledTasks());
} finally {
exec = null;
}
}
protected abstract List<URL> processPage(URL url);
private void saveUncrawled(List<Runnable> uncrawled) {
for (Runnable task : uncrawled)
urlsToCrawl.add(((CrawlTask) task).getPage());
}
private void submitCrawlTask(URL u) {
exec.execute(new CrawlTask(u));
}
private class CrawlTask implements Runnable {
private final URL url;
CrawlTask(URL url) {
this.url = url;
}
private int count = 1;
boolean alreadyCrawled() {
return seen.putIfAbsent(url, true) != null;
}
void markUncrawled() {
seen.remove(url);
System.out.printf("marking %s uncrawled%n", url);
}
public void run() {
for (URL link : processPage(url)) {
if (Thread.currentThread().isInterrupted())
return;
submitCrawlTask(link);
}
}
public URL getPage() {
return url;
}
}
}
让研究停止
方法:
public synchronized void stop() throws InterruptedException {
try {
saveUncrawled(exec.shutdownNow()); //1
if (exec.awaitTermination(TIMEOUT, UNIT)) //2
saveUncrawled(exec.getCancelledTasks()); //3
} finally {
exec = null;
}
}
}
saveUncrawled(exec.shutdownNow()); //1
在 1
行中,我们执行 shutdownNow
并保存返回(未启动)的任务。
如果我理解正确 shutdownNow
返回未开始的任务并中断已经开始的任务
exec.awaitTermination(TIMEOUT, UNIT) //2
此外,我们想将已取消的任务添加到此集合中。在 2
行,我们给出时间并等待超时终止。
问题一
为什么我们要为此操作设置超时时间?
据我了解 - shutdownNow
无论如何都会中断正在进行的任务。而且我看不出有什么理由等待。
exec.getCancelledTasks()
awaitTermination
方法在任务成功完成的情况下返回 true
因此我不清楚为什么我们在这种情况下尝试添加已取消的任务。
请阐明stop
方法的逻辑。
最佳答案
关于 boolean awaitTermination(long timeout, TimeUnit unit)
的超时:
中断一个线程并不一定会立即(或根本)停止它。引用Java Tutorial on Interrupts :
An interrupt is an indication to a thread that it should stop what it is doing and do something else. It's up to the programmer to decide exactly how a thread responds to an interrupt, but it is very common for the thread to terminate. This is the usage emphasized in this lesson.
在 ExecutorService#shutdownNow()
的 javadoc 中也有直接说明:
There are no guarantees beyond best-effort attempts to stop processing actively executing tasks. For example, typical implementations will cancel via Thread.interrupt(), so any task that fails to respond to interrupts may never terminate.
在Thread#interrupt()
的javadoc中提到了线程在中断后可能仍然存活的其他原因。 .例如:
Unless the current thread is interrupting itself, which is always permitted, the
checkAccess
method of this thread is invoked, which may cause aSecurityException
to be thrown.
如果不仔细研究ExecutorService
的javadoc,stop()
方法的逻辑并不明显。 (参见“使用示例”部分,第二个示例)。 shutdownNow()
的问题在于它试图取消所有线程,但是 (a) 这可能需要一些时间,并且 (b) 不能保证它会成功(见上文)。 awaitTermination(long, TimeUnit)
允许跟踪此进度。我将逐行通过 stop()
方法:
saveUncrawled(exec.shutdownNow());
启动 ExecutorService
的关闭并收集等待执行的任务。已完成的任务将被忽略,当前正在执行的任务也将被忽略。
if (exec.awaitTermination(TIMEOUT, UNIT))
shutdownNow()
只是向当前运行的任务发出信号,它们应该通过中断停止。它不会杀死他们。此外,在被打扰后停止工作也需要时间。因此,您必须等待执行完成。超时是为了防止您永远阻塞,以防某些任务永远无法完成(无论出于何种原因)。请记住,线程可以忽略中断,否则它们可能需要比剩余超时时间更长的时间才能停止工作。因此在 awaitTermination(TIMEOUT, UNIT)
之后可能还有一些任务。 TrackingExecutor
只收集可以取消的任务。但不是那些在超时到期后可能仍在执行的。
saveUncrawled(exec.getCancelledTasks());
如果所有任务都可以取消,awaitTermination()
返回 true
。在这种情况下,将收集所有已取消的任务。如果不是所有任务都可以取消(即 awaitTermination()
返回 false
),仍然会有一些任务未处理。
关于java - WebCrawler stop方法逻辑【并发实战7.2.5】,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42385664/
当我尝试加载库 Raster 时,我收到如下错误: 错误:inDL(x, as.logic(local), as.logic(now), ...) 中的“raster”的包或命名空间加载失败:无法加载
当我尝试加载库 Raster 时,我收到如下错误: 错误:inDL(x, as.logic(local), as.logic(now), ...) 中的“raster”的包或命名空间加载失败:无法加载
望着help section about_Comparison_Operators of PowerShell我是这样理解的: PS C:\> $false,$false -eq $true PS C
我刚刚修改了旧代码,现在似乎没有任何效果。请您指导我哪里出错了。 一些不起作用的事情是: 以前,焦点始终停留在屏幕上唯一的输入字段上。 (现在不行了),代码中的 if else 条件也不起作用。 On
请帮我找到一个使用普通 'ol javascript 的解决方案(我无法使用外部框架)。此外,CSS :hover 选择器不适用于现实世界的实现。 注册事件发生的事情设置所有调用最后注册事件数组项。
我想创建一个软件来为残障 child 交通规划公交路线(及其最佳载客量)。 这些总线具有以下规范: m 个座位(最多 7 个 - 因为有司机和助理) o 轮椅“座位”(最多 4 个) 固定的最大负载量
有人能帮我吗?似乎我的 for 逻辑根本不起作用,因为它一直在上午 12:00 返回我的开始时间 这是我的代码 Sub forlogic() Dim i As Single Dim t
我正在尝试设置 OR两个切片器过滤器之间的逻辑。两个切片器来自相同的数据集。以下是更多详细信息: 我的源表: 带切片器的视觉效果: 我的目标是,如果我从切片器 1 和切片器 2 中选择任何值,我的视觉
我有以下 C 语句: int res = x & (x ^ y); 有没有办法做同样的事情,但每次只使用一次x和y? 例如: x | (~x & y) == x | y 最佳答案 是的,通过扩展 xo
我正在创建 Azure 逻辑应用程序以将新的 Sharepoint 文件添加到 Azure Blob。 Sharepoint 由我的公司运行,我使用我的凭据登录来为逻辑应用程序创建 Sharepoin
我有一个问题要求为给定函数合成最简单的乘积表达式总和。基本上,如果 AB == CD,则函数为 1,否则为 0,结果如下: (!A && !B && !C && !D) || (!A && B &&
我正在尝试确定是否可以在不溢出的情况下计算两个 32 位整数的总和,同时仅使用某些按位运算符和其他运算符。因此,如果整数 x 和 y 可以相加而不会溢出,则以下代码应返回 1,否则返回 0。 ((((
处理乍一看需要许多嵌套 if 语句的复杂业务逻辑的好方法是什么? 例子: 折扣券。可能: 1a) 超值折扣 1b) 百分比折扣 2a) 正常折扣 2b) 累进折扣 3a) 需要访问优惠券 3b) 不需
假设我有一个“numbers”对象数组,其中包含“startNo”整数和“endNo”整数。 数组中可以有多个“数字”,我想获取一个包含修改对象的新数组,该数组仅具有不重叠的范围。 例如:如果数组有:
我在这个问题上遇到了困难。我正在使用 JavaScript。 我有一个文本区域,用于检测 @ 输入并将其位置存储在数组中。 var input = "@a @b @c" //textarea var
默认 IN 使用 OR 基本逻辑。有没有办法在范围内使用 AND 基本逻辑。 例如下面的查询 SELECT ItemId,CategoryID FROM ItemCategories WHERE Ca
我想在您将鼠标悬停在网站图像上时添加叠加层。我在这里实现了这个,它工作正常http://jsfiddle.net/stujLbjh/ 这是js代码: var divs = document.query
这个问题在这里已经有了答案: Which is faster: x>2 是否比 x>>31 快?换句话说,sar x, 2 是否比 sar x, 31 快?我做了一些简单的测试,他们似乎有相同的速度
我有grails criteriaQuery,我在这里再次检查OR逻辑,就像这样一个状态变量: or { eq("status", Status.ONE) eq("status",
我有grails criteriaQuery,我在这里再次检查OR逻辑,就像这样一个状态变量: or { eq("status", Status.ONE) eq("status",
我是一名优秀的程序员,十分优秀!