- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
在我的服务器应用程序中,我从我的 Java 应用程序连接到 Kerberos 安全的 Hadoop 集群。我正在使用各种组件,如 HDFS 文件系统、Oozie、Hive 等。在应用程序启动时,我会调用
UserGroupInformation.loginUserFromKeytabAndReturnUGI( ... );
UserGroupInformation
实例,我在应用程序生命周期内保留它。在执行特权操作时,我使用
ugi.doAs(action)
启动它们.
UserGroupInformation
中的 kerberos 票证?我找到了一个方法
UserGroupInformation.checkTGTAndReloginFromKeytab()
这似乎在接近到期时进行机票更新。我还发现此方法正在被各种 Hadoop 工具调用,例如
WebHdfsFileSystem
例如。
checkTGTAndReloginFromKeytab
什么时候需要? checkTGTAndReloginFromKeytab
我自己在我的代码中? ugi.doAs(...)
之前都这样做吗?或者更确切地说是设置一个计时器并定期调用它(多久一次)? 最佳答案
Hadoop 提交者在这里!这是一个很好的问题。
不幸的是,如果不深入了解应用程序的特定使用模式,就很难对此给出明确的答案。相反,我可以提供一般指南并描述 Hadoop 何时会自动为您处理票证续订或从 key 表重新登录,何时不会。
Hadoop 生态系统中 Kerberos 身份验证的主要用例是 Hadoop 的 RPC 框架,它使用 SASL 进行身份验证。 Hadoop 生态系统中的大多数守护进程通过一次性调用 UserGroupInformation#loginUserFromKeytab
来处理此问题。在进程启动时。这方面的示例包括 HDFS DataNode,它必须验证其对 NameNode 的 RPC 调用,以及 YARN NodeManager,它必须验证其对 ResourceManager 的调用。像 DataNode 这样的守护进程如何在进程启动时进行一次性登录,然后继续运行数月,远远超过典型的票证到期时间?
由于这是一个如此常见的用例,Hadoop 直接在 RPC 客户端层内部实现了自动重新登录机制。此代码在 RPC Client#handleSaslConnectionFailure
中可见方法:
// try re-login
if (UserGroupInformation.isLoginKeytabBased()) {
UserGroupInformation.getLoginUser().reloginFromKeytab();
} else if (UserGroupInformation.isLoginTicketBased()) {
UserGroupInformation.getLoginUser().reloginFromTicketCache();
}
FileSystem
API,
YarnClient
和 MapReduce
Job
提交。
WebHdfsFileSystem
calls UserGroupInformation#checkTGTAndReloginFromkeytab
,就像你注意到的那样。
WebHdfsFileSystem
选择在每次操作之前拨打电话。这是一个很好的策略,因为
UserGroupInformation#checkTGTAndReloginFromkeytab
only renews the ticket if it's "close" to expiration.否则,调用是空操作。
kinit
在启动应用程序之前在外部。在绝大多数情况下,这些将是短期运行的应用程序,例如 Hadoop CLI 命令。但是,在某些情况下,这些可能是运行时间更长的进程。为了支持更长时间运行的进程,Hadoop 启动了一个后台线程来更新 Kerberos 票证“接近”到期。此逻辑在
UserGroupInformation#spawnAutoRenewalThreadForUserCreds
中可见.与 RPC 层提供的自动重新登录逻辑相比,这里有一个重要的区别。在这种情况下,Hadoop 只能更新票据并延长其生命周期。根据 Kerberos 基础结构的规定,票证具有最长的可更新生命周期。在那之后,票将不再可用。在这种情况下重新登录实际上是不可能的,因为这意味着重新提示用户输入密码,他们很可能离开了终端。这意味着如果进程在票证到期后继续运行,它将无法再进行身份验证。
kinit
以交互方式登录在启动应用程序之前,如果您确信应用程序的运行时间不会超过 Kerberos 票证的最大可更新生命周期,那么您可以依靠 Hadoop 内部结构为您进行定期更新。
Apache Hadoop Compatibility
指南详细讨论了 Hadoop 开发社区对向后兼容性的 promise 。
UserGroupInformation
的界面已批注
LimitedPrivate
和
Evolving
.从技术上讲,这意味着
UserGroupInformation
的 API不被认为是公开的,它可能以向后不兼容的方式发展。实际上,已经有很多代码依赖于
UserGroupInformation
的接口(interface)。 ,所以我们根本不可能做出突破性的改变。当然,在当前的 2.x 发行版中,我不会担心方法签名会从您身下改变并破坏您的代码。
Can I rely on the various Hadoop clients they call checkTGTAndReloginFromKeytab whenever it's needed?
Should I call ever checkTGTAndReloginFromKeytab myself in my code?
If so should I do that before every single call to ugi.doAs(...) or rather setup a timer and call it periodically (how often)?
UserGroupInformation#checkTGTAndReloginFromKeytab
就在需要验证的每个操作之前。如果票据未接近到期,则该方法将是空操作。如果您怀疑您的 Kerberos 基础设施运行缓慢,并且您不希望客户端操作支付重新登录的延迟成本,那么这将是在单独的后台线程中执行此操作的一个理由。只要确保比票证的实际到期时间提前一点。你可能会借用
UserGroupInformation
里面的逻辑用于确定票证是否“接近”到期。在实践中,我个人从未见过重新登录的延迟有问题。
关于java - 我应该在对 hadoop 执行每个操作之前调用 ugi.checkTGTAndReloginFromKeytab() 吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34616676/
我有一个“有趣”的问题,即以两种不同的方式运行 wine 会导致: $> wine --version /Applications/Wine.app/Contents/Resources/bin/wi
我制作了这个网络抓取工具来获取网页中的表格。我使用 puppeteer (不知道 crontab 有问题)、Python 进行清理并处理数据库的输出 但令我惊讶的是,当我执行它时 */50 * * *
JavaScript 是否被调用或执行取决于什么?准确地说,我有两个函数,它们都以相同的方式调用: [self.mapView stringByEvaluatingJavaScriptFromStri
我目前正在使用 python 做一个机器学习项目(这里是初学者,从头开始学习一切)。 只是想知道 statsmodels 的 OLS 和 scikit 的 PooledOlS 使用我拥有的相同面板数据
在使用集成对象模型 (IOM) 后,我可以执行 SAS 代码并将 SAS 数据集读入 .Net/C# 数据集 here . 只是好奇,使用 .Net 作为 SAS 服务器的客户端与使用 Enterpr
有一些直接的 jQuery 在单击时隐藏打开的 div 未显示,但仍将高度添加到导航中以使其看起来好像要掉下来了。 这个脚本工作正常: $(document).ready(funct
这个问题已经有答案了: How do I compare strings in Java? (23 个回答) 已关闭 4 年前。 这里是 Java 新手,我正在使用 NetBeans 尝试一些简单的代
如果我将它切换到 Python 2.x,它执行 10。这是为什么? 训练逻辑回归模型 import keras.backend as
我有两个脚本,它们包含在 HTML 正文中。在第一个脚本中,我初始化一个 JS 对象,该对象在第二个脚本标记中引用。 ... obj.a = 1000; obj.
每当我运行该方法时,我都会收到一个带有数字的错误 以下是我的代码。 public String getAccount() { String s = "Listing the accounts";
我已经用 do~while(true) 创建了我的菜单;但是每次用户输入一个数字时,它不会运行程序,而是再次显示菜单!你怎么看? //我的主要方法 public static void main(St
执行命令后,如何让IPython通知我?我可以使用铃声/警报还是通过弹出窗口获取它?我正在OS X 10.8.5的iTerm上运行Anaconda。 最佳答案 使用最新版本的iTerm,您可以在she
您好,我刚刚使用菜单栏为 Swing 编写了代码。但是问题出现在运行中。我输入: javac Menu.java java Menu 它没有给出任何错误,但 GUI 没有显示。这是我的源代码以供引用:
我觉得这里缺少明显的东西,但是我看不到它写在任何地方。 我使用Authenticode证书对可执行文件进行签名,但是当我开始学习有关它的更多信息时,我对原样的值(value)提出了质疑。 签名的exe
我正在设计一个应用程序,它使用 DataTables 中的预定义库来创建数据表。我想对数据表执行删除操作,为此应在按钮单击事件上执行 java 脚本。 $(document).ready(functi
我是 Haskell 新手,如果有人愿意帮助我,我会很高兴!我试图让这个程序与 do while 循环一起工作。 第二个 getLine 命令的结果被放入变量 goGlenn 中,如果 goGlenn
我有一个用 swing 实现迷你游戏的程序,在主类中我有一个循环,用于监听游戏 map 中的 boolean 值。使用 while 实现的循环不会执行一条指令,如果它是唯一的一条指令,我不知道为什么。
我正在尝试开发一个连接到 Oracle 数据库并执行函数的 Java 应用程序。如果我在 Eclipse 中运行该应用程序,它可以工作,但是当我尝试在 Windows 命令提示符中运行 .jar 时,
我正在阅读有关 Java 中的 Future 和 javascript 中的 Promises 的内容。下面是我作为示例编写的代码。我的问题是分配给 future 的任务什么时候开始执行? 当如下行创
我有一个常见的情况,您有两个变量(xSpeed 和 ySpeed),当它们低于 minSpeed 时,我想将它们独立设置为零,并在它们都为零时退出。 最有效的方法是什么?目前我有两种方法(方法2更干净
我是一名优秀的程序员,十分优秀!