impala - 列出需要失效/刷新的 Impala 表-6ren

impala - 列出需要失效/刷新的 Impala 表

转载作者：行者123 更新时间：2023-12-01 08:50:16

30

4

我如何以编程方式找到所有需要 INVALIDATE METADATA 语句的 Impala 表(因为它们是在 Hive 中创建的，但 Impala 尚不知道)或 REFRESH(因为列已添加、已添加数据文件等)？

最佳答案

无效元数据:

作为解决方法，创建一个 shell 脚本来执行以下步骤。

使用 beeline，连接到特定数据库并运行 show tables 语句并将输出数据保存到文件。
使用 impala-shell，连接到相同的特定数据库并运行 show tables 语句并将输出数据保存到另一个文件。
现在比较两个文件以删除重复项并从第一个文件中获取唯一表列表，该文件是仅在 hive 中但不在 impala 中的表列表。

注意:

一个。您可以遍历所有数据库并将输出保存到一个文件，而不是一次分 1 步和 2 步分别针对一个特定的数据库。在循环本身内部，您可以将输出文件重定向并附加到另一个最终输出文件，其中包含某种格式的数据，如 database.table 或 database_table，以将所有数据库中的所有表放入一个文件中。最后，执行步骤 3。

删除重复项后第二个输出文件中的唯一表将是在 hive 中删除的表，需要在 impala 中运行无效元数据以将它们从 impala 列表中删除。

hive 可以识别 impala 中表的重命名，但反之亦然，并且应该为旧表名和新表名运行无效元数据以分别在 impala 中删除和添加。这适用于大多数操作，而不仅仅是表的重命名。

刷新:

考虑一个包含 2 列和 1 行数据的文本格式表格。现在假设，第三列被添加到直线中的那个表中。

select * from table; ---gives 3 columns in beeline and 2 columns in impala since refresh is not run on impala for this table.

在这种情况下，如果我们在运行刷新之前在 impala 中运行计算统计，那么从直线中新添加的列也将从 hive 中的表架构中删除。

select * from table; ---gives 2 columns in beeline and 2 columns in impala since compute stats from impala deleted the extra column metadata of table although data resides in hdfs for that column. This might cause parsing issues in impala if the column is added somewhere in the middle or front instead of ending.

因此建议在添加新列或在直线中对现有表进行任何修改后立即在 impala 中运行 REFRESH 表名，以免丢失表架构，如上述场景中所述。

refresh table; ---Right after modification in hive run refresh in impala.

select * from table; ---gives 3 columns in beeline and 3 columns in impala since refresh is run before compute stats in impala.

关于impala - 列出需要失效/刷新的 Impala 表，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/52053556/

30

4

0

文章推荐： latex - 哪个是最好的导入/导出 LaTeX 工具？

文章推荐： .net - F# - 将简单的 for 循环转化为更多功能的结构

java - hibernate 批量更新后清除 session 、刷新、刷新？
我们知道，当使用 hibernate 对数据库进行批量更新时(即使在 HQL 中)，所做的更改不会复制到存储在当前 session 中的实体。所以我可以调用 session.refresh 来加载对
Selenium 刷新
我正在做一个项目，所有的东西都保存在事件中，所以服务器需要一些时间来响应新数据。我正在使用 Fluent 等待使用 ajax 的页面，但是这个不使用任何 ajax。所以我想刷新页面检查是否有新项目，如
刷新 Jtable
我有一个从 Vector 创建的 JTable。如何刷新 JTable 以显示添加到 Vector 的新数据？最佳答案当 TableModel 发生更改时，您的 JTable 应该会自动更新。我
JavaScript 刷新
有没有办法使用下面的代码来刷新已经存在的 div id，而不是刷新时间？ window.onload = startInterval; function startInterval() {
刷新 Shiny 的数据集
我更新了在 Shiny Server 上运行的 Shiny 应用程序使用的 DataSet.RData。但是， Shiny 的应用程序仍在旧数据上运行。我已通过浏览器历史记录清除并重新启动浏览器几次，
无限滚动网格面板的 ExtJs 刷新
我的应用程序中有一个无限滚动的网格面板(ExtJs 4.2.1)，类似于 this example .用户可以单击刷新按钮，然后必须使用数据库中的数据更新网格的行。我在刷新按钮处理程序中调用 stor
delphi - 刷新、更新和重画之间有什么区别？
我不知道这三种方法中哪一种最适合我。他们都为我工作。有谁知道刷新、更新和重画之间的区别吗？最佳答案根据在线文档: Refresh - 重新绘制屏幕上的控件。 Call Refresh method
WPF ICollectionView 刷新
有什么办法吗 ICollectionView.Refresh() 或者 CollectionViewSource.GetDefaultView(args.NewValue).Refresh(); 在
javascript - 更改查询字符串而不重新加载/刷新
这个问题已经有答案了: Updating address bar with new URL without hash or reloading the page [duplicate] (4 个回答)
javascript - setTimeout 刷新
我有一个 javascript 设置超时以在 10 秒后关闭 div，并且我想在 div 关闭时添加页面刷新。我正在使用的代码如下。 var container_close_sec = "1
php - 在多个页面之间循环(刷新)？
我有一组具有以下名称的页面.... update1.php update2.php update3.php update4.php update5.php update6.php update7.ph
php - 刷新/提交后保持选中状态的复选框以及
如果是则触发js函数。我可以使一个复选框保持选中状态，并在页面刷新时检查值并选中“checked”，并提交以下内容... checked="checked" /> 你都不记得触发js函数。这是我的
Javascript div 刷新
我正在尝试刷新 php 脚本以在数据库更新时显示更新的内容。我首先构建了我的 php，然后刷新代码，然后合并它们。但是，脚本不会更新。有谁知道为什么吗？ $(document).ready
hibernate - 如何使域实例关联无效/刷新？
当我要删除的节点扩展集合类型时，Grails中有一个错误阻止我使用removeFrom *。直接从关联中删除节点不会更新二级缓存。 A hasMany B 有什么方法可以使关联缓存手动无效或强制重新加
java - hibernate 刷新？
我正在使用 hibernate 和 mysql 来抽象一个数据库，以便在 java 驱动的网站中使用。我使用 hibernate 很好地解决了所有查询，但似乎无法弄清楚如何使用它进行更新、插入和删除，
java - 刷新 fragment
如何通过调用 oncreateview 方法重新创建 fragment ？我有一个 fragment ，用于通过表单插入新数据，单击按钮后，我想通过删除在 EditText 中输入的数据来重新创建 f
iphone - 刷新 View
当我从一个到另一个时，我试图刷新我的观点。我知道我应该将刷新代码放在 viewWillAppear 中，但我不知道该放什么代码。你们能帮帮我吗？谢谢! 最佳答案在您看来，请调用 setNeeds
flush - NSOutputStream 刷新
我正在开发 iPhone 应用程序并希望使用: CFStreamCreatePairWithSocketToHost(NULL, url, port, &serverReadStream, &serv
PHP session 刷新!
看到我已经创建了一个用于登录用户的脚本。而且我还添加了设置选项卡，以便用户可以编辑他们的设置!但是当我尝试它时，mysql 表中的数据发生了变化，但配置文件中显示的用户名和用户电子邮件保持不变!当我注
javascript - 在没有本地存储的情况下存储数据或只执行一次操作(刷新)
好的。这就是它的样子。当我启动应用程序时，我从服务器收到的第一件事是数据: {name: "test", type: "checkbox" checked: true, } 这使得其中一个复选框

首页

博学

6Ren·AI

商城

impala - 列出需要失效/刷新的 Impala 表