hadoop - 是否需要有关 hive 中的交叉连接的建议以从具有1.6亿行的大表中获取通配符单词？-6ren

hadoop - 是否需要有关 hive 中的交叉连接的建议以从具有1.6亿行的大表中获取通配符单词？

转载作者：行者123 更新时间：2023-12-02 21:31:04

24

4

我有一个巨大的表，该表具有1.6亿行(诸如家装，廉价住房改善，廉价房屋等字眼)和一个具有约2万行(家装改善)的小表，我试图在大表中查找诸如'％homeimprovement％'之类的词表。所以我想要的输出会把我还给我

homeimprovment homeimprovement
homeimprovement cheaphomeimprovement
homeimprovement homeimprovementcheap

这是我当前的查询，这是一个交叉联接!
zd.domain给了我“家装”
lt.domain给了我类似的域名

create table tmp_val_words
as 
select /*+ MAPJOIN(zd) */ 
zd.domain, lt.domain as zdd_domain,
from large_table lt, small_table zd 
where 
lt.sld like 
concat('%', zd.sld ,'%');

当子集很小(例如100〜)时，这非常有用，但是当我尝试以3K或4K运行它时，它达到约99％并停留在HOURS位置，最终我将其杀死了。
有没有办法通过一次取100个名字来循环？

最佳答案

您正在交叉连接两个表。你为什么要那样做请显示表格结构，以便我们提供更多帮助。

索引 lt.sld 也会减少时间，但由于它是大表的一部分，因此会占用巨大的空间，但仍然有很大的改进。
另一件事，例如子句很慢，如果您知道任何特定的模式，请尝试使用该模式而不是在完整的句子中搜索。

关于hadoop - 是否需要有关 hive 中的交叉连接的建议以从具有1.6亿行的大表中获取通配符单词？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34243130/

24

4

0

文章推荐： docker - 列出最后N个docker镜像

文章推荐： docker - 我想在Docker-Swarm中将2个容器彼此连接

文章推荐： hadoop - java.io.IOException:无效的BCFile

jQuery 移动切换按钮开/关？
据我所知，标准 jQuery“切换”功能在 jQuery mobile 中不起作用 - 这是正确的吗？如果是这样，还有其他有效的方法吗？我想做的就是打开和关闭“播放”按钮。所以按钮 ID 是“play
leaflet - 标记簇切换开/关
他们要求我提供一个“切换按钮”来打开和关闭集群有人可以帮助我实现集群的打开/关闭吗？注意:加载超过30,000点最佳答案创建两层，一层有标记聚类，一层没有标记聚类，并将它们添加到传单控件中。例如
python - 交替开关开/关？
所以我想让我的 Python Gtk 小窗口有 2 个开关。当一个开关打开时，另一个开关关闭，反之亦然。我不太清楚如何控制这两个开关。如果有人能引导我走向正确的方向，我将不胜感激。 #!/usr/bi
javascript - 检查哪些标志是整数的开/关？
按照目前的情况，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the
android - 推送通知开/关
我为我的 android 应用程序集成了推送通知，我想为任何 android 手机/标签打开/关闭推送通知，任何人都可以帮助我... protected void onPostExecute(Blog
android - 无法在运行时更改开关文本开/关
我遇到无法更改的问题 Switch运行时的 textOn/textOff 内容。这意味着，绑定(bind)到简单按钮(用于测试目的)的以下代码不起作用: private int _counter =
ios - 测试iphone屏幕是否开/关
我正在开发一个应用程序来测试 iPhone 屏幕是关闭还是打开，我尝试了堆栈溢出中指定的加速度计代码，它在屏幕开启状态下运行良好，但是当我关闭屏幕时，加速度计没有停用。所以我开始怀疑当屏幕关闭时加速
ios - 如何使用自动闪光模式检测闪光灯开/关？
我想将前置闪光灯设置为自动闪光灯，因此前置摄像头不支持闪光灯，所以我必须将一个 View 设置为白色，以便它作为闪光灯使用，现在我的问题是如果用户设置了怎么办闪光模式自动？当我必须显示 Flash V
Jquery 切换表行开/关
我有一个表，其中每隔一个表行都有一个类名“hideme”。在我制作的 css 文件中 .hideme { display:none} 隐藏行包含一个密码字段和一个按钮。在任何给定时间只能显示一个隐藏行
jquery - 使用图像自定义复选框开/关
我正在尝试使用 css 切换复选框，使用开/关图像进行切换。但是它并没有发生，fiddle . I agree input[type=checkbox] { display:non
javascript - 如何使用javascript检测手机的GPS和WIFI开/关？
我正在为智能手机编写一个网站。我使用 javascript: navigator.geolocation.getCurrentPosition 来获取位置。尽管如此，在执行此功能之前，我需要检测 G
android - 设置数据漫游开/关
如何在我的 Android 应用程序中以编程方式设置数据漫游开/关？最佳答案提前为重新打开一个死帖而道歉，但我已经通过调用这个可执行文件设法实现了它: su -c settings put glo
java - 播放列表随机播放开/关
我正在用 java 编程，但我也可以采用 C++(甚至伪)代码，没问题。这是我的意思: 我有一个类似播放列表的东西，例如 List lsMyPlaylist .现在我想给用户洗牌的机会，然后再回到有序
php - 在没有仅索引表的情况下跟踪开/关
我正在寻找最好的、最具可扩展性的方式来跟踪大量的开/关。开/关适用于项目，编号从 1 到大约 6000 万。 (在我的例子中，开/关是成员(member)的书是否被编入索引，这是一个单独的过程。) 开
android - 如何以编程方式主动检查屏幕开/关？
我发现下面的代码可以以被动的方式做到这一点。 context.registerReceiver(this.ScreenOffReceiver, new IntentFilter(Intent.ACTI
Applescript Mojave 切换辅助功能灰度开/关
我有一个脚本，我定期运行以使用 Applescript 打开/关闭灰度。它在 High Sierra 上运行良好，但当我在 Mojave 使用它时抛出异常。 tell application "Sys
Matplotlib Python 内联开/关
如果我启动一个内联 Matplotlib 的 IPython Notebook，有没有办法随后绘制一个图形，以便它以“标准”、非内联的方式显示，而无需在没有内联命令的情况下重新加载笔记本？我希望能够
android - 使用CheckBoxPreference切换手机的声音，振动和互联网访问的开/关
如何使用Android中的CheckBoxPreference切换整个系统的声音，振动，数据连接和wifi？我想在我的应用程序中正在运行 Activity 时禁用这些功能。最佳答案我想到了。在
php - yii 切换维护模式开/关
我想在我的网站上创建一个维护模式，我想放置一个只有管理员才能看到的按钮来打开/关闭维护模式。这允许管理员继续查看网络，但其他访问者则不能。我读过有关 catchAllRequest 的内容，创建一
javascript - 如何检测浏览器的缓存设置(开/关)
如何检测客户端或服务器端 (ASP.NET) 的浏览器缓存设置。基本上尝试检测用户浏览器是否打开或关闭了缓存。如果关闭，我想将他们重定向到一个包含错误消息的页面，告诉他们打开它。这可能吗？最佳答案

首页

博学

6Ren·AI

商城

hadoop - 是否需要有关 hive 中的交叉连接的建议以从具有1.6亿行的大表中获取通配符单词？