- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
描述druid支持的dataproc页面没有关于如何将数据加载到集群中的部分。我一直在尝试使用 GC Storage 来做到这一点,但不知道如何为其设置一个有效的规范。我希望“firehose”部分有一些针对存储桶的谷歌特定引用,但没有示例如何执行此操作。
将数据加载到 Druid 中的方法是什么,直接在 GCP dataproc 上运行?
最佳答案
我没有使用 Dataproc 版本的 Druid,但有一个在 Google Compute VM 中运行的小型集群。我从 GCS 获取数据的方式是使用 Google Cloud Storage Druid 扩展 - https://druid.apache.org/docs/latest/development/extensions-core/google.html
要启用扩展,您需要将其添加到 Druid common.properties
文件中的扩展列表中:
druid.extensions.loadList=["druid-google-extensions", "postgresql-metadata-storage"]
为了从 GCS 获取数据,我将 HTTP POST 请求发送到 http://druid-overlord-host:8081/druid/indexer/v1/task
POST 请求正文包含带有摄取规范的 JSON 文件(请参阅 ["ioConfig"]["firehose"] 部分):
{
"type": "index_parallel",
"spec": {
"dataSchema": {
"dataSource": "daily_xport_test",
"granularitySpec": {
"type": "uniform",
"segmentGranularity": "MONTH",
"queryGranularity": "NONE",
"rollup": false
},
"parser": {
"type": "string",
"parseSpec": {
"format": "json",
"timestampSpec": {
"column": "dateday",
"format": "auto"
},
"dimensionsSpec": {
"dimensions": [{
"type": "string",
"name": "id",
"createBitmapIndex": true
},
{
"type": "long",
"name": "clicks_count_total"
},
{
"type": "long",
"name": "ctr"
},
"deleted",
"device_type",
"target_url"
]
}
}
}
},
"ioConfig": {
"type": "index_parallel",
"firehose": {
"type": "static-google-blobstore",
"blobs": [{
"bucket": "data-test",
"path": "/sample_data/daily_export_18092019/000000000000.json.gz"
}],
"filter": "*.json.gz$"
},
"appendToExisting": false
},
"tuningConfig": {
"type": "index_parallel",
"maxNumSubTasks": 1,
"maxRowsInMemory": 1000000,
"pushTimeout": 0,
"maxRetry": 3,
"taskStatusCheckPeriodMs": 1000,
"chatHandlerTimeout": "PT10S",
"chatHandlerNumRetries": 5
}
}
}
在 Druid 中启动摄取任务的 cURL 命令示例(spec.json
包含上一节中的 JSON):
curl -X 'POST' -H 'Content-Type:application/json' -d @spec.json http://druid-overlord-host:8081/druid/indexer/v1/task
关于google-cloud-platform - GCP Dataproc 已推出 Druid alpha 版。如何加载段?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58028641/
我有一个传统上作为 MSI 文件提供的产品。它由我们的各种客户通过某种形式的 SMS 推送部署到数千个桌面。我们用来创建这些安装程序的软件正在使用中,我们正在寻找替换它。由于我们支持许多操作系统,我们
我们有一个使用 Gradle/Android Studio 构建的 Android 应用程序,并使用 JaCoCo 为我们的单元测试生成代码覆盖率报告;这很好用。我们也有兴趣能够为手动测试生成覆盖率报
我正在寻找有关数据库脚本修改的最佳实践的见解,这些修改与软件系统的其他代码更改一起进行。 我曾经在一家公司工作,该公司坚持每次推出都要准备好回滚,以防出现问题。这听起来很合理,但在我看来,通过脚本部署
我使用下面的代码通过 Intent 启动 Twitter,但它不起作用。我的手机上安装了 twitter 应用程序。 Intent shareIntent = new Intent(android.c
我用 1Password存储我的密码,以及 fluid.app创建一些特定于站点的应用程序/浏览器 虽然 1Password与 Chrome、Safari 和其他浏览器很好地集成,它不能很好地与 Fl
我如何启动 google maps transit get directions,以便当我按坐标或地点名称输入源和目的地时,google maps 会建议公交(公交路线)方向。这是骑自行车的代码,但我
我已经为 Android 应用程序开发了一个 SDK。我们有很多客户在应用程序中使用这个 SDK。现在我已经更新了我的 SDK。我正在寻找一种方法可以在应用程序中反射(reflect)这些更改,而无需
我有一个带 child 的 flex 容器,每个 child 都有一些内容(没有固定宽度的),并且在一个 child 上我使用 flex-grow: 1;将其填充到剩余的可用空间。 有时,正在成长的
我们即将推出使用 java web start 构建的客户端服务器应用程序。我们的主服务器位于欧洲的一个国家,第一天就会有许多用户从世界各地下载我们的客户端。由于客户端应用程序相当大(MB),因此我们
我已经尝试了很多组合,而这个是最接近我需要的组合。 我需要的是一个图像 (img1),上面有另一个(较小的)图像 (img2),当我翻转 img1 时,我希望它淡入(并在滚出时淡出),而 img2 保
北京时间 1 月 21 日晚间消息,知情人士今日称,苹果公司的首款 VR/AR(虚拟现实 / 增强现实)头显将是一款昂贵的小众产品,有望于 2022 年推出。这款产品主要为了将来更主流的 “AR
搜索 Apple Pay/Passkit/Wallet 文档,我发现代码示例很少,文档也很差。我们尝试提供我们已配置的支付通行证,而不仅仅是使用 openPaymentSetup() 启动钱包。 根据
我需要这个用于 API11 之前的项目。 我正在寻找一种从右侧添加 View 的方法,这将导致当前全屏 View 向左移出,以便在屏幕中显示新 View 。 新 View 大约是屏幕宽度的 1/3,这
Electron v1.8.2 Spectron v3.8.0 添加光谱测试,但即使是非常基本的测试也会失败。 尝试运行: const { Application } = require('spect
这是我最简单的问题。让我试着把它弄清楚。 我有一个 div,在本例中称为 "testdiv",它附加了一个类名 "menulink"。 div 中有一个链接。当我滚动链接时,我希望 div 类更改为
我想将 li 元素排列在任意数量的列中。 Yellow Block Red Block Green
我试图将 child 推到 parent 的盒子外面,但是,似乎 parent 只是在长度上扩展并获得一个滚动条,所以 child 留在里面,并且在 parent 外面不可见。 .parent {
Google Play 游戏服务:SIGN_IN 状态:ERROR_NOT_AUTHORIZED,推出 Beta 版时。还有这个:- W Auth : [GetToken] GetToken f
我正在尝试使用 Jetpack Compose,但我对 Row 的行为感到困惑。我在图标按钮旁边有一个文本,我希望图标按钮锚定在最小宽度为 48dp 的一侧,并在其周围环绕文本。像这样: 但是文本没有
我从第四行的字符 1 中收到上述错误...不知道是什么抛出了它?我确信这是我看不到的简单事情...... out = out + "Select Box Information The name of
我是一名优秀的程序员,十分优秀!