jdbc - ElasticSearch JDBC River创建重复项-6ren

jdbc - ElasticSearch JDBC River创建重复项

转载作者：行者123 更新时间：2023-12-02 23:01:32

30

4

我正在尝试使用JDBC河将我的MySQL数据库复制到我的ElasticSearch索引中。

但是，每当我启动服务器时，与MySQL表的count(*)相比，创建的文档数量就增加了一倍。我通过清空索引并重新创建映射并重新应用河流进行了多次测试。

为了完整起见，这是我的产品索引和产品类型的映射:

{
"products":{
  "properties":{
     "product_id":{
        "type":"string"
     },
     "naam":{
        "type":"string"
     },
     "merk":{
        "type":"string"
     },
     "lijn":{
        "type":"string"
     },
     "sku":{
        "type":"string"
     },
     "omschrijving":{
        "type":"string",
        "boost":"0.5"
     },
     "groep":{
        "type":"string"
     },
     "ean":{
        "type":"string",
        "boost":"2.0"
     },
     "kenmerken":{
        "type":"nested",
        "dynamic":true
     },
     "levertijd_min":{
        "type":"string"
     },
     "levertijd_max":{
        "type":"string"
     }
  }
}
}

这是我的config.json:

 {
"type": "jdbc",
"jdbc":{
    "url": "jdbc:mysql://localhost:3306/db",
    "strategy":"simple",
    "schedule" : "0 */30 8-16  ? * *",
    "user":"user",
    "versioning":true,
    "password":"password",
    "sql":"select * from producten_elasticsearch",
    "index":"products",
    "type":"products",
    "autocommit":true,
    "timezone":"TimeZone.getDefault()"
}

}

我尝试从策略:简单切换到专栏，然后再返回，但是这种情况一直在发生。

这是数据库架构:

如您所见，_id是架构上的PK。

为什么我在Elasticsearch索引中看到两倍的文档？

最佳答案

您是否尝试过在Elasticsearch中进行比较甚至寻找骗子？

还是只是将SQL COUNT(*)查询中的计数与head插件中的文档计数进行比较？

如果真是这样，那么您的问题应该是将kenmerken映射为嵌套类型。它们作为单独的文档存储在索引中

从documentation:

Internally, nested objects are indexed as additional documents, but, since they can be guaranteed to be indexed within the same "block", it allows for extremely fast joining with parent docs.

这意味着您导入的一行存储为文档，而 kenmerken存储为另一文档(并链接至 core文档)，这意味着对于一个导入的行，您要索引两个文档。这就是我可以解释双数的方式。如果不是这种情况，请忽略我的回答。

关于jdbc - ElasticSearch JDBC River创建重复项，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33389906/

30

4

0

文章推荐： javascript - 加载本地音频文件并使用Audio()播放

文章推荐： javascript - 使用 javascript 定位 DIV 的 style.left 不起作用

文章推荐： javascript - 从 Laravel View 将属性传递到 Treeselect vue 组件

文章推荐： javascript - 当我在代码中添加 .push 函数以进行循环中断时

elasticsearch - 无法使用动态模板映射在ouchdb上创建elasticsearch river
当我尝试使用动态模板来指定映射时，将对象以外的所有内容都视为字符串，则River失败。示例-我首先尝试为我的数据库清除所有先前的索引和河流-tempTest。 curl -XDELETE 'loca
elasticsearch - Elasticsearch river-5次尝试后未找到_meta文档
我正在使用Elasticsearch 1.3.0版本。当我这样使用Wikipedia插件版本2.3.0创建河流时 PUT _river/my_river/_meta -d { "type" : "
mongodb - Elasticsearch Rivers-如何用河指数制作正态指数？
我成功地为MongoDB创建了Elastic搜索河。这是我使用/创建的索引: { "type": "mongodb", "mongodb": { "collectio
couchdb - 我正在使用elasticsearch-river，有什么方法可以索引远程Couchdb吗？
我安装了一张ouchdb(1.2.1)，并且想要实现搜索引擎(elasticsearch) 但我想将搜索引擎单独安装。所以我在不同的机器上安装了elascticsearch和插件(elasticse
elasticsearch - Elasticsearch River Web集成
我正在尝试使用elasticsearch搜寻器 https://github.com/codelibs/elasticsearch-river-web 我正确地执行了所有提到的步骤，但是我不知道如何启
elasticsearch - 尝试使用jdbc River ElasticSearch插件进行批处理
我需要编写一些每天运行一次的索引作业，用于查询 Oracle 数据库表并为 ElasticSearch 建立索引。由于存在表依赖性，一些表首先索引，其他表其次索引。但围绕索引过程，我需要增强进入 ES
java - 在一维游戏中实现第二艘战舰 "River Battleship"
是否有人能够为我提供一种简单的方法，在我设计的只有一个敌人的游戏中实现第二艘敌方战舰，这是我目前的代码: import java.util.*; //Scanner that reads user i
mysql - Elasticsearch river，将经度纬度转换为geo_point
我正在使用适用于 Elasticsearch 的 MySQL JPrante JDBC River 插件来索引来自 MySQL 的数据。在记录集中，我有字段经度 (float)、纬度 (float)
jdbc - Elasticsearch river 插件的替代品
已关闭。此问题旨在寻求有关书籍、工具、软件库等的建议。不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以
elasticsearch - 关于 ElasticSearch jdbc river
在我的 MySQL 中: mysql> select * from cc; +----+------+ | id | name | +----+------+ | 1 | aa | | 2 |
mongodb - elasticsearch-mongo-river 如何更改数据字段
我使用 mongodb 将登录数据存储为一个集合，例如: //userA 登录模块 mA: { "_id" : ObjectId("uuid 1"), "user" : "userA",
jdbc - 在ElasticSearch中使用JDBC River(MYSQL)进行多索引
我已经成功地将其用于索引单个使用JDBC河进行收集。但是，我不知道如何索引多个从mysql收集。这适用于单个集合: curl -XPUT 'http://localhost:9200/_rive
mongodb - Elasticsearch River(mongodb)，建模架构
介绍我目前正在为一家公司从事项目，到目前为止，一切都很好。我们正在生产中。我们已经看到我们的质量检查人员最近发现了ElasticSearch的一些奇怪行为。我们正在将ElasticSearch与Mo
mysql - Elasticsearch JDBC River MySQL连接超时
我使用以下脚本设置了我的河流: curl -XPUT 'localhost:9200/_river/foo/_meta' -d '{ "type" : "jdbc", "jdbc" :
ElasticSearch 使用 MongoDB-River 插件返回零命中
我正在尝试使用本地 MongoDB 实例制作“elasticsearch-river-mongodb”插件。在 http://satishgandham.com/2012/09/a-complete
java - 使用 JDBC River 插入自定义索引
我正在尝试将 ElasticSearch 与 MySQL 结合使用。 JDBC River似乎正是我想要的，但我无法将数据插入 jdbc/jdbc 以外的任何地方，使用: curl -XPUT 'lo
linux - Wind River Linux，失败的依赖错误
我在 Wind River Linux 上工作。失败的依赖错误。谁能告诉我我必须做什么？从过去的一天开始我一直在尝试 root@AC-04:/home/mysql# rpm -ivh MySQL-se
java - Frog Cross River - 改进使用的数据结构
我试图从礼貌中做这个练习: 一只小 Frog 想要到达河的对岸。 Frog 目前位于位置 0，想要到达位置 X。树叶从树上落到河面上。给定一个非空的零索引数组 A，它由 N 个表示落叶的整数组成。
java - 我如何使用 elasticsearch wikipedia river？
这可能是个愚蠢的问题，但我找不到任何相关信息。我找到了 github，但在我使用命令后没有任何反应。所以，在我安装插件后，它工作正常，我使用这个命令来创建索引。 curl -XPUT localho
用于 Elasticsearch 的 mongodb river
是否有任何官方的 mongodb river 可用于 elasticsearch ？我通过模块 mogoose 在 node.js 中使用 mongodb。我在 http://www.matt-rei

首页

博学

6Ren·AI

商城

jdbc - ElasticSearch JDBC River创建重复项