gpt4 book ai didi

php - ElasticSearch 在 MySQL 中的使用

转载 作者:行者123 更新时间:2023-11-29 04:05:58 24 4
gpt4 key购买 nike

我将 ElasticSearch 用于网站的搜索组件。被索引和最终搜索的数据与保存在 MySQL 数据库中的数据相同。

我的做法是在相应的CRUD MySQL操作发生时,在索引中增删改数据。

例如,创建操作看起来像这样:

public function savePost(Request $request) {
//Firstly, create the object and save it to MySQL
$post = new Post();
$post->title = $request->title;
$post->body = $request->body;
//...
//and so on
$post->save();

//Secondly, index this new data:
$elasticSearchClient = ClientBuilder::create()->build();

$params = [
'index' => 'some_index_elasticsearch',
'id' => $post->id,
'type' => 'post',
'timestamp' => time(),
'body' => [
'id' => $post->id,
'title' => $post->title,
'body' => $post->body,
//... and so on
],
];

$elasticSearchClient->index($params);

}

如果数据在 MySQL 中被删除/更新,我只需删除它或从索引中更新它。

这是将 MySQL 与 ElasticSearch(或任何其他类似技术,如 Sphinx)结合使用的正确方法吗?或者您会推荐一种更好的方法来使用 MySQL 作为 ElasticSearch 的更多数据源吗? (这里根本没有发生,因为 ElasticSearch 和 MySQL 之间根本没有交互)。

我正在使用 https://github.com/elastic/elasticsearch-php与 ElasticSearch 交互(如果有任何不同)。

澄清一下:到目前为止,这种方法确实有效 - 我只是不确定它是否是正确的方式,或者是否有人可以看到我在这种方式下可能遇到的问题东西。

最佳答案

没有使用 Elasticsearch 的“正确方法”。 “正确”是相对的,因此“正确的方式”是一种支持您的用例的方式。 Elasticsearch 不仅适用于一种特定的用例,而且适用于越来越多的不止一种用例。

您描述的情况是完全有效的,即在 ES 中索引您在另一个 RDBMS(例如 MySQL)中的任何内容,并确保索引的内容与主要的真实来源同步。

在您的用例中,您需要牢记的一件困难的事情是您必须保证 MySQL 和 ES 始终保持 1:1 同步,由于各种原因,这不一定容易做到:

  • 如果您需要关闭 ES 进行维护,但您的应用出于任何原因必须保持运行,会发生什么情况?
  • 如果 ES 中出现问题并且文档没有被索引/更新/删除,会发生什么情况? (记住没有交易支持)

还有其他不太脆弱的同步 MySQL 和 ES 的方法,例如by using the binlog .

您需要问自己这些问题并找出减轻这些潜在问题的策略,因为我可以向您保证它们(和其他问题)肯定会出现。

总而言之,您的架构没有问题,成千上万的公司都在做完全相同的事情,但是,如果您的同步计划失败,您需要有一个计划。

关于php - ElasticSearch 在 MySQL 中的使用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40410920/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com