MySQL:使用 Case 语句和 LIKE 的性能-6ren

MySQL:使用 Case 语句和 LIKE 的性能

转载作者：行者123 更新时间：2023-11-29 22:45:36

26

4

有谁知道如何处理这样的情况

有 1000 万条记录，其中包含公司名称和地址，其中大部分是脏记录，需要清理。

开始使用带有 LIKE 和正则表达式的 Case 语句构建函数来查找模式，我面临的问题是 MySQL 性能及其非常非常慢。

函数执行以下操作:删除额外的空格、非字母数字字符，并使用 LIKE 标准化名称(几乎有 100 个模式)，我知道这会非常慢，但不确定我可以尝试的其他选项是什么

我正在考虑这样的选项，例如将所有这些关键字保存到具有各自更正值的表中，并使用该表作为查找来使用函数替换关键字，这可行吗？

punctuation (could use REPLACE; not sure it there are more efficient options)
abbreviations (this is the tough one -- street = st, etc.)
Company/Restaurant/other Names standardizing: Like 
Universities to Univ, CENTER to CTR, AND to &, 
case 
when Businnes_name like '%SUBWAY%' then 'SUBWAY'
when Businnes_name like '%MCDONALDS%' then 'MCDONALD''S'
when Businnes_name like '%MCDONALD''S%' then 'MCDONALD''S'
when Businnes_name like '%STARBUCKS%' then 'STARBUCKS'
when Businnes_name like '%DUNKIN%DONUTS%' then 'DUNKIN'' DONUTS'
when Businnes_name like '%BURGER%KING%' then 'BURGER KING'

我在函数中总共得到了 100 个类似上述语句的关键字

-谢谢

最佳答案

数据清理最好使用更完整的编程语言而不是 SQL 来完成。前世，我发现Perl非常优秀。

首先使用一些 s{}{}g 命令来清理一些内容。

然后是一个 sub ，有一百行，例如如果 $str =~ m{McDonald's}i，则返回 q{MCDONALD'S}；

然后——只有这样——将数据存储到数据库中。 (您可以选择原始形式 (McDonald's) 列和规范形式 (MCDONALD'S) 列。

关于MySQL:使用 Case 语句和 LIKE 的性能，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/29158294/

26

4

0

文章推荐： javascript - 使用 Fluture 进行面向铁路的编程

文章推荐： javascript - 使用 jQuery 制作自定义范围 slider

文章推荐： javascript - 可以在 iframe 中创建一个 requestFullscreen()

java - 是否有执行 'proper' 查询的 "you like this, other people who liked this also liked these things so you might like these"方法？
我需要为登录用户生成一个建议列表。基本上是“既然你喜欢这些东西，而其他喜欢这些东西的人也喜欢这些东西，那么你可能也会喜欢这些东西”。我可能会想出一个不错的算法来产生这样的结果，但在我重新发明轮子之前
sqlite( LIKE 或 LIKE)从 LIKE ( select )获得不同的结果
此查询中有许多参数是用户可调整的，我希望用户能够创建一些文本文件，使用 sqlite3 db.sqlite ".read query.sql" > result.csv 运行查询，而不是直接将它们编辑
mysql SELECT where like and like
这个问题在这里已经有了答案: MySQL query finding values in a comma separated string (11 个回答) 11 个月前关闭。我有一个名为 pape
facebook-like - "liked"我的博主帖子的人？
我已将以下内容添加到我的 Blogger 模板中，以便在我的每个 Blogger 帖子上添加一个“赞”按钮: document.write('<iframe src="htt
facebook-like - Like 的窗口被其他元素隐藏
当我点击“推荐”时，按钮打开的窗口隐藏(不可见)在页脚后面。其实我有截图来准确解释它:http://www.diigo.com/item/image/1q1ia/tw30 当然是XFBML，因为我知道
Facebook : How to show the Facebook page likes count and Like button to like the Facebook page?
我在 facebook 上创建了一个页面“全民教育”。在我的网站中，我想提供一个点赞按钮来点赞此页面，而不是url，并且还想显示网站中该页面收到的点赞数以及点赞按钮。我使用了“添加这个”，但它显示了该
sql-server - 如何同时使用 LIKE 和 IN 运算符 like ...name LIKE IN ('alex%' ,'raj%' ,'rag%' )？
这个问题在这里已经有了答案: SQL Server, combining LIKE and IN? (3 个答案) 关闭 6 年前。我想准备一个查询: SELECT name FROM Emplo
sql - NOT LIKE 和 LIKE 不返回相反的结果
我有一个包含 200 条记录的表，其中 10 条记录的文本包含单词“TAX”。当我执行时 Select * from tbl1 WHERE [TextCol] LIKE '%TAX%' 然后我正确地
mysql like 查询获取 max like
我要执行查询: ---------------------- |name | ---------------------- |data
MySQL LIKE 和 NOT LIKE 搜索同一列
嗨，我正在为一个我没有设计的数据库编写 MySQL 请求，目前无法真正更改，我有一个问题，我还没有测试过这个，所以它可能按设计工作，但我没有当然。所以我正在搜索的表只有三列 id、标题和描述，但描述
sql - Postgresql LIKE ANY 与 LIKE
我已经尽力把这个问题说得很透彻了，所以如果你不耐烦，就跳到最后看看真正的问题是什么...... 我正在努力调整我们其中一个数据库中某些搜索功能的实现方式。为此，我正在向我们的应用程序 API 添加一些
mysql - 组合 "LIKE"、 "NOT LIKE"和 "OR"
我正在学习 MySQL，我尝试在查询中将“NOT LIKE”与“OR”结合起来，但没有成功。假设我有一个 table1，其中有一列名为“word”，如下所示: word
perl- Selenium : like() or $sel->like()?
Perl-Selenium 还提供了 Test::More 的标准方法，例如 ok()、like()、is() 等，也作为对象方法，例如$sel->like()。 ($sel 是 selenium p
facebook - Like 按钮在 "liked"时移动并破坏设计
我正在开发这个网站的前端:http://oq.totaleclips.com ，并从以下位置开发它:http://dev-jon.c2mx-hrd.appspot.com 我移动了社交按钮以使 UI
mysql - 如何使用 like/or like 的左外连接
我正在创建一个搜索功能。我的 sql 查询使用 LIKE和 OR LIKE在 where 子句中。我正在搜索的表中的字段之一称为 quantity_types它只存储与在另一个表中找到的值相对应的代码
MySQL LIKE 和 NOT LIKE 缺少一条记录
我有一个名为 platform 的表，其中有一列名为 entityid。 entityid 中的数据应该遵循 n.n.n 格式(其中 n = 1 个或多个数字，第一个数字是站点 ID)。如果我运行这
SQL:Not Like 产生的结果与 Like 的相反结果不同
所以，我正在练习考试(高中水平)，虽然我们从未想过 SQL，但在处理 MS Access 时有必要了解一点. 任务是选择名称与其所属城镇不对应的区域ID。解决方案中有以下示例: SELECT nam
MongoDB模糊查询操作案例详解(类关系型数据库的 like 和 not like)
1.作用与语法描述作用：正则表达式是使用指定字符串来描述、匹配一系列符合某个句法规则的字符串。许多程序设计语言都支持利用正则表达式进行字符串操作。MongoDB 使用 $regex 操作符来设
Facebook 'Like' 网站计数不匹配 'Like' Facebook 页面墙的帖子计数
我们有一个网站，其中有文章页面，每个页面上都有一个类似 Facebook 的按钮，并与该文章 URL(URL 编码)相关联。例如，在一些带有 url http://www.site.com/artic
sql-server - SQL NOT LIKE 和 LIKE
我在理解 SQL 中的 LIKE 和 NOT LIKE 运算符时遇到问题。这是我执行的查询: select serial_number from UNIT U group by serial_numb

首页

博学

6Ren·AI

商城

MySQL:使用 Case 语句和 LIKE 的性能