mysql - 根据重音查找重复字段-6ren

mysql - 根据重音查找重复字段

转载作者：行者123 更新时间：2023-11-29 03:11:23

24

4

好吧，这让我很烦。我从一个客户那里得到了一个电话簿数据库，其中一些结果包含带重音的名字，

有些人主要指城市领域或类别。这让我的查询结果看起来很荒谬。

数据库字符集:UTF-8

例如:

公司名称 |城市 |等等……

演示公司 |中央大街 18 号 |随便

数据库有大约 360k 条记录....所以手动检查不是一种选择。任何人都知道如何找到重音/非重音值？类似于重复列检查...

编辑:当我查询表时，我得到了两者的结果，这不是问题所在。问题是，当我显示结果时，有些显示带有重音，有些则没有。

编辑:

CREATE TABLE `enc` (
  `company` varchar(255) DEFAULT NULL,
  `address` varchar(255) DEFAULT NULL,
  `postcode` varchar(255) DEFAULT NULL,
  `city` varchar(255) DEFAULT NULL,
  `Telefon1` varchar(255) DEFAULT NULL,
  `Telefon2` varchar(255) DEFAULT NULL,
  `Telefon3` varchar(255) DEFAULT NULL,
  `Telefon4` varchar(255) DEFAULT NULL,
  `Telefon5` varchar(255) DEFAULT NULL,
  `Branche1` varchar(255) DEFAULT NULL,
  `Branche2` varchar(255) DEFAULT NULL,
  `Branche3` varchar(255) DEFAULT NULL,
  `Branche4` varchar(255) DEFAULT NULL,
  `Branche5` varchar(255) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8$$

最佳答案

你可以从这样的东西开始，它会显示是否有完全重复的行(以及它们的数量):

SELECT 
    CompanyName, City, etc... 
  , COUNT(*) AS DuplicateCount
FROM 
    TableToCheck
GROUP BY
    CompanyName, City, etc...            --- all columns except the Primary Key
HAVING 
    COUNT(*) > 1

如果您只想查找重复的地址，您可以这样做:

SELECT 
    Address
  , COUNT(*) AS DuplicateCount
FROM 
    TableToCheck
GROUP BY
    Address                     
HAVING 
    COUNT(*) > 1

再次阅读您的问题，我想我误解了您的问题。如果您不想查找重复项(因为没有)，但您想要查找带重音的单词(并可能用无重音替换它们):

您现在拥有的表格可能正在使用不区分大小写的排序规则(如 utf_general_ci 或 utf_unicode_ci)，因此您可以将表格复制到具有相同字符集的新表格中但是区分大小写的排序规则，例如 utf_bin。

然后您可以创建一个重音字符列表，然后编写一个查询以在您的新表的字段中检查该列表(这将非常慢):

SELECT nt.*
FROM NewTable AS nt 
  JOIN AccentedList AS al
WHERE nt.field LIKE CONCAT('%', al.AccentedChar, '%')
GROUP BY nt.PK

或运行查询以 REPLACE() 这些字符，例如 'ß' 和 'ss'。

关于mysql - 根据重音查找重复字段，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7779071/

24

4

0

文章推荐： MySQL 左连接计数

文章推荐： mysql - 从表中选择消息

文章推荐： iOS 工具提示图片

文章推荐： php - 提交表单后如何使下拉菜单值仍处于选中状态？

PostgreSQL 重音 + 不区分大小写的搜索
我正在寻找一种方法来支持不区分大小写 + 重音不区分搜索的良好性能。到目前为止，我们在使用 MSSql 服务器时没有遇到任何问题，在 Oracle 上我们必须使用 OracleText，而现在我们在
php - 重音 "e"即使在元标记之后也显示为问号
这个问题已经有答案了: Trouble with UTF-8 characters; what I see is not what I stored (5 个回答) 已关闭 5 年前。我刚刚将一个我
linux - 使用反引号/重音/波形符作为修饰键
我正在寻找一种在 Linux 中使用反引号 (`)/波形符 (~) 键和其他一些键创建键盘快捷键的方法。在理想情况下: 按下波形符没有任何作用按下波形符的同时按另一个键会触发(可自定义的)快捷方式
php preg_grep 和元音变音/重音
我有一个由术语组成的数组，其中一些包含重音字符。我像这样做一个 preg grep $data= array('Napoléon','Café'); $result = preg_grep('~' .
.net - DataGridView 过滤器忽略单元格、单词上的变音符号(重音)
我使用 TextBox 在 DataGridView 中进行过滤 image .这是完美的工作。表格的单元格包含 1250 个拉丁字符。我想搜索忽略单元格中单词的重音。例子。如果是文本框 "knjaz
vim - .vimrc 中的键映射(重音)和编码问题
我在 Vim 中遇到一个奇怪的映射问题。我使用的是 Azerty 键盘。在我的 .vimrc 中，我有以下命令可以在段落之间快速移动。 nnoremap _ { vnoremap _ { nnore
javascript - nodejs 中的 Utf8 重音
我尝试读取一个utf8编码的vcf文件，结果是: { "name": "=4A=61=76=69=65=72=20=4C=75=6A=C3=A1=6E", "tel":
mysql - 奇怪的 MYSQL 反引号(重音)
我的数据库中有两个表，info 和 comment，它们的结构如下: info (id(int(10)), name(varchar(80)), ...19 other columns.., phon
linux - Linux 中的 QtWebkit 重音
我使用 QtWebkit 制作了一个应用程序。在同一个 html 页面中，在 Windows 上使用重音符号(西类牙语)时可以正常工作，但在 Linux (Ubuntu) 上则不起作用。我不明白为什
php - 比较两个字符串并忽略(但不替换)重音。 PHP
我有(例如)两个字符串: $a = "joao"; $b = "joão"; if ( strtoupper($a) == strtoupper($b)) { echo $b; } 我希望它是
ruby - 将法语(重音)字符放入 Ruby 文件中
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: invalid multibyte char (US-ASCII) with Rails and Ruby
php - 重写 'pretty URLs' 时如何处理变音符号(重音)
我重写 URL 以包含用户生成的旅游博客的标题。我这样做是为了 URL 的可读性和 SEO 目的。 http://www.example.com/gallery/280-Gorges_du_Tod
c++ - 如何使用 ncurses 获取 UTF-8 重音
我最近安装了新的 Windows 10 build 14393，我想使用新的 linux 子系统。所以我决定学习 ncurses，但我找不到如何从 getch 中获取带有重音符的字符的 UTF-8 代

首页

博学

6Ren·AI

商城

mysql - 根据重音查找重复字段