gpt4 book ai didi

java - 为 SQL 数据中的重复值分配标识符

转载 作者:行者123 更新时间:2023-11-30 22:07:16 25 4
gpt4 key购买 nike

我有一个表,它有两个属性 id 和 string。现在在我的数据中,大多数字符串都具有重复值,并且大多数字符串也共享相同的值,但它们的顺序并不相同,如下表所示:

id  | String
144 | gall stones
144 | gallstones
241 | coats tire equipment
241 | tire equipment coats
144 | google
241 | google

现在我想添加第三列,显示集合字符串属于哪个列。像 gall stones 和“gall stones”和“gallstone”属于同一组,因为它们都包含相同的字符串或“coats tire equipment”和“tire equipment coats”属于同一组。简而言之,我想使用 mysql 或 java 或任何简单的方法创建下表。因为我的数据有 350 万条记录。

id  | String               | Set
144 | gall stones | s1
144 | gallstones | s1
241 | coats tire equipment | s2
241 | tire equipment coats | s2
144 | google | s3
241 | google | s3

最佳答案

我强烈建议将其分成两个单独的表,向它们添加主键和外键。第一个表是这样的:

字符串表

seq_num (pk) | id  | String               | set_seq_num (fk)
1 | 144 | gall stones | 1
2 | 144 | gallstones | 1
3 | 241 | coats tire equipment | 2
4 | 241 | tire equipment coats | 2
5 | 144 | google | 3
6 | 241 | google | 3

设置表

seq_num (pk) | set_id
1 | s1
2 | s2
3 | s3

我不知道你打算为这些集合存储或引用哪些其他信息,但将它们保存在不同的表中,然后加入一个 sql 来获取数据对我来说似乎是最好的选择

Select string_t.id, string_t.string, set_t.set_id 
from string_table as string_t
inner join set_table as set_t
on string_table.set_seq_num = set_table.seq_num

关于java - 为 SQL 数据中的重复值分配标识符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41225654/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com