gpt4 book ai didi

mysql - 关于重复数据的SQL

转载 作者:行者123 更新时间:2023-11-30 21:31:42 25 4
gpt4 key购买 nike

我有一个关于数据规范化的一般性问题(我进入 SQL 的第一步)。我得到了一个 CSV 文件,我已将其上传到 MySQL Workbench,并被要求进行数据规范化(使用普通格式)。我发现了一些明显的重复项,但我不确定一件事。有关于公司及其地址的数据,但是,例如在“国家”字段中,美国重复了几千次,我不确定这是否算作重复数据?我是否应该制作单独的表格,例如“国家/地区”,并为它们提供唯一 ID,假设 1 代表美国,然后更新原始表格中有美国的数据,将其替换为 1?

最佳答案

如果您想消除重复项,那么 'UNITED STATES' 确实是一个重复项。

因此,如果您的目标是规范化,则需要一个国家/地区 引用表。

请注意,在这种情况下,规范化可能会减少数据的大小。 countries 表的键可能是一个整数(4 字节)——尽管它也可以是 ISO 2 字符或 3 字符国家代码。在原始表中重复主键应该会减少数据库中数据的整体大小。

关于mysql - 关于重复数据的SQL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55864318/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com