作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个数据库,在同一个表中有非常相似的行。这些行很相似,因为它们具有几乎相同的列值。我需要将这些相应的行集成到一行中。
例如,这两个用户(u1 和 u2)应该集成:
u1 = User(name = "William Henry Gates III",
age = 55,
nationality = "american",
alma_mater = "Harvard Univesity")
u2 = User(name: "William Henry 'Bill' Gates III",
age: 55,
nationality: "America",
alma_mater: "Harvard U.")
我正在考虑使用一些 edit distance和 stemming技术。其他算法和技术建议?有什么有用的库可以使用(最好是 Python 或 Java)?
最佳答案
考虑类似 Refine ?
关于java - 数据集成问题——如何集成相似的实体,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4531433/
我是一名优秀的程序员,十分优秀!