gpt4 book ai didi

python - 将两个 id 合并到一个新表中?

转载 作者:行者123 更新时间:2023-11-30 22:11:54 26 4
gpt4 key购买 nike

我有一个关于文本处理的任务,我不知道如何将不同表格中的一些列合并到一个表格中

情况是这样的:我有一个名为 list 的表,其中包含 id_doctitle 列然后我创建了一个名为 term_list 的新表,其中包含当我对 list 中的标题进行一些文本处理时的结果术语列表。

term_list 表有 id_termtermdfidf柱子。最后,我想要一个名为 term_freq 的表,其中包含列 idid_termid_doc tfnormalized_tf

例子:表 list 是这样的:

id_doc             titles
11 information retrieval system
12 operating system
13 business information

term_list 在下面:

id_term     term         df    idf
21 information 2 --
22 retrieval 1 --
23 system 2 --
24 operating 1 --
25 business 1 --

我想问一下,如何创建一个表term_freq,让表变成这样?

id    id_term     id_doc    tf      normalized_tf
31 21 11 1 --
32 22 11 1 --
33 23 11 1 --
34 24 12 1 --
35 23 12 1 --
36 25 13 1 --
37 21 13 1 --

主要问题是我必须将 id_termid_doc 加入一个表中,一个 id_doc 与多个 id_term 但我不知道如何关联,因为 listterm_list 没有任何相似的列。

请帮忙:(

最佳答案

您可以遍历 term_list 中的行:

SELECT id_term, term FROM term_list

对于每个 term 使:

SELECT id_doc FROM list WHERE titles LIKE "term"

并将 id_termid_doc 对保存在表 term_freq 中。

关于python - 将两个 id 合并到一个新表中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39831016/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com