gpt4 book ai didi

python - 基于字典的关键词分类

转载 作者:太空宇宙 更新时间:2023-11-04 01:27:20 25 4
gpt4 key购买 nike

我对编程还很陌生,到目前为止,我一直被它的力量所吸引。在这方面,我遇到了一个问题,其中有一个数据集,其中一个变量是商品名称:“apple”、“pear”、“cauliflower”、“clog”、“sneaker”等。我想要尝试将商品分组为更高阶的东西:“水果”、“蔬菜”、“鞋子”等。我从搜索中得到的感觉是,这将是一个基于字典的分块问题,但我我不确定如何实现解决方案。我可以很容易地获得蔬菜、水果和鞋子类型的列表,但是是否存在可以专门帮助解决此类问题的现有软件包?我最熟悉 Python 和R,所以任何可以与这些语言一起使用的东西都是最有帮助的。

如果这个问题没有以足够具体的方式编写,我们深表歉意。我是 stackoverflow 的新手,但仍然掌握着窍门。

澄清:我正在尝试使用这些新的高阶标签创建一个新数据集。

最佳答案

这是我的做法:

higher_order_conversion = {
('apple', 'pear', 'kiwi'): 'fruit', #the keys must be tuples, not lists
('X', 'Y', 'Z'): 'letter', # (because tuples are immutable and therefore hashable)
('loafers', 'sneakers', 'high heels'): 'shoes'
}

data_set = [[125, 'apple'], #these numbers are id numbers, or whatever extra information you might have packaged with your data
[126, 'Y'],
[127, 'loafers'],
[103, 'kiwi']
]

print 'before', data_set

for data in data_set:
for lower_order_list in higher_order_conversion.keys():
if data[1] in lower_order_list:
data[1] = higher_order_conversion[lower_order_list]

print 'after', data_set

输出:

before [[125, 'apple'], [126, 'Y'], [127, 'loafers'], [103, 'kiwi']]
after [[125, 'fruit'], [126, 'letter'], [127, 'shoes'], [103, 'fruit']]

希望这能给你一些想法。

关于python - 基于字典的关键词分类,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16867767/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com