gpt4 book ai didi

python-3.x - 在 MultiLabelBinarizer 中获取计数

转载 作者:行者123 更新时间:2023-11-30 08:57:00 25 4
gpt4 key购买 nike

如何获取 MultiLabelBinarizer 中的项目计数?

import pandas as pd
from sklearn.preprocessing import MultiLabelBinarizer
mlb = MultiLabelBinarizer()

pd.DataFrame(mlb.fit_transform([(1,1,2), (3,3,2,5)]),columns=mlb.classes_)

Out[0]:
1 2 3 5
0 1 1 0 0
1 0 1 1 1

我想要的不是这个

Out[0]: 
1 2 3 5
0 2 1 0 0
1 0 1 2 1

由于 1 在第 1 行中重复了 2 次,3 在第 2 行中重复了 2 次

最佳答案

from collections import Counter

data = [(1,1,2), (3,3,2,5)]
pd.DataFrame([Counter(x) for x in data]).fillna(0)

输出:

    1       2   3       5
0 2.0 1 0.0 0.0
1 0.0 1 2.0 1.0

关于python-3.x - 在 MultiLabelBinarizer 中获取计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56372324/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com