gpt4 book ai didi

python - 从特定列中删除异常值

转载 作者:太空宇宙 更新时间:2023-11-04 02:03:23 24 4
gpt4 key购买 nike

我有一个名为 bids_data 的数据框

出价数据:

  Supplier_ID  shiper_RFQ
----------
0 2305 5000
1 2309 5200
2 2305 6500
3 2307 4500
4 2301 900
5 2302 10000
6 2306 4500

我想从 shiper_RFQ 中删除离群值行并将它们存储在另一个数据框中。我尝试转换列表中的 shiper_RFQ,然后找到异常值,但效果不佳。

最佳答案

如果您有良好的数据,则使用 threshold = 0.5

threshold = 1
print(df[df['shiper_RFQ'].apply(lambda x: np.abs(x - df['shiper_RFQ'].mean()) / df['shiper_RFQ'].std() < threshold)])

还有这个

 df = df[ np.abs(df['shiper_RFQ'] - df['shiper_RFQ'].mean()) / df['shiper_RFQ'].std() < threshold]

两者的结果相同

输出

   Supplier_ID  shiper_RFQ
0 2305 5000
1 2309 5200
2 2305 6500
3 2307 4500
6 2306 4500

如果你打印你可以看到异常

print(df['shiper_RFQ'].apply(lambda x: np.abs(x - df['shiper_RFQ'].mean()) / df['shiper_RFQ'].std()))

0 0.084182
1 0.010523
2 0.468261
3 0.268329
4 1.594192
5 1.757294
6 0.268329

关于python - 从特定列中删除异常值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55255680/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com