python - 寻找最佳模型并将其信息纳入新专栏-6ren

python - 寻找最佳模型并将其信息纳入新专栏

转载作者：太空宇宙更新时间：2023-11-04 02:11:45

25

4

我有一个 df 如下。

p1_conf,p2_conf,p3_conf分别表示模型p1,的置信区间p2 和 p3。

我想知道如何选择每行具有最高置信区间的预测并将其存储在一些新列中。所以结果将是:

您可以使用下面的 df 作为原始 df:

df = pd.DataFrame({"id": [1,2,3,4,5],
                "Name": ["Dave","Max","Joe","Rose","Mark"],
                "model1":["Irish","German","USA","Japan","China"],
                "confidence1": [0.9,.99,.83,.45,.51],
                "prediction1": [True,False,True,False,False],
                "model2":["Oman","Nigeria","India","Russia","Brazil"],
                "confidence2": [0.1,.25,.26,.41,.01],
                "prediction2": [False,True,False,False,False],
                "model3":["Egypt","Cameron","Netherland","Canada","Mexcio"],
                "confidence3": [0.01,.23,.12,.34,.61],
                "prediction3": [True,False,True,True,False]})

结果应该是这样的:

df1 = pd.DataFrame({"id": [1,2,3,4,5],
                 "Name":["Dave","Max","Joe","Rose","Mark"],
                 "model_name":["1","2","1","3",None],
                 "predicted_gener":["Irish","Nigeria","USA","Canada",None],
                 "confidence":[0.9,0.25,.83,0.34,None],
                 "prediction":[True,True,True,True,None]})

感谢任何帮助。

最佳答案

我更新了我的答案以匹配您提供的新信息。希望这会有所帮助。

import pandas as pd

df=pd.DataFrame({"id": [1,2,3,4,5],
               "Name": ["Dave","Max","Joe","Rose","Mark"],
               "model1":["Irish","German","USA","Japan","China"],
                "confidence1": [0.9,.99,.83,.45,.51],
                "prediction1": [True,False,True,False,False],
                 "model2":["Oman","Nigeria","India","Russia","Brazil"],
                 "confidence2": [0.1,.25,.26,.41,.01],
                 "prediction2": [False,True,False,False,False],
                 "model3":["Egypt","Cameron","Netherland","Canada","Mexcio"],
                 "confidence3": [0.01,.23,.12,.34,.61],
                 "prediction3": [True,False,True,True,False]})

tweet_id = []
name = []
Model = []
Breed = []
Confidence = []

for i in range(len(df['id'])):
    confidences = [df['confidence{0}'.format(model)][i] for model in range(1,4)]
    models = ['p{0}'.format(model) for model in range(1,4)]
    breeds = [df['model{0}'.format(model)][i] for model in range(1,4)]
    isDog = [df['prediction{0}'.format(model)][i] for model in range(1,4)]

    best_one = max(zip(confidences, models, breeds, isDog), key=lambda M: M[0])

    model = best_one[1]
    breed = best_one[2]
    confidence = best_one[0]

    if not (True in isDog):
        model = breed = confidence = 'NaN'

    tweet_id.append(df['id'][i])
    name.append(df['Name'][i])
    Model.append(model)
    Breed.append(breed)
    Confidence.append(confidence)

print(pd.DataFrame({
                'tweet_id': tweet_id,
                'name': name,
                'Model': Model,
                'Breed': Breed,
                'Confidence': Confidence
                }))

输出

   tweet_id  name Model   Breed Confidence
0         1  Dave    p1   Irish        0.9
1         2   Max    p1  German       0.99
2         3   Joe    p1     USA       0.83
3         4  Rose    p1   Japan       0.45
4         5  Mark   NaN     NaN        NaN

关于python - 寻找最佳模型并将其信息纳入新专栏，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53603997/

25

4

0

文章推荐： node.js - 使用 requirejs 解决 Node 中的循环依赖

文章推荐： c - 在回调函数中访问 GTK 小部件的结构时如何避免段错误？

文章推荐： jquery - 单击一个固定按钮滚动 3 个 div

文章推荐： javascript - BlueBird promise 中的特定错误捕获

html - CSS 专栏
我需要使用 CSS 创建列。我有很多数据(名称)，我需要将其分为 3 列(就像在 Word 中一样)。我不是在考虑表格，我需要列的内容是动态的。像这样 John Smith | John Smith
html - Bootstrap CSS 专栏
我正在为一个页面开发一个快速 UI，但我仍处于早期阶段。有一件事我正在尝试做，但不太明白。在所附的屏幕截图中，我想要一个全高的列，其背景颜色为纯色，从 HR 到左侧的 footer。我用页面的基
html - 响应式 CSS 专栏
我正在尝试创建一个两列布局。主要内容列包含博客卡片，我试图放置在右上角的第二列包含。 This是博客名片。我正在使用的 Bootstrap 布局:
python - Pandas 专栏: applying a function
我有一个 pandas 数据框 df df: GROUP VALUE 1 5 2 2 1 10 2 20 1 7 我正在尝试在其中一列上应用以下函数
php - Twitter Bootstrap 3.0 专栏
我使用 Twitter Boostrap 3 作为我前端的基础，但我在使用网格列时遇到了一个问题，我不确定如何解决。我正在使用 PHP 中的循环打印出一个提要，并为每个提要回显:
html - Bootstrap Col vs Webkit 专栏
关闭。这个问题需要更多focused .它目前不接受答案。想改进这个问题吗？更新问题，使其只关注一个问题 editing this post . 关闭 7 年前。 Improve this q
python - pandas nlargest lost one 专栏
我有这个数据集: Id query count 001 abc 20 001 bcd 30 001 ccd 100 002 ace 13 002 ahhd 30
html - Wordpress 重力 PDF CSS 专栏
我正在尝试为我的 WordPress Gravity 表单 PDF 设置样式，但我似乎无法摆脱两列之间的空白。没有真正的方法来检查 PDF 上的元素，因此更改它的 CSS 并不容易。我尝试输出实际的
CSS 3 专栏——试图理解 IE6 错误修复
我正在阅读一个 CSS 技术，它有很好的文档记录 here . 它展示了如何创建带有两个固定宽度侧边栏的流畅中央列。我很清楚这项技术是如何工作的，但我不确定这是哪个问题/错误CSS 部分正在尝试修复
Node.js、sequelize 和 Unknown 专栏
我读过这个类似的问题: Sequelize Unknown column '*.createdAt' in 'field list' 但解决方案对我不起作用!为什么？这是我的代码: var User
asp.net-mvc - MVC 3 Webgrid 专栏
我目前正在开发 MVC 3 网络网格，在我希望有一个按钮的列之一中，当我将以下代码放入 View 中时，我已经实现了这一点。 @grid.GetHtml(columns: gr
python - 我有一个带有列表的 Pandas 专栏。对包含同一列中至少一个公共(public)元素的行进行分组
我有 1 列带列表的 pandas df。我想将至少有一个共同元素的所有列表分组。 Input Df : > Category 0 [IAB19, IAB81, IAB82] 1 [I
postgresql - 使用 Postgres 的 Golang UPDATE 专栏
假设我有一个表 employments 和一个结构 Employment type Employment struct { ID int `json:"id"
php - Laravel 5.2 migration comment on migration 专栏
我正在使用 laravel 5.2 开发一个项目。我有一个问题，我创建了一个迁移文件来更改列的评论。但是根据文档，它说在添加列时使用“列修饰符”。所以我不知道如何更新现有专栏的评论，有人可以帮助我吗？
ruby-on-rails - 使用 Ruby 阅读 PostgreSQL Bytea 专栏
我正在尝试使用 Ruby 从 PostgreSQL 读取 bytea 列。问题是它返回 bytea 值的十六进制编码字符串。我希望它返回的结果与我使用 File.read() 打开内容相同的二进制文件
http - fiddler HTTPMethod (GET/PUT/POST/DELETE...) 专栏
有没有一种简单的方法可以将 HTTPMethod (GET/PUT/POST/DELETE...) 列添加到 fiddler 显示？在 fiddler wiki 上找到这些说明用于添加 sessio
ruby-on-rails - Rails 行为不当 wrt Postgres SERIAL NOT NULL 专栏
我正在开发一个(当前)带有 PostgreSQL 8.4 数据库后端的 Rails 2.3.x 应用程序。在我的 Rails 应用程序中，我有一个对应于数据库表的模型，该表具有两列数据类型 SERIA
extjs - Grid Widget 专栏 - 关于 widget 变化，如何更新 grid store
我需要在网格列中显示组合框和日期字段。因此使用了 widgetcolumn 并使用这些字段创建了网格。但是现在在更改组合框或日期字段中的数据时，新值应该在网格存储中更新，以便在转到下一页并返回后，值
php - 找不到 Doctrine 专栏 : 1054 Unknown column 's.features' in 'field list' '
我在站点表中添加了一个新列“features”，并使用 Doctrine 重新生成了模型。此代码导致错误: $siteTable = Doctrine_Core::getTable("Site")

首页

博学

6Ren·AI

商城

python - 寻找最佳模型并将其信息纳入新专栏