作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在处理 convolutional neural network
用于病理变化检测 x-ray images
.这是一个简单的binary classification
任务。在项目开始时,我们聚集了大约 6000 x-rays
并请了 3 个不同的医生(领域专家)到 label
他们。他们每个人都有大约 2000 张随机选择的图像(这 3 组是可分离的 - 一张图像仅由一名医生标记)。
后 labelling
完成了我想检查每个医生有多少病例被标记为 having
和 non-having
变化,这就是我所得到的:
# A tibble: 3 x 3
doctor no_changes (%) changes (%)
<int> <dbl> <dbl>
1 1 15.9 84.1
2 2 54.1 45.9
3 3 17.8 82.2
x-rays
,假设他们“思考类似”,有和没有变化的案例的百分比应该几乎相同,但这里的情况并非如此。
x-ray
上发生了变化。另一个可以说一些不同的东西,因为通常他们不会以二进制方式看待变化 - 例如
amount/size
的变化可以决定标签,每个医生可能有不同的
cutoff
在脑海中。
removing/centering
labels bias
.这是我想出的:
label
他们(所以这次每张图片是 labelled
由 3 位不同的医生拍摄)。比我检查了医生 1 和 2/3 之间标签的分布。例如,对于医生 1 和 2,我得到了类似的信息:doctor2 no_changes changes all
doctor1 no_changes 15 3 18
changes 154 177 331
all 169 180
169
他
lebeled
的情况下因为没有变化,医生 1 只同意他的意见
15
案件。知道我已经将无变化情况下医生 2 的标签(概率)从 [1, 0] 更改为 [15/169, 1- 15/169]。同样,医生 2 有
180
x-rays
变更案例和医生1同意他在
177
案例,所以我已经更改了医生 2 的标签(概率),将案例从 [0, 1] 更改为 [1 - 177/180, 177/180]。
cross-entropy
重新训练了神经网络损失。
最佳答案
它看起来是正确的。
使用交叉熵,您实际上将模型输出的概率分布与一些引用概率进行比较 P(changes = 1)
.在二元分类中,我们通常假设我们的训练数据遵循经验分布,即产生 1.0
或 0.0
取决于标签。正如您已经注意到的那样,情况并非如此,例如以防我们对我们的数据不完全有信心。
您可以将引用概率表示为:
P(changes = 1) = P(changes = 1, doc_k = 0) + P(changes = 0, doc_k = 1)
P(changes = 0)
类似.每个联合分布可以进一步扩展:
P(changes = 1, doc_k = L) = P(changes = 1 | doc_k = X) P(doc_k = L)
P(doc_k = X)
概率只是
0
或
1
,因为我们肯定知道每个医生给出了什么注释。
P(changes = 0) = P(changes = 0 | doc_2 = 0) * 1 + 0 = 15/169
P(changes = 1) = 0 + P(changes = 1 | doc_2 = 1) * 1 = 177/180
0
和
1
来自概率值
P(doc_2 = L)
.
关于classification - 如何调整分类任务中标签的分级偏差?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60779647/
我是一名优秀的程序员,十分优秀!