多分类问题，Pytorch训练中，目标值是标签，网络的输出是向量，torch是如何处理的？

bigao • 2022年7月14日 pm1:52 • 问答

在多分类任务中，经常采用 softmax 激活函数+交叉熵损失函数，因为交叉熵描述了两个概率分布的差异，然而神经网络输出的是向量，并不是概率分布的形式。所以需要 softmax激活函数将一个向量进行“归一化”成概率分布的形式，再采用交叉熵损失函数计算 loss。

THE END

二维码

应该把基础运算交给数据库还是后端程序?

WPF如何得到DataGrid 的 HeaderTemplate 中的元素信息

下一篇>>

搜索内容