浅谈torch中的softmax与CrossEntropy

来源:哔哩哔哩发布时间:2023-08-14 02:39:41

首先是softmax函数，我认为我在之前的文章

(资料图片仅供参考)

分类模型中为何更适合使用softmax函数？

已经较为清楚的阐述，故这里不再重复赘述。

在上文中，我较为清晰的说明了，softmax函数只是为了将我们的预测结果，表达成一种合适的结果，去拟合one-hot编码。

但是对于这种向量标签，我们并不能很好的去定义其损失函数（误差函数）。

我们理所当然应该想到均方误差函数，但实际上，均方误差函数(MSE)，对于标量标签确实能起到一个非常好的效果。

而对于一个向量标签，我们选择了一个能实现与之同等效果的CrossEntropy函数，也即交叉熵损失函数。

如上图所示，其中为正确的标签，而为预测标签(经过softmax处理后)。

该损失函数在计算上具有非常明显的便利性，即仅考虑正确标签下对应的损失。例如，我们不妨令 = [0, 1, 0]， = [, , ]，那么此时的，

即仅考虑到了正确标签下的损失。

而其优越性不仅表现在此处，其导函数更是有非常优异的性质，即：

其中为未经softmax处理前得到的预测标签。

换言之，

如下图所示：

毫无疑问，y_ == softmax(y_pred) - one_hot(y)，这是成立的。（不成立可能是精度误差导致的，看图中明显成立）。

而观察y_，对于y[1]这个样本，我们明显可以看出，其梯度是正在减少前两项的权值，而增大最后一项的权值，以努力实现正确归类至第三类，这是符合我们预期的。

故，CrossEntropy函数确实是在朝着我们的目标去实现。

标签：

浅谈torch中的softmax与CrossEntropy

浅谈torch中的softmax与CrossEntropy

freshman是什么意思（freshman）

8月14日10时 杭州亚运会体育比赛门票实时销售启动

与至亲至爱的生死约定，这个家庭38年7人完成遗体捐献

山西省襄汾县发布高温黄色预警

8.13 六穷七绝八翻车。。。

科大讯飞：上半年智慧教育C端业务占比提升至40%

铭瑄主板开机线接法图解 主板开机线接法图解

广州有哪些汽车站以及客运站 广州有哪些汽车站

市民王毅将珍藏的一批八一三抗战史料文献捐赠给上海四行仓库抗战纪念馆

猎豹浏览器彻底删除方法教学

车评头条：新的ContinentalFlyingSpur发布了第二段预告片

今日宝宝绿色大便是怎么调理（宝宝绿色大便是怎么回事）

谁参与了超50亿元阿坝州锂矿“争夺战” 知情人士透露这几家知名企业有竞拍

我们只是看戏的，别太贪！

湖北多地发布雷电、暴雨预警，请注意防范！

南京地铁12号线最新走向（南京地铁12号线最新线路图）

和田白玉跟羊脂

英语memono是什么意思（memo no是什么意思）

怪力乱神真实事件 怪力乱神

金价动力焦点可能出现在非美经济圈

作为智慧之神的你，有办法来到我身边吗（空×纳西妲）四

出马前最明显的征兆总打喷嚏吗（出马前最明显的征兆）

US violations of WTO rules exposed

安徽移动助力高铁信号全覆盖网络体验再升级

快乐8第23214期星卯预测

中国跳水“梦之队”全员军训 冲刺备战杭州亚运会

c381高铁时刻表查询（c381）

美联储再次加息意味着什么 为什么美联储加息）

肉鸡各品种出苗量增减不一，苗价能否走向同步？

港交所(0388.HK)第三季盈利同比下降32% 收入将同比跌20%至42.5亿港元

中金发研报，港交所(0388 HK)第三季盈利同比下降32%，环比增长2%，...

持续发展壮大市场主体 扶持个体工商户健康发展

近日，记者从衡水市人民政府新闻办公室召开的《衡水市市场监督管理...

河北省交通项目建设劳动竞赛暨拉练考评范围发布

日前，省交通运输厅、省总工会、省财政厅联合印发《2022年全省交通...

河北现有灌木林地2100多万亩 占全省林地面积的18.5%

日前，省林草局印发《关于科学开展灌木林地造林绿化的指导意见》提...

河北：力争2022年底前新增分布式光伏装机250万千瓦以上

近日，河北省整县(市、区)推进屋顶分布式光伏开发试点建设推进会议...

8月14日10时杭州亚运会体育比赛门票实时销售启动

铭瑄主板开机线接法图解主板开机线接法图解

广州有哪些汽车站以及客运站广州有哪些汽车站

怪力乱神真实事件怪力乱神

中国跳水“梦之队”全员军训冲刺备战杭州亚运会

美联储再次加息意味着什么为什么美联储加息）

持续发展壮大市场主体扶持个体工商户健康发展

河北现有灌木林地2100多万亩占全省林地面积的18.5%