AI回归模型评估指标:MSE、RMSE、MAE、R2
创始人
2024-01-09 00:35:10
0

原标题:AI回归模型评估指标:MSE、RMSE、MAE、R2

怎么评估AI回归模型的预测结果,计算回归模型预测值与真实值之间的差距?这篇文章里,作者介绍了常见指标的含义与计算方式,一起来看看吧。

上文介绍了如何利用混淆矩阵、KS和AUC等指标来评估分类模型的性能,今天我们来看一下如何评估回归模型的预测结果。

不管是分类模型还是回归模型的评估,其本质都是为了计算真实值和预测值之间的“差异”。

分类模型的“差异”体现在分类结果是否正确,而回归模型的“差异”则体现在预测值与真实值有多大的差距。

那么如何计算回归模型预测值与真实值的差距呢?常见的指标有MSE、RMSE、MAE、R²,我们来看看它们的计算方法。

一、MSE、RMSE、MAE的含义和计算

我们以一个预测气温的回归模型为例,模型计算出未来15天的气温(预测值),15天过后我们可以得到每天的实际气温(实际值),我们以此数据为基础,来计算该模型预测值与实际值的差异。

最直接的计算方式,就是计算每天气温的差值,并把差值相加即可。

但是有可能存在负数的差值,为避免正负数的差值互相抵消的情况,我们可以把每天的差值求平方之后,再相加,就可以得到一个表现差异的总数值。

因为天数是不固定的,天数越多,总差异值肯定就越大,所以我们需要再除以天数(15天),以得到一个更加通用的评估指标——MSE。

MSE(Mean Squared Error):均方误差,就是求出每天真实值和预测值的差值平方,求和后再除以天数。

我们看到,MSE有一个求平方的过程,但是平方会导致误差放大,并且使差值的量纲发生变化,为了统一量纲,我们再对MSE值求一个平方根,就是RMSE。

RMSE(Root Mean Squared Error):均方根误差,是对MSE值求平方根之后的结果。

避免正负数的差值互相抵消的方式,除了平方之外,还可以求绝对值,我们将每天的差值求绝对值,再相加除以天数,就是MAE指标了。

MAE(Mean Absolute Error):平均绝对误差,就是求出每天真实值和预测值差值的绝对值,求和后再除以天数。

整体来说,MSE会放大差异,更容易被发现,适合在开发过程中使用。MAE采用的是更简洁的计算,最接近真实的误差值,常用来作为实际评估指标。而RMSE经过了平方再开方,其数值会比MAE略大一点。

二、R²的含义和计算

我们已经可以利用MSE等指标计算模型预测值和实际值的差异了,看起来好像已经够用了,但是我们得到的是个数值,这个数可能是50、100,也可能是一万、八千,那么到底什么样的数值才是合理的呢?

只看MSE等求和类的指标的话,就显得不够直观了,我们需要想办法得到一个“系数”,来直观的表达模型预测结果的好坏,这个系数就是R²。

R²(R Squared 决定系数)= (TSS – RSS)/TSS,其中TSS为总离差平方和(实际值和实际值均值之间的差值平方和),RSS为残差平方和(实际值和预测值之间的差值平方和)。

R2的值一般都在0-1的范围内,越接近1,说明模型预测效果越好。

当然如果预测值非常离谱,导致RSS过大,超过TSS值的话,R2也可能是负值,说明模型预测效果非常差。

总结

本文我们介绍了回归模型的评估指标,学习完这两篇文章之后,我们就掌握了评估模型性能的基本方法。

下篇文章,我会再详细介绍如何评估模型的稳定性,敬请期待。

本文由 @AI小当家 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自 Unsplash,基于 CC0 协议

相关内容

热门资讯

全球AI芯片行业,正走到新的十... 经观评论 陈白 | 文 全球芯片行业最近几年的变化,可能都没有像这个月以来这么集中过。 5月19...
小米汽车新专利可改善车辆碰撞性... 【CNMO科技消息】近日,据天眼查消息,小米汽车科技有限公司申请的“三角梁和车辆”专利公布。 小米...
英特尔据悉考虑出售网络与边缘计... 知情人士透露,英特尔正考虑剥离其网络与边缘计算业务。这是新任首席执行官陈立武(Lip-Bu Tan)...
AI终端产业有望迎“排浪式”增... 《科创板日报》5月20日讯(编辑 宋子乔)5月20日,国家发展改革委举行新闻发布会。国家发展改革委政...
济宁高新区接庄街道开展职业技能... 讲师讲解无人机相关理论知识 大众网记者 朱晨 通讯员 徐士玲 济宁报道 5月13日,济宁高新区接庄街...
便宜好用的云手机排行榜 202... 在移动互联网时代,云手机凭借 “云端运行、本地零负担” 的特性,已成为游戏搬砖、多账号运营、远程办公...
iOS 18.5 续航测试出炉... 5 月 13 日,苹果发布了 iOS 18.5 正式版更新。 该版本历经 1 月左右的测试周期,新功...
光源资本刘佳宁:人工智能是一种... 5月19日至20日,深交所2025全球投资者大会在深圳举行。光源资本合伙人刘佳宁出席并演讲。 谈及...
鸿蒙电脑首发!岩山科技旗下23... 2025年5月19日,备受瞩目的华为鸿蒙电脑正式对外发布,标志着华为终端产品正式迈入“全面鸿蒙化”时...
白银首座数字孪生智能变电站建成... 5月16日16点18分,伴随着国网白银供电公司首次应用“程序操作”启动变电站工作结束,甘肃白银110...
「SE」平板成潮流,手机厂商醉... 5 月 15 日,OPPO 发布了 OPPO Pad SE,售价仅为 722 元(国补后)。其实最近...
发行“天价股票”,宁德时代真差... 在尚未看透一件事的本质之前,冷静旁观,远比狂热参与的风险更低。如果你曾做过股市里的“韭菜”,相信对此...
中信海直第二架双尾蝎A无人机入... 【民航事儿】5月18日,中信海直旗下海直通航公司正式接收第二架人影专用型“双尾蝎A”无人机系统。本次...
原创 旗... 手机厂商总爱狂刷“性能旗舰”“续航神器”“颜值担当”,可落到现实中,大多数人最在意的其实是信号和网速...
公开测评拿到性能最优,首个面向... 作为首个面向空间智能的世界模型, 悠然无界大模型今天正式对外发布。“人工智能的真正落地,一定要让数字...
美媒:美政府审查苹果与中企AI... 本报记者 陈子帅 美国《纽约时报》17日报道称,据3名知情人士透露,近几个月来,白宫和国会官员一直在...
国轩高科全球科技大会盛况:新品... 近期,国轩高科在全球科技领域的瞩目下,成功举办了2025年全球科技大会。这场盛大的行业聚会不仅迎来了...
珠海莫界科技申请视觉地图构建相... 金融界2025年5月20日消息,国家知识产权局信息显示,珠海莫界科技有限公司申请一项名为“视觉地图的...
黄仁勋:美国芯片管制完全错误,... 派生万物AI 图 AI(人工智能)芯片龙头英伟达CEO黄仁勋再谈美国芯片出口管制。 5月19日,黄仁...
华为发布首款鸿蒙电脑 本报综合 5月19日,华为正式发布nova14系列手机及首款鸿蒙电脑华为MateBookPro。其中...