首页 > 生活 > 生活妙招

评价模型有哪些(5种常用的分析方法)

常驻编辑 生活妙招 2022-01-21 模型   常用   评价
QIV拜客生活常识网

但对于某一个具体的业务场景与一定的条件约束,找到那个最合适的模型也并不是没有思路。奥卡姆剃刀就是这其中的一个非常重要的指导思想。QIV拜客生活常识网

“如无必要,勿增实体”,这是奥卡姆剃刀原则的全部。QIV拜客生活常识网

试想一下,从拿到数据,再到根据这些数据训练模型,并输出结果,这其中导致模型输出特定结果发生的原因可能来自哪里?这个原因毫无疑问会来自数据携带的信息,也会来自在特征工程时做过的处理,还会来自模型本身带有的归纳偏置。QIV拜客生活常识网

如果一个对数据科学与数据处理原理不是很明白的人,或者是一些模型的探索者、业务的实践者,看到了模型的运行机制,强行修改模型,这等同于在这个数据信息处理的过程中,加入了除数据规律、特征工程提取、模型归纳偏置之外的其他信息。例如,在CART决策树模型中,某建模人员把按照Gini系数减少最多的决策特征排列,强行变换了其中两个中间节点的特征位置,这就人为地加入了对特征重要程度的判断。当然,如果建模人员有非常非常非常确定的把握,经过了改造的模型也是有可能表现出更好的泛化能力的。但考虑到很多情况,人总是经不住拍脑袋做决定的冲动,强行改造模型都是一种业务上的尝试,改造后的模型基本没有复用性。对整体业务结果与性能的提升程度,其实不如好好研究怎么选择样本,怎么进行特征工程来得实在。QIV拜客生活常识网

奥卡姆剃刀原则在底层逻辑上对没有根据就随意修改模型的行为说了“不”,即使是为了尝试。不过,这并不是说在选择模型时不应该尝试去,而是说可以去尝试各种模型隐含的假设的合理性,尝试某个特征工程环节的有效性,而不应该去尝试“任意改造模型”的可行性。QIV拜客生活常识网

数据科学,其实就是一场信息游戏。QIV拜客生活常识网

虽然很难通过一个万能的模型整合世界上所有数据带有的信息,但通过迁移的方式对领域内的信息进行整合,并应用于更多相关业务场景,却是一个非常有效的折中。近几年,在NLP领域中大行其道的BERT等带有预训练机制的模型,充分整合了自然语言中的先验信息,让模型在非常多的场景下都可以得到“屠榜”的业务效果。同样神奇还有另一个模型——GPT3。在整合了极其巨量的互联网数据信息,并以1750亿参数为调整空间,它可以帮助人们完成设计原型图、制作资产负债表、查到某些名人的社交账号等等。QIV拜客生活常识网

万能的模型虽然很难构建,但是不是我们已经可以看到它的身影了?QIV拜客生活常识网

今天的分享就到这里,谢谢大家。QIV拜客生活常识网

文章作者:途索 阿里巴巴 算法专家QIV拜客生活常识网

内容来源:《数据分析通识》QIV拜客生活常识网

QIV拜客生活常识网

相关阅读:

  • 3d打印软件有哪些(3d打印模型素材下载)
  • 驾模要多久(做牙模型需要多久)
  • 数据挖掘实例及数据分析流程,数据挖掘的概念与过程
  • 人工智能与动物对话
  • 改变世界的发明32丨DNA双螺旋结构分子模型
  • 氧化锌的蚀刻模型
  • 白癜风原创突破背后:一部历时六年的“失败简史”
  • 数字孪生城市,提升城市高效运营管理,推动智慧城市建设
  • 科学家建立仿真模型以研究大质量恒星在塑造周围环境中
  • CoCa:多模态图像
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。