博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
踩刹车——regularization
阅读量:4658 次
发布时间:2019-06-09

本文共 570 字,大约阅读时间需要 1 分钟。

从一个问题说起:

当我们使用H10去拟合曲线的时候,其实我们只想要H2的结果。如果从H10变回到H2呢?

所以我们只需要添加上限制条件:w3=...=w10=0即可。现在呢,我们可以放宽一点条件:任意8个w为0即可。

但是像这种问题是NP-Hard问题,需要枚举所有的情况。

我们再放宽一点条件:

对于linear regression问题,这类squared 条件很好求解。

 

 

求解过程主要依赖于Lagrange Multiplier。其次需要结合linear regression中需要用到的推导:

也就是说,添加限制条件之后的线性回归就等价于其error measure为Eaug的线性回归算法。

在上述推导中C始终未出现,但是却有一个λ,λ的选择对于算法会产生怎么的影响呢?

可以看出λ越大相当于C越小。而微小的λ(相当于微小的约束)会产生极其良好的效果

为什么加上约束条件之后就会使得算法表现更良好呢?因为加上约束条件,就相当于对H进行了约束,使得dvc减小。

 

 

现在只有一个问题:如何选择出一个最优的λ。

没有什么方法,用多个λ试一试挑选出最好的λ即可。具体的挑选过程其实是一个看仪表盘的过程(validation)

 

转载于:https://www.cnblogs.com/wangyanphp/p/5470773.html

你可能感兴趣的文章
Django Rest Framework -解析器
查看>>
ExtJs 分组表格控件----监听
查看>>
Hibernate二级缓存配置
查看>>
LoadRunner常用术语
查看>>
关于jedis2.4以上版本的连接池配置,及工具类
查看>>
记忆讲师石伟华微信公众号2017所有文章汇总(待更新)
查看>>
FactoryBean
查看>>
Coolite动态加载CheckboxGroup,无法在后台中获取
查看>>
C3P0连接池工具类使用
查看>>
SVN常用命令备注
查看>>
孩子教育
查看>>
解决Cacti监控图像断断续续问题
查看>>
结构体的传参理解成员的存储方式
查看>>
python 进程与线程(理论部分)
查看>>
什么是API
查看>>
强名称程序集(strong name assembly)——为程序集赋予强名称
查看>>
1028. List Sorting (25)
查看>>
BZOJ 1613: [Usaco2007 Jan]Running贝茜的晨练计划
查看>>
ubuntu 重启命令,ubuntu 重启网卡方法
查看>>
Linux的学习:
查看>>