高斯分布
作者:老师木
关于高斯分布,@rickjin写了一个更好的文章,先推荐一下。
1733年,德-莫佛(De Moivre)在给友人分发的一篇文章中给出了正态曲线(这一历史刚开始被人们忽略)。1783年,拉普拉斯指出正态曲线方程适合于表示误差分布的概率。1809年,高斯发表了关于天体运行论的著作,在第二卷第三节中,他导出正态曲线适合于表示误差规律,同时承认拉普拉斯较早的推导。正态分布在十九世纪前叶因高斯的工作而加以推广,所以通常称作高斯分布。
卡尔-皮尔逊指出德-莫佛是正态曲线的创始人,第一个称它为正态分布,但人们仍习惯称之为高斯分布。1805年,Legendre提出最小二乘法,高斯声称自己在1794年用过,并在1809年基于误差的高斯分布假设,给出了严格推导。
要领略高斯分布的美妙,至少有几个方面不可缺少:
1) 与中心极限定理的联系;
2) 与最小二乘拟合的关系;
3) 与最大熵原理的联系,高斯分布在给定一阶和二阶统计量约束下熵最大的分布。
4) 高斯分布与机器学习2范数正则化的联系,特别是SVM中常用最大间隔概念的联系;
5) 高斯分布与大家耳熟能详的主成分分析PCA的理论联系;
6) 高斯的共轭分布还是高斯,这是不是唯一具有这个性质的分布;
7) 高斯分布与独立成分分析ICA的理论联系,主要用到高斯分布不相关与独立的等价性(严格地说有个小陷阱,我被网友指正过)。
来源:www.guzili.com
留下你的评论