Logit models, or Log...
1. Logistic function
Logistic曲线 (先把为什么叫Logistic这个名字抛在一边) 从函数角度讲,就是从实数定义域 到值域 的单调映射。
它最早用于建模人口总体规模 随时间 的动态变化 ( [PF Verhulst 1845] ):
上述微分方程的解 ,就定义了 logistic function:
就是logistic分布函数:
它的导数性质正好形如上述人口规模对时间的变化率:
2. Logistic distribution function
Logistic曲线 的性质:
- 从实数映射到[0,1]区间,
- 单调(上升),
使得它成为了一个概率分布函数,因此它就可以作为二元0-1响应变量的概率取值度量(可扩充到多元/多项Logistic):
这里 就是前面的Logistic函数 ,用记号 强调它此时是一个概率分布函数:
- 神经网络中,它表示激活函数时,记号常用 ,
- 类比 代表标准正态分布函数一样,实际上 Probit 模型与 Logit 模型不同之处就在于此。
3. Logit model, or Logistic regression
logit model 就是 Logistic regression 。
logit 表示的意思是对数几率:
几率 这个词在赌徒中用的很多,表示胜的概率 比负的概率 (所以命名 logit 就是 log odds ratio 的简称):
也就是:
Logit models是说( 是数据矩阵, 是参数向量):
(即概率的对数几率是线性模型)
等价地是说:
(即概率本身是Logistic分布函数)
- 所以logistic 就是logit 的形容词,它从(统计)命名上来看,与逻辑logic没有任何关系;尽管它最初用于二元0-1分类,会让人产生将Logistic和logic联系起来的直觉反应,尤其是学计算机系的。
- 我的看法:在知道这个统计命名事实的基础上,可以将logic和Logistic联系起来,就像PageRank后来被人解释为Larry Page一样。并且这样的联系还很容易记住这个事实:Logistic regression是分类器,虽然它有回归二字。
- 为什么叫regression : 线性回归的两个扩展。(详见参考文献2第1章)
- 我的看法 : 1)它是通过计算概率用于分类的,所以叫做回归也可以。2)线性回归 ,而logit model对概率取对数几率后 ,通过引入隐变量 ,可将线性regression的误差项和logit模型的隐变量项对应起来。(详见参考文献1第7章)
参考资料:
- David A. Freedman (2009). Statistical Models: Theory and Practice.
- “Logistic regression is a synonym for logit models.”见P128
- 隐变量 ,见第七章。
2. Kevin P. Murphy (2012). Machine learning: A Probabilistic Perspective.
- "This is called logistic regression due to its similarity to linear regression (although it is a form of classification, not regression!)." 见P21.
留下你的评论