Logit models, or Log...
1. Logistic function
Logistic曲线  
  (先把为什么叫Logistic这个名字抛在一边) 从函数角度讲,就是从实数定义域  
  到值域  
  的单调映射。
它最早用于建模人口总体规模 
  随时间 
  的动态变化 ( [PF Verhulst 1845] ):
 
 
上述微分方程的解  
 ,就定义了 logistic function:
 
 
 
  就是logistic分布函数:
 
 
它的导数性质正好形如上述人口规模对时间的变化率:
 
 
2. Logistic distribution function
Logistic曲线  
  的性质:
- 从实数映射到[0,1]区间,
 - 单调(上升),
 
使得它成为了一个概率分布函数,因此它就可以作为二元0-1响应变量的概率取值度量(可扩充到多元/多项Logistic):
 
 
这里 
 就是前面的Logistic函数 
 ,用记号 
 强调它此时是一个概率分布函数:
- 神经网络中,它表示激活函数时,记号常用 
 , - 类比 
 代表标准正态分布函数一样,实际上 Probit 模型与 Logit 模型不同之处就在于此。 
3. Logit model, or Logistic regression
logit model 就是 Logistic regression 。
logit  表示的意思是对数几率:
 
 
几率 这个词在赌徒中用的很多,表示胜的概率 
 比负的概率 
  (所以命名 logit 就是 log odds ratio 的简称):
 
 
也就是:
 
 
Logit models是说( 
 是数据矩阵, 
 是参数向量):
 
 
(即概率的对数几率是线性模型)
等价地是说:
 
 
(即概率本身是Logistic分布函数)
- 所以logistic 就是logit 的形容词,它从(统计)命名上来看,与逻辑logic没有任何关系;尽管它最初用于二元0-1分类,会让人产生将Logistic和logic联系起来的直觉反应,尤其是学计算机系的。
 - 我的看法:在知道这个统计命名事实的基础上,可以将logic和Logistic联系起来,就像PageRank后来被人解释为Larry Page一样。并且这样的联系还很容易记住这个事实:Logistic regression是分类器,虽然它有回归二字。
 - 为什么叫regression : 线性回归的两个扩展。(详见参考文献2第1章)
 - 我的看法 : 1)它是通过计算概率用于分类的,所以叫做回归也可以。2)线性回归  
  ,而logit model对概率取对数几率后  
 ,通过引入隐变量 
 ,可将线性regression的误差项和logit模型的隐变量项对应起来。(详见参考文献1第7章) 
参考资料:
- David A. Freedman (2009). Statistical Models: Theory and Practice.
 
- “Logistic regression is a synonym for logit models.”见P128
 - 隐变量 
 ,见第七章。 
2. Kevin P. Murphy (2012). Machine learning: A Probabilistic Perspective.
- "This is called logistic regression due to its similarity to linear regression (although it is a form of classification, not regression!)." 见P21.
 
										
留下你的评论