線性判別分析 

线性判别分析(英語:Linear discriminant analysis,縮寫:LDA)是对费舍尔的线性鉴别方法的归纳,这种方法使用统计学模式识别机器学习方法,试图找到两类物体或事件的特征的一个线性组合,以能够特征化或区分它们。所得的组合可用来作为一个线性分类器,或者,更常见的是,为后续的分类做降维处理。

LDA与變異數分析(ANOVA)和迴归分析紧密相关,这两种分析方法也试图透过一些特征或测量值的线性组合来表示一个因变量。[1][2] 然而,變異數分析使用类别型的自变量和连续型的因变量,而判别分析則使用连续型自变量和类别型因变量(即类标签)。[3] 邏輯斯諦迴歸和概率迴归比變異數分析更类似于LDA,因为他们也是用连续型自变量来解释类别型因变量。LDA的基本假设是自变量是常态分布的,当这一假设无法满足时,在实际应用中更倾向于用上述的其他方法。

LDA也与主成分分析(PCA)和因素分析紧密相关,它们都在寻找最佳解释数据的变量线性组合。[4] LDA明确地尝试在不同数据类之间建立模型,而PCA則不考虑类别上的不同(只是在保留大部分訊息的前提下降低维度數),因素分析則是根据相異處而非相同處来建立特征组合。判别分析跟因素分析的差異还在于,它不是一个相互依存技术:即必须区分出自变量和因变量(也称为准则变量)的不同。

當自变量每一次的观察测量值都是连续量的时候,LDA能發揮作用。如果是处理类别型自变量,与LDA相对应的技术称为判别反应分析。[5][6]

  1. ^ Fisher, R. A. (1936).
  2. ^ McLachlan, G. J. (2004).
  3. ^ Analyzing Quantitative Data: An Introduction for Social Researchers, Debra Wetcher-Hendricks, p.288
  4. ^ Martinez, A. M.; Kak, A. C. (2001).
  5. ^ Abdi, H. (2007) "Discriminant correspondence analysis."页面存档备份,存于互联网档案馆
  6. ^ Perriere, G.; & Thioulouse, J. (2003).



取材自維基百科 - 中文時事百科