以二分类为例,
数据空间上有两个类别的点,每个类别有一堆点。每个类别的点符合各自的分布。
对于任意一个新的点,可以分别算出点属于两个分布的概率:P(dataA)P(data|A)P(dataB)P(data|B)
新的点属于概率较大的那一类,具体公式为:

P(classdata)=P(dataclass)P(class)classP(dataclass)P(class) P(class | data) = \frac{P(data|class)P(class)}{\sum_{class}P(data|class)P(class)}

其中:

P(class)=class P(class) = \frac{class\text{的样本数}}{\text{总的样本数}}

P(dataclass)P(data|class)与这个class的分布有关.
重点是怎么根据某个class的已有样本推测class的分布

1. data是离散变量

离散变量通常假设它符合Bernoulli 分布或者Multinoulli 分布,那么

P(dataclass)=class P(data|class) = \frac{class\text{的样本数}}{\text{总样本数}}

2. data是连续变量

适用于连续变量的分布有很多,通常假设为高斯分布.

  1. 根据已有的训练数据求出μ\muσ\sigma, 高维数据时方差σ\sigma用协方差矩阵Σ\Sigma代替.

μ=1NxiΣ=1N(xiμ)(xiμ) \begin{aligned} \mu = \frac{1}{N}\sum x^i \\ \Sigma = \frac{1}{N}\sum(x^i-\mu)(x^i-\mu)^\top \end{aligned}

  1. 代入高斯分布的公式,就得到了整个class的分布.

高斯分布

3. 其它

所以维度独立,朴素贝叶斯
P27, posterior probability
P15, Cross Entropy VS Square Error
P16 Discriminative VS Generative

results matching ""

    No results matching ""