Other articles


  1. Laplace-smoothing

    拉普拉斯平滑,是一种用于处理0概率问题平滑方法。 通过对每个分量+1来计算概率。 例如,某个词语K,在不同类中的观测数量分别是0,10,20,概率为0,\(\frac{1}{3}\)\(\frac{2}{3}\),对这三个量 进行laplace-smoothing后,结果应该是 \(\frac{1}{30+3}\), \(\frac{11}{30+3}\), \(\frac{21}{30+3}\)

    read more

    There are comments.

  2. vectorial

    向量化是一个非常好的数据表示方式。一旦数据被向量化表示, 我们就可以计算距离,相似度,以及其他通过向量表示所得到的统计值。

    read more

    There are comments.

  3. product-over-a-large-number

    当我们计算多个大数的乘积时,可能造成数值上溢或者下溢。 此时,我们需要将数值的log值相加,而不是计算数值的乘积。 这是因为:

    $$ log(a) + log(b) = log(ab)$$

    这种计算,常见于条件概率形成的乘积链条。

    read more

    There are comments.

  4. Basic-Algorithm

    后面主要介绍四种基本的机器学习算法,分别是 Naive Bayes(朴素贝叶斯), Nearest Neighbors(最近邻), the Mean classifier, and Perceptron(感知机).

    read more

    There are comments.

  5. conditionally-independent

    条件独立的形式是:

    $$ p(t_1,t_2|x) = p(t_1|x)p(t_2|x) $$

    其中,\(t_1\)\(t_2\)分别是两次 test(也就是检验)。

    简写形式是

    $$T_1,T_2\mathrel{$\perp\mkern-10mu\perp$} X$$
    read more

    There are comments.

  6. bayes-rule

    贝叶斯法则的关键,是将两个变量的条件进行反转。

    $$ p(y|x) = \frac{p(x|y)p(y)}{p(x)} $$
    read more

    There are comments.

  7. iid-独立同分布

    从同一个设备中读取电压的数值,我们假设电压的数值取值于同一个分布,并且相互独立。 这样一来,数值于数值之间不会相互影响,这一时刻的数值也不会影响下一时刻的数值。 我们称这样的随机变量是独立同分布(independency and identically distributed),或者iid.

    read more

    There are comments.

  8. Mean-And-Variance

    当我们需要衡量一个随机变量可能的数值的时候,例如测量一个电压的范围, 我们就需要引入平均值和方差了。

    平均值对于估计期望损失(expected losses)和收益(benefit)是非常有用的。常见的定义形式如下:

    $$E[X] := \int xdp(x)$$

    方差用于衡量变量与平均值之间的差异。因此,方差经常被用于评估随机变量的风险。方差的常见形式如下:

    $$Var[X]:= E[(X-E[X])^2]$$
    read more

    There are comments.

Page 1 / 3 »

links

social