more_on_gaussians.pdf

###更多关于多元高斯分布####定义与特性在给定的文档中,作者Chuong B. Do深入探讨了多元高斯分布的一些高级性质,并解释了这些性质如何帮助我们在实际应用中更好地理解和利用多元高斯模型。文档标题为“more_on_gaussians.pdf”,但描述和部分内容重复了标题,因此我们将主要根据部分内容来展开知识点。 **多元高斯分布**是一种重要的概率分布,在统计学、机器学习和数据科学中有广泛的应用。它不仅出现在线性回归的概率解释中,还出现在高斯判别分析、高斯混合模型聚类以及因子分析等场景中。 ####多元高斯分布定义一个向量值随机变量( mathbf{x} in mathbb{R}^n )如果其概率密度函数由下式给出,则称其具有多元正态(或高斯)分布: [ p(mathbf{x}; boldsymbol{mu}, boldsymbol{Sigma}) = frac{1}{(2pi)^{n/2}|boldsymbol{Sigma}|^{1/2}} expleft(-frac{1}{2}(mathbf{x}-boldsymbol{mu})^T boldsymbol{Sigma}^{-1} (mathbf{x}-boldsymbol{mu})right) ]其中: - ( boldsymbol{mu} in mathbb{R}^n )是均值向量, - ( boldsymbol{Sigma} in S_n^{++} )是协方差矩阵。记作( mathbf{x} sim N(boldsymbol{mu}, boldsymbol{Sigma}) ),这里( S_n^{++} )表示所有( n times n )对称正定矩阵的空间。 ####高斯事实多元高斯分布之所以在实践中非常有用,是因为以下几个事实: 1. **事实#1:**如果我们知道一个高斯随机变量的均值( boldsymbol{mu} )和协方差矩阵( boldsymbol{Sigma} ),就可以直接写出该随机变量的概率密度函数。 2. **事实#2:**以下高斯积分有闭合形式的解: - ( int_{mathbf{x} in mathbb{R}^n} p(mathbf{x}; boldsymbol{mu}, boldsymbol{Sigma}) dmathbf{x} = 1 ) - ( int_{mathbf{x} in mathbb{R}^n} x_i p(mathbf{x}; boldsymbol{mu}, boldsymbol{Sigma}) dmathbf{x} = mu_i ) - ( int_{mathbf{x} in mathbb{R}^n} (x_i-mu_i)(x_j-mu_j) p(mathbf{x}; boldsymbol{mu}, boldsymbol{Sigma}) dmathbf{x} = boldsymbol{Sigma}_{ij} ) 3. **事实#3:**高斯分布具有几个封闭性质: -独立的高斯随机变量之和仍然是高斯分布。 -联合高斯分布的边际分布是高斯分布。 -联合高斯分布的条件分布是高斯分布。 ####封闭性质的直观理解对于初学者来说,这些事实中的前两个可能看起来直观上很明显或至少是合理的。然而,真正难以理解的是为什么这些事实如此强大。 **事实#1**指出,一旦我们知道了均值和协方差矩阵,就能够直接写出高斯随机变量的概率密度函数。这一点非常重要,因为它使得我们可以快速地计算出任何给定数据点的概率,这对于许多实际问题都是必要的。 **事实#2**强调了高斯积分的重要性质,即它们总是有解析解。这意味着我们可以轻松地计算期望值、方差以及其他重要的统计量,这对于理解数据和构建模型至关重要。 **事实#3**涉及高斯分布的封闭性质,即独立高斯随机变量的和、联合高斯分布的边际分布以及条件分布仍然保持高斯性质。这一点对于理解复杂的数据关系以及进行高效的计算非常重要。通过这些事实的理解,我们可以更自信地在作业和其他实际问题中应用多元高斯分布的知识。这些性质简化了许多计算,并且为处理多元高斯随机变量提供了强大的工具。
pdf 文件大小:116.73KB