机器学习中的概率问题-CDA数据分析师官网

机器学习中的概率问题

2018-03-13

机器学习中的概率问题

机器学习的过程可以理解为计算机通过分析大量的数据获得模型，并通过获得的模型进行预测的过程。机器学习的模型可以有多种表示，例如线性回归模型，SVM模型，决策树模型，贝叶斯模型。

概率类型

在理解概率模型之前，首先要理解的各种概率类型所表示的确切含义。

1.先验概率

某事件发生的概率。

2.条件概率

在某种条件下，事件A发生的概率，可以是基于历史数据的统计，可以由背景常识得出，也可以是人的主观观点给出。一般都是单独事件概率，如P(x),P(y)。

3.后验概率

条件概率的一种特殊情况，它限定了事件为隐变量取值(不可观测)，而条件为观测结果。

4.联合概率

表示多个事件同时发生的概率。

5.似然概率

条件概率的一种，针对参数而言，意思是某参数(某事件发生的概率)取得某一值得概率。

正向过程（普通概率）：给定参数后，预测即将发生的事件的可能性，以投掷硬币为例，已知一枚均匀硬币，投掷出正反面的概率均为0.5(给出的参数)，求投掷两次硬币都朝上的概率。

逆向过程（似然概率）：给定事件发生的可能性，求解参数为某一值得可能性，以投掷硬币为例，已知一枚均匀硬币，投掷两次都是正面朝上(条件)，求正面朝上的概率为0.5的可能性是多少。

求正面朝上概率为x的似然：

通过计算不同的正面朝上的概率的可能性，可以得到一条似然函数曲线：

似然函数曲线

最大似然概率，最大似然概率，在已知观测数据的条件下，找到使似然概率最大的参数值作为真实的参数估计。例如从似然函数曲线中可以得知，当PH=1时，似然函数取得最大值。