机器学习常用算法(LDA,CNN,LR)原理简述 1.LDA LDA是一种三层贝叶斯模型,三层分别为:文档层、主题层和词层。该模型基于如下假设: 1)整个文档集合中存在k个互相独立的主题; 2)每一个主题是词上的多项 ...
来源:CDA数据分析师 | 发布时间:2017-03-14 22:18:33
机器学习中使用的神经网络 这一小节介绍随机梯度下降法(stochastic gradient descent)在神经网络中的使用,这里首先回顾了第三讲中介绍的线性神经网络的误差曲面(error surface),如下图所示。线性神经网络对 ...
来源:CDA数据分析师 | 发布时间:2017-03-14 21:42:53
机器学习:决策树(Decision Tree) 决策树(decision tree)是一种基本的分类与回归方法。在分类问题中,它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。在学习时,利 ...
来源:CDA数据分析师 | 发布时间:2017-03-11 22:05:28
机器学习中的降维算法:ISOMAP & MDS 降维是机器学习中很有意思的一部分,很多时候它是无监督的,能够更好地刻画数据,对模型效果提升也有帮助,同时在数据可视化中也有着举足轻重的作用。 一说到降维,大家第 ...
来源:CDA数据分析师 | 发布时间:2017-03-11 18:41:48
人工智能,机器学习,统计学,数据挖掘之间有什么区别 人工智能、机器学习、统计学和数据挖掘有什么区别? 是否可以这样说,它们是利用不同方法解决相似问题的四个领域?它们之间到底有什么共同点和不同点? ...
来源:CDA数据分析师 | 发布时间:2017-03-06 20:05:22
12月10日下午,国际科技园四期飞鸟村孵化器鸟巢内,由云信联盟、金鸡湖大数据产业联盟指导,猿生态开发者社区和CDA数据分析师联合主办的“从分布式构架到机器学习的魅力”数据交流分享沙龙正式拉开序幕,来 ...
来源:CDA数据分析师 | 发布时间:2016-12-13 11:44:13
机器学习算法的随机数据生成 在学习机器学习算法的过程中,我们经常需要数据来验证算法,调试参数。但是找到一组十分合适某种特定算法类型的数据样本却不那么容易。还好numpy, scikit-learn都提供了随机数据生 ...
来源:CDA数据分析师 | 发布时间:2016-12-02 16:44:05
为什么要选择Python语言实现机器学习算法 基于以下三个原因,我们选择Python作为实现机器学习算法的编程语言:(1) Python的语法清晰;(2) 易于操作纯文本文件;(3) 使用广泛,存在大量的开发文档。 可执行伪 ...
来源:CDA数据分析师 | 发布时间:2016-11-26 15:17:50
用Python进行机器学习小案例 本文是用Python编程语言来进行机器学习小实验的第一篇。主要内容如下: 读入数据并清洗数据 探索理解输入数据的特点 分析如何为学习算法呈现数据 选择正确的模型和学 ...
来源:CDA数据分析师 | 发布时间:2016-11-24 10:40:54