R语言常见报错及解决方法 在使用R的时候,偶尔也会遇到一些糟心的报错,本文把运行过程中遇到的一些报错和解决方案进行总结归纳。 1、无法连接RPostgreSQL包连接到PG库 报错内容:显示连接超时 ...
来源:CDA数据分析师 | 发布时间:2018-06-28 06:47:54
R语言-批量读取数据文件以及提取字符串中的数字 #第一部分 #先将当前文件夹下的所有以csv结尾的文件名读进来 filelist <- list.files(pattern=\".*.csv\") #文件个数 m<-length(filelist) #按照文 ...
来源:CDA数据分析师 | 发布时间:2018-06-26 06:50:52
关于R语言字符型数据清洗问题 最近做一个预测关于投资者是否再次投资的项目,需要针对客户导出的数据进行清洗后建模分析,我目前选择的模型是xgboost,貌似数据必须全是numeric。 数据结构如下: 在 ...
来源:CDA数据分析师 | 发布时间:2018-06-21 06:05:31
R语言之决策树和随机森林 总结决策树之前先总结一下特征的生成和选择,因为决策树就是一种内嵌型的特征选择过程,它的特征选择和算法是融合在一起的,不需要额外的特征选择。 一、特征生成: 特征生成是 ...
来源:CDA数据分析师 | 发布时间:2018-06-16 07:02:11
决策树与随机森林的R语言实现 1.用party包构建决策树 以iris数据集为例。 用ctree()建立决策树,用predict()对新数据进行预测。 训练集与测试集划分: [ruby] view plain copy > str(iris) ...
来源:CDA数据分析师 | 发布时间:2018-06-14 06:50:03
基于R语言的分类算法之决策树 ID3 《= 最大信息熵增益,只能处理离散型数据 C4.5 《= 信息增益率,可处理连续性和离散型数据,相比ID3,减少了因变量过多导致的过拟合 C5.0 《= 信息增益率,运算性能比C4 ...
来源:CDA数据分析师 | 发布时间:2018-06-14 06:42:31
R语言中实现层次聚类模型 大家好!在这篇文章中,我将向你展示如何在R中进行层次聚类。 什么是分层聚类? 分层聚类是一种可供选择的方法,它可以自下而上地构建层次结构,并且不需要我们事先指定聚 ...
来源:CDA数据分析师 | 发布时间:2018-06-11 06:56:14
R语言使用逻辑回归分类算法 逻辑回归属于概率统计的分类算法模型的算法,是根据一个或者多个特征进行类别标号预测。在R语言中可以通过调用logit函数执行逻辑回归分类算法并预测输出概率。通过调用glm函数将fam ...
来源:CDA数据分析师 | 发布时间:2018-05-31 06:43:06
R语言数据对象与运算 R语言数据对象与运算 笔记整理 2.1 数据对象及类型 R语言创建和控制的实体被称为对象(object) ls()命令来查看当前系统里的数据对象 R对象的名称必须以一个英文字母打头,并 ...
来源:CDA数据分析师 | 发布时间:2018-03-18 07:43:40