R语言:文本(字符串)处理与正则表达式 处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要强 ...
来源:CDA数据分析师 | 发布时间:2017-04-25 06:52:14
R语言︱文件读入、读出一些方法罗列(批量xlsx文件、数据库、文本txt、文件夹) 小规模的读取数据的方法较为简单并且多样,但是,批量读取目前看到有以下几种方法:xlsx包、RODBC包、批量转化成csv后读入。 R语 ...
来源:CDA数据分析师 | 发布时间:2017-04-23 07:18:23
R语言数据分组统计函数族—apply族用法与心得 apply族功能强大,实用,可以代替很多循环语句,R语言中不要轻易使用循环语句。 apply Apply Functions Over Array Margins 对阵列行或者列 ...
来源:CDA数据分析师 | 发布时间:2017-04-23 07:04:39
一个使用R语言做数据处理的实例 最近一个同学找到我,希望我帮忙处理一份数据。那份数据是这样的:包含了3661行,第一行为各列的名称;包含8列,第一列为专利ID,其余7列为企业ID。 这份数据截图如下所示: ...
来源:CDA数据分析师 | 发布时间:2017-04-21 07:05:18
用R语言做Venn(韦恩)图 首先介绍一下韦恩图(英语:Venn diagram) ,也叫做文氏图、温氏图、范氏图,这都一个意思。它是数学学科中分支集合论(或者类的理论)的一支,在不太严格的意义下用来表示集合(或 ...
来源:CDA数据分析师 | 发布时间:2017-04-21 06:52:38
R语言文本挖掘之中文分词包—Rwordseg包(原理、功能、详解) 与前面的RsowballC分词不同的地方在于这是一个中文的分词包,简单易懂,分词是一个非常重要的步骤,可以通过一些字典,进行特定分词。大致分析步骤如 ...
来源:CDA数据分析师 | 发布时间:2017-04-20 07:10:00
R语言实现关系图谱 数据是这样存储的 社交关系分析和可视化用的是igraph包 脚本是这样的 ------------------------------------------------------------------------------------------- #ins ...
来源:CDA数据分析师 | 发布时间:2017-04-20 07:03:09
用R语言做逻辑回归 回归的本质是建立一个模型用来预测,而逻辑回归的独特性在于,预测的结果是只能有两种,true or false 在R里面做逻辑回归也很简单,只需要构造好数据集,然后用glm函数(广义线性模型(genera ...
来源:CDA数据分析师 | 发布时间:2017-04-08 18:58:27
R语言中apply家族中的系列循环函数总结 R语言中的以apply()函数为首的apply()家族,提供了强大而方便的循环功能,这些函数说起来简单,用起来可能就有点蒙圈儿了。这些函数确实简单,但是可能很多人搞不清这些 ...
来源:CDA数据分析师 | 发布时间:2017-04-08 18:47:03