[摘要]R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好...
R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。
我们所说的机器学习和R有什么关系呢?我对R的第一印象是,它只是一个统计计算的一个软件。但是后来我发现R有足够的能力以一个快速和简单的方式来实现机器学习算法。这是用R来学习数据科学和机器学习的完整教程,读完本文,你将有使用机器学习的方法来构建预测模型的基本能力。
注:这篇文章对于之前没有很多数据科学知识的同学们是特别值得一看的,同时掌握一定的代数和统计知识将会更有益于您的学习。
一、初识R语言
1、为什么学R ?
事实上,我没有编程经验,也没有学过计算机。但是我知道如果要学习数据科学,一个人必须学习R或Python作为开始学习的工具。我选择了前者,同时在学习过程中我发现了一些使用R的好处:
- 用R语言编码非常的简单;
- R是一个免费的开源软件,同时它可以直接在官网上下载;
- R语言中有来自于全世界爱好者贡献的即时访问超过7800个用于不同计算的R包。
- R语言还有遍布全世界的学习社区及论坛,你能很轻松的获取帮助;
- 我们凭借R包能够获得高性能的计算体验;
- 它是,数据分析公司高度寻求技能之一。
2、如何安装R / Rstudio?
你可以https://www.r-project.org/官网下载并安装R,需要注意的是R的更新速度很快,下载新版本的体验会更好一些。
另外,我建议你从RStudio开始,因为RStudio的界面编程体验更好一些。你可以通过https://www.rstudio.com/products/rstudio/download/ 在“支持的平台上安装”部分中, 根据您的操作系统选择您需要的安装程序。点击桌面图标RStudio,就开始你的编程体验,如下图所示:
关键词:R数据运用办法|教你用R进行数据挖掘