本课程内容向学生授课怎么使用MicrosoftR服务项目,在公司大数据自然环境中开展数据建立、剖析与呈现。并与公司目前数据服务平台开展融合应用,包含:SQLServer数据库、Hadoop或Spark集群等。
培训目标:
完成数据数据可视化表格
建立大数据回归模型
在SQLServer和Hadoop自然环境中应用MicrosoftR服务项目
课程大纲:
微软公司R网络服务器和R手机客户端
1什么叫微软公司R网络服务器
2应用微软公司R手机客户端
3ScaleR涵数
4动手实验:探寻MicrosoftR网络服务器和手机客户端
探寻大数据
1掌握ScaleR数据源
2载入数据到XDF目标
3在XDF目标中归纳数据
4动手实验:大数据的获取、变换和应用
大数据数据可视化与解决
1运行内存数据数据可视化
2大数据变换
3管理方法数据设定
4动手实验:
对公司大数据开展数据可视化呈现
大数据解决技术性:变换、合拼数据源
并行处理剖析解决
1应用revoPemaR包
2应用rxExec
3动手实验:应用rxexec和RevoPemaR开展并行处理剖析解决
建立数据回归模型
1大数据群集
2建立回归模型并预测
3动手实验:建立一个线形回归模型
建立集群
建立回归模型
转化成预测数据
开展预测結果较为
建立数据系统分区实体模型
1建立树形结构系统分区实体模型
2分区实体模型的预测与较为
3动手实验:建立系统分区实体模型
切分数据集
建立数据实体模型
预测和检测数据
较为数据結果
在SQLServer和Hadoop中开展数据解决
1在SQLServer中应用R网络服务器
2应用HadoopMap/Reduce
3应用HadoopSpark
4动手实验:
在SQLServer中建立数据实体模型和预测
应用Hadoop实行剖析