本课程内容创建在R语言基本课程内容以上。本课程内容重在实践活动,将以好几个实例的方式,详细介绍详细的数据统计分析的步骤,从数据信息模型创建到数据清洗到数据可视化的全过程。学生在这个课程内容中,将学习培训怎么使用原始记录创建剖析模型,依据不一样的总体目标应用不一样的数据统计分析方式,并根据制图的方法,*后完成数据信息的数据可视化。
课程大纲:
原始记录的探寻与预备处理1.衡量数据的集中化水平
2.衡量数据的分散化水平
1)极大值,标准差和标准偏差
2)标准误和误差指数,峰度指数
3.建立一个数据引言表
4.出现异常值的观察与表明
1)运用箱线图观察出现异常值并解决
2)出现异常值检验的别的状况和表明
5.缺少值的弥补与解决
1)删掉缺少值或对其开展简易弥补
2)依照关联性对缺口值开展弥补
R的大数据可视化1.plot()涵数和常见的图型主要参数
1)设定plot()涵数中的主要参数
2)改动散点图的座标并添加标明
2.經典的基本图型及主要用途
1)曲线图
2)条形图
3)箱线图和茎叶图
3.将图型组成起來
4.大量的高质量做图涵数
5.大量的常见做图指令
R中主要参数的估算和检验1.应用R开展点估计和区间估计
1)简易的点估计和区间估计
2)估算一侧置信区间
2.与正态整体相关的主要参数检验
3.列联表与自觉性检验
4.集中化检验数据分布的涵数
5.对非正态整体的区间估计和检验
1)非正态整体的区间估计
2)非主要参数检验中的合乎检验
3)非主要参数检验中的秩检验
R中的方差分析1.方差分析模型的创建
2.单要素方差分析
1)单要素方差分析的数学思想与模型
2)检验样版是不是考虑方差分析的假定标准
3)搭建单要素方差分析模型
3.多要素方差分析
1)多要素方差分析的数学思想与模型
2)不考虑到配对t检验的双要素方差分析
3)考虑到配对t检验的双要素方差分析
4.秩检验合谐方差分析
1)对调节变量运用秩检验方式
2)协方差分析的假定与运用
R中的相关性分析和多元回归分析1.多种多样相关系数r的测算和检验
1)简易相关系数r的测算和检验
2)散散步矩阵图和偏相关系数
3)典型性相关性分析
2.线性回归剖析以及常归主要参数
1)对数据信息开展预备处理
2)搭建*个重归模型
3)调整 方程组并检验回归分析
3.应用多元回归挑选变量
1)多元回归的观念与归类
2)搭建多元回归模型
4.哑变量和逻辑回归
1)哑变量和逻辑回归的观念
2)向线性回归模型中列入哑变量
更高級的大数据可视化1.基本图型的拓展与拓宽
1)绘图归类散点图并加上标志
2)绘图含多种多样类型的相对密度布局图
3)复合型条形图和局部变量条形图
2.相关多元化分布函数的独特图型
1)星神和京剧脸谱图
2)轮廓图
3)调合趋势图
3.创建非常简单的3d图纸形
4.怎么让图型更美观大方
5.更过的制图包和系统软件
R中的聚类剖析和判别分析1.集中化聚类剖析的不同点
2.应用R完成KNN聚类
1)KNN优化算法的观念和模型
2)应用R完成KNN聚类
3.应用R完成系统软件聚类
1)系统软件聚类的观念和模型
2)应用R完成系统软件聚类
4.应用R完成迅速聚类
1)迅速聚类的观念和模型
2)应用R完成迅速聚类
5.集中化判别分析模型具体描述
1)间距辨别模型
2)Fisher辨别模型
R中的主成分分析法和因子分析1.主成分分析法的完成与运用
1)主成分分析法的模型假定和数据处理方法
2)结构一个主成分分析法模型
3)测算主成份的综合性评分
2.因子分析的*次搭建与健全
1)结构一个简易的因子分析模型
2)测算因素评分并剖析
3.对因子分析模型开展调整
1)改动因子分析模型中的因素数量
2)根据主成份法和主轴轴承因素法开展因子分析
4.在特征提取剖析的基本上开展多元回归分析和聚类剖析
1)在特征提取剖析的基本上开展多元回归分析
2)在特征提取剖析的基本上开展聚类剖析
5.决策树算法
1)C4.5优化算法
2)CART优化算法
3)C5.0优化算法
R中的理论线性回归模型1.一般的理论线性回归模型
1)应用二次函数拟合线性回归模型
2)线性拟合大量的理论线形模型
3)较为线形模型的好坏
2.Logistic线性回归模型
1)Logistic模型的基本原理与搭建方式
2)Logistic模型的显著性差异检验和优势比
3)调整 被警示的Logistic模型
3.泊松回归剖析模型
1)线性拟合*个泊松回归模型
2)泊松回归模型的过散播检验
4.理论线形模型的交叉验证
R中的时间序列模型1.将数据交换为时间序列文件格式
1)应用ts()涵数变换数据类型并绘图时间序列曲线图
2)应用zoo()涵数变换数据类型并绘图时间序列曲线图
2.溶解时间序列并检验时间序列的自关联性
1)应用經典方式溶解时间序列
2)应用STL方式溶解时间序列
3.研究时间序列的自关联性
1)应用月图和一季度图研究自关联性
2)应用散点图研究自关联性
4.搭建时间序列并预测分析
1)平均值预测分析,单纯性预测分析和飘移
2)不考虑到趋势性和时节起伏的简易指数值光滑
3)在指数值光滑中添加趋势性和时节起伏
4)自回归移动平均法模型
R中的*优控制难题1.*优控制难题概述
2.黄金分割法
1)黄金分割法和部分*优解
2)应用R完成黄金分割法
3.哥白尼*优化方法
1)哥白尼方式的优化算法基本原理
2)在一维情况下完成牛顿迭代法
3)在多维度情况下完成牛顿迭代法
4.更快升高法
1)运用梯度方向求得升高更快的邻近点
2)搭建更快升高法涵数并检验
5.R中*优控制涵数