R 语言 线性回归
-
R 语言 线性回归
回归分析是建立两个变量之间关系模型的一种非常广泛使用的统计工具。这些变量之一称为预测变量,其值是通过实验收集的。另一个变量称为响应变量,其值是从预测变量得出的。在线性回归中,这两个变量通过方程式关联,其中这两个变量的指数(幂)为1。数学上,线性关系表示为曲线图时表示直线。任何变量的指数不等于1的非线性关系会创建一条曲线。线性回归的一般数学方程为-以下是所用参数的描述-- y - 是响应变量。
- x - 是预测变量。
a和b是常数,称为系数。 -
建立回归的步骤
一个简单的回归示例是在知道一个人的身高时预测他的体重。为此,我们需要了解一个人的身高与体重之间的关系。创建关系的步骤是-- 进行实验,收集高度和相应体重的观测值样本。
- 使用R中的lm()函数创建一个关系模型。
- 从创建的模型中找到系数,并使用这些系数创建数学方程
- 获取关系模型的摘要,以了解预测中的平均误差。也称为残差。
- 要预测新成员的权重,请使用R中的predict()函数。
输入数据以下是代表观察结果的样本数据- -
-
predict()函数
线性回归中的predict()的基本语法为:以下是所用参数的描述-- object - 是已经使用lm()函数创建的公式。
- newdata - 是包含预测变量新值的向量。
预测新人的体重当我们执行以上代码时,它产生以下结果-以图形方式可视化回归当我们执行以上代码时,它产生以下结果-