多元线性回归
时间:2023-04-27
本文章向大家介绍多元线性回归,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
1 绪 论
2 预备知识
2.1 多元线性回归分析法基本思想
2.2 多元线性回归分析法的理论模型
2.3 多元线性回归分析的计算步骤
2.3.1 参数估计
2.3.2 假设检验
2.4 Python语言操作步骤
3 多元线性回归模型的建立与分析
3.1 数据收集与分析
3.2 模型构建
3.3 计算及结果分析
3.3.1 模型求解
3.3.2 单特征与目标的可视化
3.3.3 模型结果分析
3.3.4 相关系数检验
3.3.5 多重共线性检验
3.3.6 回归系数的显著性检验
3.3.7 模型验证
4 模型的评价
4.1 模型的优点
4.2 模型的缺点
4.3 模型的改进
5 结论与建议
参考文献:……
参考论文:
链接:https://pan.baidu.com/s/1vxPAtjoNM1V86oap9KihwA
提取码:1573
1 import pandas as pd 2 import numpy as np 3 import matplotlib.pyplot as plt 4 from sklearn.model_selection import train_test_split 5 from sklearn.model_selection import cross_val_score #导入交叉验证模块 6 from statsmodels.formula.api import ols #线性回归模型,小写的 ols 函数才会自带截距项,OLS 则不会 7 import seaborn as sns 8 plt.rcParams['font.sans-serif'] = ['SimHei'] 9 plt.rcParams['axes.unicode_minus'] = False 10 11 class Multiple_linear_regression(): 12 def __init__(self,path): 13 try: 14 self.df = pd.read_csv(path) 15 except: 16 self.df=pd.read_excel(path) 17 print(self.df.head()) 18 19 def Single_factor_scatter_plot(self): 20 for i in self.df: 21 if i==self.df.iloc[:,-1].name: 22 continue 23 else: 24 self.df.plot(x=i, y=self.df.iloc[:,-1].name, kind='scatter', title=f'因素{i}与{self.df.iloc[:,-1].name}的散点图') 25 plt.show() 26 27 def Correlation_coefficient_matrix_and_thermodynamic_diagram(self): 28 # df.corr().to_csv('相关系数矩阵.csv') 29 print(self.df.corr()) 30 heatmap = sns.heatmap(self.df.corr(), cmap='inferno', center=0.01) 31 plt.show() 32 33 def Vif_test(self): 34 # 共线性检测,vif检验,方差膨胀因子 35 def vif(df, col_i): 36 """ 37 df: 整份数据 38 col_i:被检测的列名 39 """ 40 cols = list(df.columns) 41 cols.remove(col_i) 42 cols_noti = cols 43 formula = col_i + '~' + '+'.join(cols_noti) 44 r2 = ols(formula, df).fit().rsquared 45 # 其实就是多元线性回归建模步骤,只是取出了参数 R 平方而已 46 test = 1. / (1. - r2) 47 return test 48 49 print('vif检验结果') 50 print(' 变量 vif检验值') 51 vif_value = [] 52 for i in self.df: 53 print(i.center(7) + ' ', str(vif(df=self.df, col_i=i))) 54 vif_value.append(vif(df=self.df, col_i=i)) 55 plt.bar([x for x in self.df], vif_value, color='teal') 56 plt.axhline(10, color='red', lw=2, label="参考线") 57 plt.title("VIF检验结果") 58 plt.xlabel("变量") 59 plt.ylabel("VIF_value") 60 plt.show() 61 62 def Model(self): 63 st='' 64 for k in self.df: 65 if k == self.df.iloc[:, -1].name: 66 continue 67 else: 68 st += ''.join(k) + '+' 69 xy=f'{self.df.iloc[:, -1].name}~{st[0:-1]}' 70 lm = ols(xy, data=self.df).fit() 71 print(lm.summary())
1 import MLR 2 a=MLR.Multiple_linear_regression(path='house.csv') 3 4 a.Single_factor_scatter_plot() 5 a.Correlation_coefficient_matrix_and_thermodynamic_diagram() 6 a.Vif_test() 7 a.Model()
原文地址:https://www.cnblogs.com/hongbao/p/17360428.html
- Python中的__init__()方法整理中(两种解释)
- 如何找到最优学习率?
- 简单易学的机器学习算法——Rosenblatt感知机
- 多级复制的数据不同步问题(r7笔记第11天)
- 简单易学的机器学习算法——Logistic回归
- Python 用OPEN读文件报错 ,路径以及r
- Oracle 12c PDB浅析(r9笔记第10天)
- merge语句导致的CPU使用率过高的优化(二) (r7笔记第9天)
- 网页爬虫-R语言实现基本函数
- Python中的random模块用于生成随机数
- 简单易学的机器学习算法——极限学习机(ELM)
- 图片数据集太少?Keras Image Data Augmentation 各参数详解
- 备库归档删除策略失效的问题分析 (r7笔记第6天)
- 优化算法——梯度下降法
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 工作10年后,再看String s = new String("xyz") 创建了几个对象?
- Linux达梦数据库:通过disql登录命令行操作数据库,打开达梦数据库自带的数据库管理连接工具
- Dbvis数据库连接工具将查询出数据转化为sql插入语句方法
- JavaScript 技术篇 - js通过xpath路径定位元素方法
- Python+selenium 自动化高级应用篇:借助pyautogui实现web前端带轨迹拖拽功能,解决ActionChains拖拽失效问题
- PG数据库版本查看方法,sql语句查pg数据库版本方法
- Linux下DM达梦数据库导入导出dmp文件实战演示,dexp和dimp命令详细使用方法
- oracle数据库imp导入失败提示:“不是有效的导出文件, 标头验证失败”解决方法,修改dmp文件里oracle数据库版本号方法
- BAT批处理文件无法运行提示“/E /I /Y ‘XCOPY‘ 不是内部或外部命令,也不是可运行的程序或批处理文件”解决方法
- c语言之指针与数组知识点随笔
- Chrome 插件开发-右键菜单开发实战演示,浏览器页面右键菜单选项设置,插件右键菜单点击插件名跳转主页设置
- Chrome 插件开发-桌面通知设置实战演示,设置通知显示、存在时间
- Python 技术篇-通过进程名称、PID杀死windows进程的两种方法,获取当前运行程序的pid
- MySQL 切换数据库、用户卡死:“You can turn off this feature to get a quicker startup with -A“处理方法
- MySQL 数据库mysqlbinlog使用问题:unknown variable ‘default-character-set=utf8‘.解决方法