网站首页 > 人工智能 > 正文

数据挖掘人工智能正则化实战( Lasso 套索回归,Ridge 岭回归)

小程序前端和后端什么意思人工智能 2024-02-26 6 0

Lasso 套索回归

导入包

import numpy as np

from sklearn.linear_model import Lasso

from sklearn.linear_model import SGDRegressor, LinearRegression

原方程的计算结果

# 1. 创建数据集X，y

X = 2 * np.random.rand(100, 20)

w = np.random.rand(20, 1)

b = np.random.randint(1, 10, size=1)

y = X.dot(w) +b + np.random.randn(100,1)

print('原始方程的斜率：',w,b)

print('原始方程的截距',b)

普通线性回归方式

# 线性回贵

linear = LinearRegression()

linear.fit(X,y)

print('普通线性回归系数\n',linear.coef_)

print('线性回归截距是：',linear.intercept_)

Lasso 套索回归

# l1 正则化的lasso回归一部分权重变为0

# 其余的进行了衰减可以说模型的负责度降低，可以减少过拟合

lasso = Lasso(alpha=0.1)

lasso.fit(X,y)

print('l1 正则化系数：\n',lasso.coef_)

print('l1 正则化截距',lasso.intercept_)

随机的梯度下降

sgd = SGDRegressor(penalty='l1',alpha=0.1)

sgd.fit(X,y.ravel())

print('随机梯度下降系数',sgd.coef_)

print('随机梯度截距',sgd.intercept_)

和没有正则项约束线性回归对比，可知L1正则化，将方程系数进行了缩减，部分系数为0，产生稀疏模型

\alpha

α 越大，模型稀疏性越强，越多的参数为0Lasso回归源码解析：alpha：正则项系数fit_intercept：是否计算

w_0

w0 截距项normalize：是否做归一化precompute：bool 类型，默认值为False，决定是否提前计算Gram矩阵来加速计算max_iter：最大迭代次数tol：结果的精确度warm_start：bool类型，默认值为False。如果为True，那么使⽤用前⼀次训练结果继续训练。否则从头开始训练

Ridge 岭回归

导入包

import numpy as np

from sklearn.linear_model import Ridge

from sklearn.linear_model import SGDRegressor

from sklearn.linear_model import LinearRegression

原方程的计算结果

# 创建模拟数据

X = 2 * np.random.rand(100,5)

w = np.random.randint(1,10,size=(5,1))

b = np.random.randint(1,10,size=1)

y = X.dot(w) + b + np.random.randn(100,1)

print('原始方程的斜率:',w.ravel())

print('原始方程的截距',b)

普通的线性回归

linear = LinearRegression()

linear.fit(X,y)

print('普通的线性回归系数',linear.coef_,linear.intercept_)**

Ridge 岭回归

ridge = Ridge(alpha=0.12)

ridge.fit(X,y)

print('l2 正则化ridge系数数：',ridge.coef_,ridge.intercept_)

结论：

和没有正则项约束线性回归对比，可知L2正则化，将方程系数进行了缩小

\alpha

α 增大求解出来的方程斜率变小Ridge回归源码解析：alpha：正则项系数fit_intercept：是否计算

w_0

w0 截距项normalize：是否做归一化max_iter：最大迭代次数tol：结果的精确度solver：优化算法的选择

坚持学习，整理复盘

文章链接

评论可见，请评论后查看内容，谢谢！！！

您阅读本篇文章共花了：

回归数据挖掘人工智能

本文由用户于 2024-02-26 发布在金钥匙，如有疑问，请联系我们。
本文链接：https://www.51969.com/post/18580738.html

金钥匙

数据挖掘人工智能正则化实战( Lasso 套索回归,Ridge 岭回归)

均值算法 python 算法数据挖掘 backtrader量化回测跟踪止损的均值回归策略

数据挖掘人工智能多保真度建模的层次回归框架

发表评论取消回复

金钥匙

数据挖掘 人工智能 正则化实战( Lasso 套索回归,Ridge 岭回归)

均值算法 python 算法 数据挖掘 backtrader量化回测跟踪止损的均值回归策略

数据挖掘 人工智能 多保真度建模的层次回归框架

相关文章

发表评论取消回复

数据挖掘人工智能正则化实战( Lasso 套索回归,Ridge 岭回归)

均值算法 python 算法数据挖掘 backtrader量化回测跟踪止损的均值回归策略

数据挖掘人工智能多保真度建模的层次回归框架