import pandas as pd import matplotlib.pyplot as plt 12'
#分析马力、加速度、气缸数量等因素对每加仑汽油行驶距离的影响 #由于数据集中每列数据没有标签,因此需要先手动添加,且用空格来隔开 columns = [ 'mpg', 'cylinders', 'displacement', 'horsepower', 'weight', 'acceleration', 'model year', 'origin', 'car name' ] cars = pd.read_table('./data/auto-mpg.data', delim_whitespace=True, names = columns) print(cars.head()) 12345678
mpg cylinders displacement horsepower weight acceleration model year 0 18.0 8 307.0 130.0 3504.0 12.0 70 1 15.0 8 350.0 165.0 3693.0 11.5 70 2 18.0 8 318.0 150.0 3436.0 11.0 70 3 16.0 8 304.0 150.0 3433.0 12.0 70 4 17.0 8 302.0 140.0 3449.0 10.5 70 origin car name 0 1 chevrolet chevelle malibu 1 1 buick skylark 320 2 1 plymouth satellite 3 1 amc rebel sst 4 1 ford torino 12345678910111213 对数据进行简单的可视化操作
plt.figure() ax1 = plt.subplot(2,1,1) ax2 = plt.subplot(2,1,2) cars.plot('weight', 'mpg', kind='scatter', ax=ax1) cars.plot('acceleration', 'mpg', kind='scatter', ax=ax2) plt.show() 123456
import sklearn from sklearn.linear_model import LinearRegression 12
lr = LinearRegression() lr.fit(cars[['weight']], cars['mpg']) #输入参数类型为nparray 12
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False) 12
predictions = lr.predict(cars[['weight']]) print(predictions[0:5]) print(cars['mpg'].head()) 123
[19.41852276 17.96764345 19.94053224 19.96356207 19.84073631] 0 18.0 1 15.0 2 18.0 3 16.0 4 17.0 Name: mpg, dtype: float64 1234567
plt.scatter(cars['weight'], cars['mpg'], c='red') plt.scatter(cars['weight'], predictions, c='blue') plt.show() 123
from sklearn.metrics import mean_squared_error mse = mean_squared_error(cars['mpg'], predictions) print(mse) 1234
18.780939734628394 1
rmse = mse**(0.5) print(rmse) 12
4.333698159150957 1
相关知识
线性回归实例
《Python机器学习开发实战》电子书在线阅读
机器学习项目实战
程序员面试、算法研究、机器学习、大模型/ChatGPT/AIGC、论文审稿、具身智能、RAG等11大系列集锦
数字化印刷的智能化趋势:AI与机器学习在印刷业中的应用
TensorFlow学习记录(八)
【机器学习】鸢尾花分类:机器学习领域经典入门项目实战
深度学习应用开发
机器学习在农业领域的应用现状
机器学习术语表
网址: 机器学习实战1.1之线性回归:汽车燃油效率分析 https://m.huajiangbk.com/newsview948312.html
上一篇: 提高制动热效率的内燃机降低能耗技 |
下一篇: 热效率“第一之争”背后,纯电车跨 |