首页 > 分享 > Python 机器学习 随机森林 天气最高温度预测任务(三)

Python 机器学习 随机森林 天气最高温度预测任务(三)

开始调节新的参数

from sklearn.ensemble import RandomForestRegressor

rf = RandomForestRegressor(random_state = 42)

from pprint import pprint

# 打印所有参数
pprint(rf.get_params())

开始尝试各种参数吧

调参路漫漫,参数的可能组合结果实在太多了,我们还得有章可循,首先登场的是:RandomizedSearchCV(),这个函数可以帮助我们在候选集组合中,不断的随机选择一组合适的参数来建模,并且求其交叉验证后的评估结果。为什么要不断随机的选择呢?按顺序一个个来不是更靠谱嘛,假设咱们有5个参数待定,每个参数都有10种候选值,那一共有多少种可能性呢?这个数字就很大了吧,由于建立模型所花的时间并不少,当数据量大的时候,几小时能完成一次建模就已经不错了,所以我们很难遍历到所有的可能,随机变成了一种策略,让我们大致能得到比较合适的参数组合,该函数所需的所有参数解释都在API文档中有详细说明.

from sklearn.model_selection import RandomizedSearchCV

# 建立树的个数
n_estimators = [int(x) for x in np.linspace(start = 200, stop = 2000, num = 10)]
# 最大特征的选择方式
max_features = ['auto', 'sqrt']
# 树的最大深度
max_depth = [int(x) for x in np.linspace(10, 20, num = 2)]
max_depth.append(None)
# 节点最小分裂所需样本个数
min_samples_split = [2, 5, 10]
# 叶子节点最小样本数,任何分裂不能让其子节点样本数少于此值
min_samples_leaf = [1, 2, 4]
# 样本采样方法
bootstrap = [True, False]

# Random grid
random_grid = {'n_estimators': n_estimators,
               'max_features': max_features,
               'max_depth': max_depth,
               'min_samples_split': min_samples_split,
               'min_samples_leaf': min_samples_leaf,

相关知识

Python机器学习基础教程
《Python机器学习开发实战》电子书在线阅读
【机器学习】R语言实现随机森林、支持向量机、决策树多方法二分类模型
python机器学习
机器学习术语表
第 1 章 机器学习基础引言
谷歌出品!机器学习常用术语总结
[Python机器学习]鸢尾花分类 机器学习应用
机器学习常用术语
基于机器学习的落叶松毛虫发生面积预测模型

网址: Python 机器学习 随机森林 天气最高温度预测任务(三) https://m.huajiangbk.com/newsview541269.html

所属分类:花卉
上一篇: Opencv3笔记28——直方图
下一篇: 母亲节鲜花配送配送,送母亲节康乃