python如何使用learning_curve-Python教程

资源魔 2020-07-21 22:18:53 35 0

python learning_curve函数

这个函数的作用为：关于没有同巨细的训练集，确定穿插验证训练以及测试的分数。

一个穿插验证发作器将整个数据集宰割k次，宰割成训练集以及测试集。（保举学习：Python视频教程）

没有同巨细的训练集的子集将会被用来训练评价器而且关于每个巨细的训练子集城市孕育发生一个分数，而后测试集的分数也管帐算。而后，关于每个训练子集，运转k次之后的一切这些分数将会被均匀。

这个函数需求援用sklearn包

import sklearnfrom sklearn.learning_curve import learning_curve

这个函数的挪用格局是：

learning_curve(estimator, X, y, train_sizes=array([ 0.1  ,  0.325,  0.55 ,  0.775,  1.   ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)

estimator：所应用的分类器

X:array-like, shape (n_samples, n_features)

训练向量，n_samples是样本的数目，n_features是特色的数目

y:array-like, shape (n_samples) or (n_samples, n_features), optional

指标绝对于X分类或许回归

train_sizes:array-like, shape (n_ticks,), dtype float or int

训练样本的绝对的或相对的数字，这些量的样本将会天生learning curve。假如dtype是float，他将会被视为最年夜数目训练集的一局部（这个由所抉择的验证办法所决议）。不然，他将会被视为训练集的相对尺寸。要留意的是，关于分类而言，样本的巨细必需要充沛年夜，达到关于每个分类都至多蕴含一个样本的状况。

cv:int, cross-validation generator or an iterable, optional

确定穿插验证的别离战略

--None，应用默许的3-fold cross-validation,

--integer,确定是几折穿插验证

--一个作为穿插验证天生器的工具

--一个被使用于训练/测试别离的迭代器

verbose : integer, optional

管制冗余：越高，有越多的信息

前往值：

train_sizes_abs：array, shape = (n_unique_ticks,), dtype int

用于天生learning curve的训练集的样本数。因为反复的输出将会被删除了，以是ticks可能会少于n_ticks.

train_scores : array, shape (n_ticks, n_cv_folds)