这个函数的作用为:关于没有同巨细的训练集,确定穿插验证训练以及测试的分数。
一个穿插验证发作器将整个数据集宰割k次,宰割成训练集以及测试集。(保举学习:Python视频教程)
没有同巨细的训练集的子集将会被用来训练评价器而且关于每个巨细的训练子集城市孕育发生一个分数,而后测试集的分数也管帐算。而后,关于每个训练子集,运转k次之后的一切这些分数将会被均匀。
这个函数需求援用sklearn包
import sklearnfrom sklearn.learning_curve import learning_curve
这个函数的挪用格局是:
learning_curve(estimator, X, y, train_sizes=array([ 0.1 , 0.325, 0.55 , 0.775, 1. ]), cv=None, scoring=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch='all', verbose=0)
estimator:所应用的分类器
X:array-like, shape (n_samples, n_features)
训练向量,n_samples是样本的数目,n_features是特色的数目
y:array-like, shape (n_samples) or (n_samples, n_features), optional
指标绝对于X分类或许回归
train_sizes:array-like, shape (n_ticks,), dtype float or int
训练样本的绝对的或相对的数字,这些量的样本将会天生learning curve。假如dtype是float,他将会被视为最年夜数目训练集的一局部(这个由所抉择的验证办法所决议)。不然,他将会被视为训练集的相对尺寸。要留意的是,关于分类而言,样本的巨细必需要充沛年夜,达到关于每个分类都至多蕴含一个样本的状况。
cv:int, cross-validation generator or an iterable, optional
确定穿插验证的别离战略
--None,应用默许的3-fold cross-validation,
--integer,确定是几折穿插验证
--一个作为穿插验证天生器的工具
--一个被使用于训练/测试别离的迭代器
verbose : integer, optional
管制冗余:越高,有越多的信息
前往值:
train_sizes_abs:array, shape = (n_unique_ticks,), dtype int
用于天生learning curve的训练集的样本数。因为反复的输出将会被删除了,以是ticks可能会少于n_ticks.
train_scores : array, shape (n_ticks, n_cv_folds)
正在训练集上的分数
test_scores : array, shape (n_ticks, n_cv_folds)
正在测试集上的分数
更多Python相干技巧文章,请拜访Python教程栏目进行学习!
以上就是python若何应用learning_curve的具体内容,更多请存眷资源魔其它相干文章!
标签: Python python教程 python编程 python使用问题
抱歉,评论功能暂时关闭!