sklearn做交叉验证

2016-05-13 22:45:00

交叉验证是经常用到的验证方法
使用sklearn可以很大程度上简化交叉验证的过程
使用过程见下方：

from sklearn import cross_validation
gbdt=GradientBoostingRegressor()
score = cross_validation.cross_val_score(gbdt, train_set,
label_set, cv=10, scoring='accuracy')

这里以gbdt模型为例
train_set：训练集
label_set：标签
cv: 交叉验证的倍数
scoring: 返回结果的类型，可以自定义，也有很多默认选项
例如‘accuracy’, 就是返回准确率
[‘accuracy‘, ‘adjusted_rand_score‘,
‘average_precision‘, ‘f1‘, ‘f1_macro‘,
‘f1_micro‘, ‘f1_samples‘, ‘f1_weighted‘,
‘log_loss‘, ‘mean_absolute_error‘,
‘mean_squared_error‘, ‘median_absolute_error‘,
‘precision‘, ‘precision_macro‘,
‘precision_micro‘, ‘precision_samples‘,
‘precision_weighted‘, ‘r2‘, ‘recall‘,
‘recall_macro‘, ‘recall_micro‘,
‘recall_samples‘, ‘recall_weighted‘,
‘roc_auc‘] 都是可以的

这就是简单的用法，只有scoring比较复杂，其他都比较简单

关键字：Python, gbdt, scoring, sklearn

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符，请点击举报进行投诉反馈！