首页 > 分享 > 交叉验证中cv=? 与 cv=KFold(n

交叉验证中cv=? 与 cv=KFold(n

这几天复习交叉验证的时候发现一个问题,学习资料中有些地方用的函数中cv=?,有些地方则用的cv=KFold(n_splits=?) 这个函数,就比如我用KNN模型做十折交叉验证:

model = sk_neighbors.KNeighborsClassifier(n_neighbors=5,n_jobs=1) #KNN分类 import sklearn.model_selection as sk_model_selection accs=sk_model_selection.cross_val_score(model, iris_X, y=iris_y, scoring=None,cv=10, n_jobs=1) print('交叉验证结果:',accs) 1234

这里面第三行用的cv=10。然后在我的Titanic实战中:

kf = KFold(titanic.shape[0], n_splits=10, random_state=1, shuffle=False) 1

这里用kfold函数中的n_splits代表分十份。为什么呢???

我在StackExchange这个网站发现老外说的这些话:
When an integer is passed to the cv parameter of cross_val_score():

StratifiedKFold is used if the estimator is a classifier and y is either binary or multiclass.In all other cases, KFold is used.

啥意思呢? 如果估计器是一个分类器,并且y是二进制或多类,则使用StratifiedKFold,如果是其他情况,就用KFold

这里的StratifiedKFold是啥?cv=StratifiedKFold(n_splits=10)其实就等价于cv=10
同样也有cv=KFold(n_splits=10)))

遵从这个标准,可以让结果变得更好!

相关知识

Kaggle宠物收养比赛亚军复盘
狗狗识别
宠物食品(时产1吨)宠物饲料生产线
宝石宠物tinkle剧情介绍,必须是每集有什么事情发生之类的。
《如果的世界》7月7日震撼二测 让动漫进驻游戏
宠物牵引绳检测的arm边缘设备安装遇到的问题
猫咪糖尿病最多用几个单位胰岛素:甘精胰岛素与常规胰岛素方案在猫糖尿病酮症酸中毒中的比较
坟墓宠物与交叉颜色图标矢量插图图片
宠食品牌Lucky Lou夺冠德国品牌奖;美国宠物品牌获得可持续性认证
史上最完整的仓鼠新手教程

网址: 交叉验证中cv=? 与 cv=KFold(n https://m.mcbbbk.com/newsview161093.html

所属分类:萌宠日常
上一篇: 基本数学问题
下一篇: 稻盛和夫:人生、事业的结果=思维