python机器学习之sk-learn库(2.数据集)
sklean的数据集
-数据集接口介绍
- 数据集划分
数据集接口介绍
- sklearn.datasets.load_*():获取小规模的数据集 - sklearn.datasets.fetch_*(data_home=None,subset):获取大规模的数据集data_home表示数据集下载目录,None为默认值表示的是家目录/scikit_learn_data(自动创建该文件夹)下。需要从网络下载.subset为需要下载的数据集,可以为train,test,all。
获取小规模的数据集
获取大规模的数据集
----------------------------分界线---------------------------
数据集划分
我们需要将原先的样本数据拆分成两部分:
训练集:训练模型测试集:评估模型
不同类型的模型对应的评估方式是不一样的
数据集划分的API
- from sklearn.model_selection import train_te
共有 0 条评论