- 一直有在kaggle上尝试一些比赛,不可避免要下载一些超大数据集,但直接在Data页面通过浏览器下载速度太慢,kaggle官方也提供了API便于快速下载数据集,具体操作也很简单。
一、Kaggle API安装及使用(ubuntu16.04)
1.终端下安装:pip install kaggle
2.登录kaggle账户,右上角头像处点击My Account,在API栏,点击Create New API Token下载kaggle.json文件
3.终端下创建.kaggle文件:
cd ~
mkdir .kaggle
cd ~/.kaggle/
也可以直接在Home目录下手动创建.kaggle文件夹
4.将下载好的kaggle.json文件放入.kaggle文件夹
5.进入对应比赛Data页面,点击粘贴API右侧的数据集下载指令到终端(以Titanic为例)
kaggle competitions download -c titanic
6.在终端中可以查看数据集下载路径
二、添加conda创建的虚拟环境对应的kernel核
- 在kaggle比赛中,很大部分参赛者Types都会使用Notebook工具实现他们的代码,也即.ipynb文件,我使用的是Anaconda3工具附带的jupyter notebook,也可以选择使用Google Colab。
但是jupyter notebook默认的Kernel是Python 3,如果想要使用在conda中配置好的虚拟环境对应的Kernel,则需要添加对应Kernel至/home/(用户名)/.