当前位置: 代码迷 >> 综合 >> Kaggle API快速下载数据集以及jupyter notebook添加内核
  详细解决方案

Kaggle API快速下载数据集以及jupyter notebook添加内核

热度:99   发布时间:2023-12-14 15:57:41.0
  • 一直有在kaggle上尝试一些比赛,不可避免要下载一些超大数据集,但直接在Data页面通过浏览器下载速度太慢,kaggle官方也提供了API便于快速下载数据集,具体操作也很简单。

一、Kaggle API安装及使用(ubuntu16.04)

1.终端下安装:pip install kaggle
2.登录kaggle账户,右上角头像处点击My Account,在API栏,点击Create New API Token下载kaggle.json文件
3.终端下创建.kaggle文件:
cd ~
mkdir .kaggle
cd ~/.kaggle/
也可以直接在Home目录下手动创建.kaggle文件夹
4.将下载好的kaggle.json文件放入.kaggle文件夹
5.进入对应比赛Data页面,点击粘贴API右侧的数据集下载指令到终端(以Titanic为例)
kaggle competitions download -c titanic
6.在终端中可以查看数据集下载路径

二、添加conda创建的虚拟环境对应的kernel核

  • 在kaggle比赛中,很大部分参赛者Types都会使用Notebook工具实现他们的代码,也即.ipynb文件,我使用的是Anaconda3工具附带的jupyter notebook,也可以选择使用Google Colab。
    但是jupyter notebook默认的Kernel是Python 3,如果想要使用在conda中配置好的虚拟环境对应的Kernel,则需要添加对应Kernel至/home/(用户名)/.
  相关解决方案