如何从命令行(例如 Google Collaboratory)将数据集上传到 Kaggle?

玛丽亚姆

我已经阅读了一些将文件或数据集从Google Collaboratory或 Linux 终端上传GitHub 的命令请参阅我之前的问题)。

但是,我不知道如何直接通过命令将数据集从Google Collaboratory或 Linux shell上传到 Kaggle。我怎样才能做到这一点?

大卫福斯特

1 准备

基于官方 Kaggle API 文档

  1. 安装 Kaggle 命令行界面(这里通过 PIP,一个 Python 包管理器):

    sudo apt install python3-pip
    pip3 install --user kaggle
    
  2. 为下一步创建配置目录:

    mkdir ~/.kaggle
    
  3. 验证:

    为了使用 Kaggle 的公共 API,您必须首先使用 API 令牌进行身份验证。在站点标题中,单击您的用户个人资料图片,然后从下拉菜单中单击“我的帐户”。这会将您带到https://www.kaggle.com/account上的帐户设置向下滚动到页面中标记为 API 的部分:

    要创建新令牌,请单击“创建新 API 令牌”按钮。这会将新的身份验证令牌下载到您的机器上。

    将其存储为~/.kaggle/kaggle.json,因为默认情况下 CLI 将在此处查找它。您可以简单地将该路径复制并粘贴到 Web 浏览器的文件选择对话框中。

2 数据集上传

再次来自相同的官方 API 文档

创建一个新的数据集

以下是在 Kaggle 上创建新数据集的步骤:

  1. 创建一个包含要上传的文件的文件夹。

  2. 跑步

    kaggle datasets init -p /path/to/dataset
    

    生成的元数据文件

  3. 将数据集的元数据添加到生成的文件datapackage.json.

  4. 跑步

    kaggle datasets create -p /path/to/dataset
    

    创建数据集。

默认情况下,您的数据集将是私有的。您还可以-u在创建时添加标志以将其公开,或从数据集页面导航至“设置”>“共享”以将其公开或与合作者共享。

创建一个新的数据集版本

如果您想上传现有数据集的新版本,请按照以下步骤操作:

  1. 跑步

    kaggle datasets init -p /path/to/dataset
    

    生成一个元数据文件(如果你不已经有一个)。

  2. 确保(或) 中id字段指向您的数据集。dataset-metadata.jsondatapackage.json

  3. 跑步:

    kaggle datasets version -p /path/to/dataset -m "Your message here"
    

这些说明是开始在 Kaggle 上创建和更新数据集所需的基本命令。您可以从 GitHub 上的官方文档中找到更多详细信息:

看看我的回答,结果证明这是告诉你 RTFM 的好方法。;-]

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何将文件从 Google Colab 上传到 GitHub 或 Kaggle?

如何将 Kaggle 数据集导入 Google Cloud Platform

在Mac上从命令行上传到Google云端硬盘

在Google Colab中使用Kaggle数据集

如何从命令行启动新的Google Chrome实例?

如何从命令行安装Google Chrome

如何从命令行创建Google联系人?

将文件从Kaggle下载到Google Colab

如何将 kaggle 数据集导入 PyCharm IDE

如何使用FTP或SSH从命令行上传文件?

如何从命令行下载数据 URL?

如何从命令行删除MongoDB数据库?

如何从命令行编辑pdf元数据?

如何使用Xcode 11从命令行上传到App Store?

如何使用 Xcode 11 从命令行将 api 上传到 App Store?

如何从命令行将照片上传到imgur并获得直接链接?

从命令行刷新Excel数据

下载Kaggle数据集

如何从命令行 SDK 管理器添加 Google 存储库

如何从命令行启动Google Crome应用程序?

如何训练从 kaggle 下载的图像的 amd 测试数据集

从命令行访问Google API(日历)

将单个项目中的Google BigQuery数据集导出为bq命令行中的列表?

如何从命令行启动 TFS 构建,同时指定变更集和货架集?

如何从命令行测试Perl CGI脚本的文件上传?

如何从命令行中删除别名中的参数集

如何从命令行使用GenericAcrfTui查看测试集的标签?

如何从命令行将年度netCDF数据转换为每日数据?

Jmeter - 从命令行运行测试后如何查看采样器数据?