如何从命令行（例如 Google Collaboratory）将数据集上传到 Kaggle？

maryam 发表于 Dev

玛丽亚姆

我已经阅读了一些将文件或数据集从Google Collaboratory或 Linux 终端上传到GitHub 的命令（请参阅我之前的问题）。

但是，我不知道如何直接通过命令将数据集从Google Collaboratory或 Linux shell上传到 Kaggle。我怎样才能做到这一点？

大卫福斯特

1 准备

基于官方 Kaggle API 文档：

安装 Kaggle 命令行界面（这里通过 PIP，一个 Python 包管理器）：
```
sudo apt install python3-pip
pip3 install --user kaggle
```
为下一步创建配置目录：
```
mkdir ~/.kaggle
```
验证：

为了使用 Kaggle 的公共 API，您必须首先使用 API 令牌进行身份验证。在站点标题中，单击您的用户个人资料图片，然后从下拉菜单中单击“我的帐户”。这会将您带到https://www.kaggle.com/account上的帐户设置。向下滚动到页面中标记为 API 的部分：

要创建新令牌，请单击“创建新 API 令牌”按钮。这会将新的身份验证令牌下载到您的机器上。

将其存储为~/.kaggle/kaggle.json，因为默认情况下 CLI 将在此处查找它。您可以简单地将该路径复制并粘贴到 Web 浏览器的文件选择对话框中。

2 数据集上传

再次来自相同的官方 API 文档：

创建一个新的数据集

以下是在 Kaggle 上创建新数据集的步骤：
创建一个包含要上传的文件的文件夹。
跑步
kaggle datasets init -p /path/to/dataset
以生成的元数据文件。
将数据集的元数据添加到生成的文件datapackage.json.
跑步
kaggle datasets create -p /path/to/dataset
创建数据集。
默认情况下，您的数据集将是私有的。您还可以-u在创建时添加标志以将其公开，或从数据集页面导航至“设置”>“共享”以将其公开或与合作者共享。

创建一个新的数据集版本

如果您想上传现有数据集的新版本，请按照以下步骤操作：
跑步
kaggle datasets init -p /path/to/dataset
以生成一个元数据文件（如果你不已经有一个）。
确保(或) 中的id字段指向您的数据集。dataset-metadata.jsondatapackage.json
跑步：
kaggle datasets version -p /path/to/dataset -m "Your message here"

这些说明是开始在 Kaggle 上创建和更新数据集所需的基本命令。您可以从 GitHub 上的官方文档中找到更多详细信息：

初始化元数据

创建数据集

更新数据集

看看我的回答，结果证明这是告诉你 RTFM 的好方法。;-]

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-06-2

我来说两句

0 条评论

登录后参与评论

上一篇：为什么kibana的可视化图表中的唯一计数不正确？

如何将文件从 Google Colab 上传到 GitHub 或 Kaggle？

如何从命令行（例如 Google Collaboratory）将数据集上传到 Kaggle？

如何从命令行（例如 Google Collaboratory）将数据集上传到 Kaggle？

1 准备

2 数据集上传

创建一个新的数据集

创建一个新的数据集版本

Linux的官方Adobe Flash存储库是否已过时？

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

错误：“ javac”未被识别为内部或外部命令，

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Modbus Python施耐德PM5300

为什么Object.hashCode（）不遵循Java代码约定

如何检查字符串输入的格式

检查嵌套列表中的长度是否相同

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

如何自动选择正确的键盘布局？-仅具有一个键盘布局

如何正确比较 scala.xml 节点？

在令牌内联程序集错误之前预期为 ')'

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

解决类Koin的实例时出错

ES5的代理替代

有什么解决方案可以将android设备用作Cast Receiver？

VBA 自动化错误：-2147221080 (800401a8)

套接字无法检测到断开连接