我已经阅读了一些将文件或数据集从Google Collaboratory或 Linux 终端上传到GitHub 的命令(请参阅我之前的问题)。
但是,我不知道如何直接通过命令将数据集从Google Collaboratory或 Linux shell上传到 Kaggle。我怎样才能做到这一点?
安装 Kaggle 命令行界面(这里通过 PIP,一个 Python 包管理器):
sudo apt install python3-pip
pip3 install --user kaggle
为下一步创建配置目录:
mkdir ~/.kaggle
验证:
为了使用 Kaggle 的公共 API,您必须首先使用 API 令牌进行身份验证。在站点标题中,单击您的用户个人资料图片,然后从下拉菜单中单击“我的帐户”。这会将您带到https://www.kaggle.com/account上的帐户设置。向下滚动到页面中标记为 API 的部分:
要创建新令牌,请单击“创建新 API 令牌”按钮。这会将新的身份验证令牌下载到您的机器上。
将其存储为~/.kaggle/kaggle.json
,因为默认情况下 CLI 将在此处查找它。您可以简单地将该路径复制并粘贴到 Web 浏览器的文件选择对话框中。
再次来自相同的官方 API 文档:
创建一个新的数据集
以下是在 Kaggle 上创建新数据集的步骤:
创建一个包含要上传的文件的文件夹。
跑步
kaggle datasets init -p /path/to/dataset
以生成的元数据文件。
将数据集的元数据添加到生成的文件
datapackage.json
.跑步
kaggle datasets create -p /path/to/dataset
创建数据集。
默认情况下,您的数据集将是私有的。您还可以
-u
在创建时添加标志以将其公开,或从数据集页面导航至“设置”>“共享”以将其公开或与合作者共享。创建一个新的数据集版本
如果您想上传现有数据集的新版本,请按照以下步骤操作:
跑步
kaggle datasets init -p /path/to/dataset
以生成一个元数据文件(如果你不已经有一个)。
确保(或) 中的
id
字段指向您的数据集。dataset-metadata.json
datapackage.json
跑步:
kaggle datasets version -p /path/to/dataset -m "Your message here"
这些说明是开始在 Kaggle 上创建和更新数据集所需的基本命令。您可以从 GitHub 上的官方文档中找到更多详细信息:
看看我的回答,结果证明这是告诉你 RTFM 的好方法。;-]
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句