我正在尝试为Databricks建立GitHub集成。
我们那里有数百个笔记本,因此将每个笔记本手动添加到存储库将很累。
有没有办法自动提交所有笔记本并将其从数据块推送到存储库?
由于三个月没有人回答,我将提出自己的解决方案。
在/Shared/
databricks的dir下,我们有应该同步到的存储库的笔记本notebooks/Shared/
。
我会定期运行此脚本,从而使所有笔记本电脑都保持最新状态。
databricks workspace export_dir /Shared ./notebooks/Shared -o
git add --all
git commit -m "shared notebooks updated"
git push
-o
标志用于覆盖最新版本的现有笔记本。
此处提供更多信息:https : //databricks.com/blog/2017/11/08/introducing-command-line-interface-for-databricks-developers.html
请注意,您首先必须在计算机上设置和配置databricks-cli:https ://docs.databricks.com/user-guide/dev-tools/databricks-cli.html#set-up-the-cli
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句