从给定 URL 下载文件并使用 Google Colab 保存文件的问题

乌迪斯·因德拉坎塔

我有一些位于 GitHub 中的 java 文件的 URL。我想将 URL 传递给一个方法,下载文件并使用不同的唯一名称保存它。

这是我写的代码,它有代码片段下面提到的问题。

!pip install wget

import wget
from datetime import datetime


def download_file(url):

   # Creating file name
   now_time =datetime.now()
   millisec = now_time.timestamp() * 10000
   millisec = str(millisec).split('.')[0]
   partial_name = url.split('/')[-1].split('.')[0]
   file_name = partial_name + millisec + '.java'

   # Download the file and save in colab location
   wget.download(url, file_name)

   return file_name

我传递给此方法的示例 URL 是“https://github.com/e32wong/CloCom/blob/master/CloneDigger.java”

问题是,下载的 java 文件的内容显示为一个充满标签的 HTML 内容。但是,GitHub 上的原始文件是一个简单的 java 文件。

我想按原样保存文件。请对此有任何解决方案。

萨曼西卡·拉贾帕克萨

问题出在 URL 上。您必须传递文件的原始 URL。

Page URL:'https://github.com/e32wong/CloCom/blob/master/CloneDigger.java'

Raw URL: 'https://raw.githubusercontent.com/e32wong/CloCom/master/CloneDigger.java'

您可以通过替换它来轻松修改 url。尝试这个。

def download_file(url):

   # Creating file name
   now_time =datetime.now()
   millisec = now_time.timestamp() * 10000
   millisec = str(millisec).split('.')[0]
   partial_name = url.split('/')[-1].split('.')[0]
   file_name = partial_name + millisec + '.java'

   #Edit url as the raw file url of github
   url = url.replace('github.com', 'raw.githubusercontent.com', 1)
   url = url.replace('/blob/', '/',1)

   # Download the file and save in colab location
   
   wget.download(url, file_name)

   return file_name

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章