我有一些位于 GitHub 中的 java 文件的 URL。我想将 URL 传递给一个方法,下载文件并使用不同的唯一名称保存它。
这是我写的代码,它有代码片段下面提到的问题。
!pip install wget
import wget
from datetime import datetime
def download_file(url):
# Creating file name
now_time =datetime.now()
millisec = now_time.timestamp() * 10000
millisec = str(millisec).split('.')[0]
partial_name = url.split('/')[-1].split('.')[0]
file_name = partial_name + millisec + '.java'
# Download the file and save in colab location
wget.download(url, file_name)
return file_name
我传递给此方法的示例 URL 是“https://github.com/e32wong/CloCom/blob/master/CloneDigger.java”
问题是,下载的 java 文件的内容显示为一个充满标签的 HTML 内容。但是,GitHub 上的原始文件是一个简单的 java 文件。
我想按原样保存文件。请对此有任何解决方案。
问题出在 URL 上。您必须传递文件的原始 URL。
Page URL:'https://github.com/e32wong/CloCom/blob/master/CloneDigger.java'
Raw URL: 'https://raw.githubusercontent.com/e32wong/CloCom/master/CloneDigger.java'
您可以通过替换它来轻松修改 url。尝试这个。
def download_file(url):
# Creating file name
now_time =datetime.now()
millisec = now_time.timestamp() * 10000
millisec = str(millisec).split('.')[0]
partial_name = url.split('/')[-1].split('.')[0]
file_name = partial_name + millisec + '.java'
#Edit url as the raw file url of github
url = url.replace('github.com', 'raw.githubusercontent.com', 1)
url = url.replace('/blob/', '/',1)
# Download the file and save in colab location
wget.download(url, file_name)
return file_name
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句