正确的方法来修复没有http://的网址

邦帕西尼

我正在尝试open使用以下格式的网址列表Urllib2

google.com
facebook.com
youtube.com
yahoo.com
baidu.com

使用此方法:

urllib2.urlopen(url)

并得到此错误:

File "fetcher.py", line 98, in fetch_urls_and_save
  response = urllib2.urlopen(url)
File "urllib2.py", line 154, in urlopen
  return opener.open(url, data, timeout)
File "urllib2.py", line 423, in open
  protocol = req.get_type()
File "urllib2.py", line 285, in get_type
  raise ValueError, "unknown url type: %s" % self.__original

所以,我的问题是:

是否有适当的方法来“修复”这些网址,还是我应该http://在每个字符串前简单附加我认为这不是最佳解决方案,因为以url开头的网址又https://如何呢?

力布鲁

我建议只将http://字符串添加到该字符串,因为使用https://重定向方案的许多站点都会通过重定向请求自动切换到该字符串

您可以urlopen使用该getcode()功能检查返回的状态

a=urllib2.urlopen("http://google.com")
print a.getcode() # prints 200

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

有没有正确的方法来发现js中的非致命错误?

有没有一种“正确的”方法来避免“必须是最终的”错误?

有没有正确的方法来确定NSNumber是使用Swift从Bool派生的?

有没有更正确的方法来实现自己的目标?

有没有更简洁的方法来获取我的网址中的最后一个数字?

有没有正确的方法来合并两个顺序不正确的提交?

有没有正确/推荐的方法来检测我在手机上运行的UWP应用?

有没有简单的方法来检查内存?

有没有合适的方法来孵化 QLabel

有没有更好的方法来更新 PostgreSQL

有没有更好的方法来避免if / then / else?

有没有更好的方法来退出递归?

有没有更好的方法来兑现承诺?

有没有更好的方法来编辑PDF?

有没有更好的方法来计算重量

有没有更好的方法来移动窗口?

有没有更好的方法来构建 OracleCommand?

有没有通用的方法来打印变量?

有正确的方法来存储已解决的承诺吗?

有没有更好的方法来区分没有孩子或父母身份无效?

有没有没有查询字符串的方法来获取URL?

有没有安全的方法来分离/卸载行为而没有副作用?

有没有更好的方法来实现没有Javascript的CSS动画?

有没有更好的方法来实现这个没有多个获取请求?

有没有安全的方法来调用`call`来调用JavaScript中的函数?

有没有更简单的方法来通过对象解构来分配这个变量?

有没有更好的方法来迭代列表来制作元组列表

在 Vue 2.2.1 中使用 Tether 操作 DOM 会导致错误。有没有正确的方法来做到这一点?

正确的方法来传输TypedArrays?