我正在从google.com抓取特定的网址,但出现了一些错误
'utf8' codec can't decode byte 0xc3 in position 72: invalid continuation byte
代码:
import re
import os
import MySQLdb
import codecs
import requests
import base64
import random
import gzip
import time
from multiprocessing.pool import Pool
import datetime
import time
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
def proxy_mesh():
while True:
try:
data = requests.get('google.com')
print data.text.encode('utf-8')
except Exception, e:
print e
print "Trying again"
time.sleep(3)
proxy_mesh()
什么是FIX,以及如何克服此错误?
保持简单,就可以了。数据已被requests
模块解码。
import requests
data = requests.get('https://www.whoisxmlapi.com/whoisserver/WhoisService?domainName=http://N%E2%94%[email protected]&outputFormat=json')
print data.text
由于它是JSON响应,因此您可能还需要对其进行处理:
import json
print json.loads(data.text)
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句