python 抓取的网页默认是bytes的,要转码.
查看网页源码可以看到,我本次抓取的网页的编码方式是utf-8的.
req = urllib.request.Request(url=myurl,headers = myheaders)data = urllib.request.urlopen(req).read()print(data.decode("UTF-8"))
这样就正常显示中文了
本文共 242 字,大约阅读时间需要 1 分钟。
python 抓取的网页默认是bytes的,要转码.
查看网页源码可以看到,我本次抓取的网页的编码方式是utf-8的.
req = urllib.request.Request(url=myurl,headers = myheaders)data = urllib.request.urlopen(req).read()print(data.decode("UTF-8"))
这样就正常显示中文了
转载于:https://blog.51cto.com/smilence/1345759