python写入html文件中文乱码成绩
应用open函数将爬虫爬取的html写入文件,有时分正在管制台没有会乱码,然而写入文件的html中的中文是乱码的
案例剖析
看上面一段代码:
# 爬虫未应用cookiefrom urllib import requestif __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w")as f: # 将爬取的页面 print(html) f.write(html)
看似不成绩,而且正在管制台输入的html也没有会呈现中文乱码,然而创立的html文件中
处理计划
应用open办法的一个参数,名为encoding=” “,退出encoding=”utf-8”便可
# 爬虫未应用cookiefrom urllib import requestif __name__ == '__main__': url = "http://www.renren.com/967487029/profile" rsp = request.urlopen(url) html = rsp.read().decode() with open("rsp.html","w",encoding="utf-8")as f: # 将爬取的页面 print(html) f.write(html)
运转后果
感激各人的浏览,心愿各人收益多多。
本文转自: https://blog.csdn.net/qq_40147863/article/details/81746445
保举教程:《python教程》
以上就是若何处理python写入html文件中乱码的景象(图文详解)的具体内容,更多请存眷资源魔其它相干文章!
标签: 乱码 Python python教程 python编程 python使用问题 html文件
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。
抱歉,评论功能暂时关闭!