Jquery中文网 > Python编程 > Python入门 > 正文 selenium如何解决python爬虫乱码问题？

selenium如何解决python爬虫乱码问题？

发布时间：2020-12-02 编辑：www.jquerycn.cn

jquery中文网为您提供selenium如何解决python爬虫乱码问题？等资源，欢迎您收藏本站，我们将为您提供最新的selenium如何解决python爬虫乱码问题？资源

平时没事的时候，很多人喜欢把自己的生活或者工作心得分享到博客上，也是互相交流的一种方法。不过想大量的看一些博客，在获取的时候就容易出现乱码的问题，相信这点很多小伙伴们都遇到了。今天小编就带来selenium的方法帮助大家解决python爬虫乱码问题。

在用requests库对博客进行爬取时，发现乱码报错，如下图所示：

网上查找了一些方法，以为是遇到了网站加密处理。后来发现通过F12还是能获取网页的元素，那么有什么办法能规避乱码问题呢？答案是：用selenium.

效果如下

代码

# coding=utf-8
# @Auther : "鹏哥贼优秀"
# @Date : 2019/10/16
# @Software : PyCharm
 
from selenium import webdriver
 
url = 'https://blog.csdn.net/yuzipeng'
driver = webdriver.Chrome("F:\\Python成长之路\\chromedriver.exe")
driver.get(url)
urls = driver.find_elements_by_xpath('//div[@class="article-item-box csdn-tracking-statistics"]')
blogurl = ['https://blog.csdn.net/yuzipeng/article/details/'   url.get_attribute('data-articleid') for url in urls]
titles = driver.find_elements_by_xpath('//div[@class="article-item-box csdn-tracking-statistics"]/h4/a')
blogtitle = [title.text for title in titles]
myblog = {k:v for k,v in zip(blogtitle,blogurl)}
for k,v in myblog.items():
    print(k,v)
driver.close()

在python爬虫中有不少的方法可以解决乱码问题，小伙伴们跟selenium比比，到底哪个好用呢？更多Python学习推荐:JQ教程网Python大全。

您可能感兴趣的文章：
Python 爬虫学习系列教程
 selenium如何解决python爬虫乱码问题？
《Python2爬虫入门教程指南》（系列教程）
python数据采集是什么
 python selenium是什么
 python爬虫简历怎么写
 python爬虫乱码是文字方块如何解决？
如何使用python多线程有效爬取大量数据？
python写爬虫出现乱码怎么回事
 Python2爬虫入门之如何学习爬虫

上一篇：python中assert断言语句怎么用? 下一篇：python3 os.rename()二次调用出错的原因什么？

[关闭]

selenium如何解决python爬虫乱码问题？

最近更新

浏览排行