创新路
我们一直在努力

python 爬虫之数据格式化

今天对上次的Beautiful Soup抓取到的数据进行格式化数据:

需要用到for …in  遍历函数和 get()方法

实例:

image.png

输出:

image.png

遍历函数:for …in 可以遍历 字符串、列表,元组,字典,循环输出提取信息

1584516527127442.png

使用get()方法:查找指定的值,书写格式:str.get('元素')

抓取链接:item.get('href') 获取href=的值

抓取标题:item.get('title') 获取title=的值

抓取标题还可以使用另一个函数item.get_text() 抓取文本类容,不抓取html标签元素

客官点个赞呗! (0)
分享到:

评论 抢沙发

评论前必须登录!

天府云博 - 做有态度的开发&运维&设计学习分享平台!

联系我们百度云主机