您好,欢迎访问我的个人博客!
×
温馨提示:有需求可以先尝试站内搜索,当然也可以给我留言喔(^_^)!
欢迎光临
感谢一路有你

py 爬取汽车之家新闻案例

如果你对该文章中的内容有疑问/不解,可以点击此处链接提问
要注明问题和此文章链接地址 点击此处跳转
 

<code class="">import requests
from bs4 import BeautifulSoup

response = requests.get(&quot;https://www.autohome.com.cn/news/&quot;)

# 1. content /text  的区别
# print(response.content)  # content 拿到的字节
response.encoding = 'gbk'
# print(response.text)  # text 拿到的文本信息


soup  = BeautifulSoup(response.text,'html.parser')

# tag = soup.find(id='auto-channel-lazyload-article')  # 找唯一的值,缩小范围
# h3 = tag.find(name='h3',class_ ='')  # class是关键词所以要加下划线, 或者使用下面的方式
# h3 = tag.find(name='h3',attrs= {'class':''})  #
# print(h3)

# 链式写法
li_list = soup.find(id='auto-channel-lazyload-article').find_all(name='li')

for li in li_list:
    title = li.find('h3') #获取标题
    if not title:# 如果为null,跳出
        continue
    title = title.text
    summary = li.find(&quot;p&quot;).text
    url = li.find(&quot;a&quot;).get('href')
    img = li.find(&quot;img&quot;).get('src')
    print(img)

    # 保存图片
    res = requests.get(img)
    file_name = &quot;%s.jpg&quot;%(title,)
    with open(file_name,'wb') as f:
        f.write(res.content) #保存字节内容

</code>
赞(0) 打赏
未经允许不得转载:王明昌博客 » py 爬取汽车之家新闻案例
分享到: 更多 (0)

相关推荐

  • 暂无文章

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

×
订阅图标按钮