网站/小程序/APP个性化定制开发,二开,改版等服务,加扣:8582-36016

最近在写一个爬虫程序,但是却出现了错误提示IndexError: list index out of range,所以下面这篇文章主要给大家介绍了关于Python常见错误:IndexError: list index out of range的解决方法,需要的朋友可以参考下

报错代码

粉丝群里面的一个小伙伴想用requests爬虫,然后遍历Xpath定位的数据列表的时候,发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下:

import requests
from lxml import etree
 
text = requests.get("https://www.baidu.com").content.decode()
 
html = etree.HTML(text)
 
div_divst = html.xpath("//div")
for div in div_divst:
    title = div.xpath("@title")[0]
    url = div.xpath("@url")[0]

报错信息如下:

IndexError: list index out of range


报错翻译

报错信息翻译:

索引错误:列表索引超出范围

报错原因

list index out of range错误出现的原因主要有两个:

  • 一个可能是下标超出范围

  • 一个可能是list是空的,没有一个元素

粉丝的爬虫代码中明显是因为Xpath没有定位到数据,所以list为空,list[0]就会报错。小伙伴们按下面的方法解决即可!!!

解决方法

用异常捕获Xpath定位,当报错的时候捕获异常并把title和url赋值为None:

import requests
from lxml import etree
 text = requests.get("https://www.baidu.com").content.decode()
 html = etree.HTML(text)
 div_divst = html.xpath("//div")
for div in div_divst:
    try:
        title = div.xpath("@title")[0]
        url = div.xpath("@url")[0]
    except:
        title = None
        url = None

帮忙解决


评论 0

暂无评论
0
0
0
立即
投稿
发表
评论
返回
顶部