BeautifulSoup报"AttributeError: 'NoneType' object has no attribute 'attrs' "异常的原因以及解决办法

问题概述：

当使用BeautifulSoup解析HTML时，可能会遇到报错：”AttributeError: ‘NoneType’ object has no attribute ‘attrs'”。这个问题的根本原因是BeautifulSoup解析时无法找到匹配的HTML标签，导致返回的结果为None。代码中对None值使用了attrs方法，这个方法只能用于HTML标签，而None值根本没有任何标签，因此会产生”AttributeError”。

解决办法：

由于该报错的原因是beautifulsoup没有找到对应的HTML标签，解决此问题需要确定以下几个方面：

1.是否存在需要找的标签，可以打印一下BeautifulSoup解析出来的HTML文件，确定要寻找的标签是否存在；

2.需要寻找的标签是否被正确命名，可以检查命名是否正确；

3.是否需要等待HTML文件完全加载完毕后再解析，可以使用Selenium等工具等待浏览器加载完整的HTML文件后再进行解析。

解决步骤

以下是一些可能的解决步骤，需要根据实际情况调整。

1.确定要寻找的标签是否存在

在BeautifulSoup中，可以使用find_all()方法来定位特定的标签。如果这个方法返回的结果为None，则说明该标签不存在。可以通过以下语句打印出BeautifulSoup解析后的HTML文件：

print(soup.prettify())

这个语句会对BeautifulSoup对象调用prettify()方法，将解析后的HTML文件格式化输出。通过输出可以找到需要寻找的标签是否存在。

2.检查标签的命名是否正确

如果要寻找的标签确实存在，但是在解析时仍然出现了”AttributeError”错误，可能是由于该标签被错误地命名。在HTML文件中，标签的大小写是重要的，因此如果标签的大小写与代码中不一致，也可能会导致该错误。

在解析时，可以用类似以下的方式查找标签：

soup.find_all('a')

如果标签的名称被错误地命名成了其他形式，例如”A”或者”a1″，则此语句将无法定位到标签。

3.等待HTML文件完全加载

在使用BeautifulSoup解析HTML文件时，有时需要等到文件完全加载后再进行解析。如果HTML文件没有完全加载，部分标签可能无法找到，导致该错误。可以使用Selenium等工具等待浏览器加载完整的HTML文件后再进行解析，例如：

from selenium import webdriver
from bs4 import BeautifulSoup
from selenium.webdriver.support.ui import WebDriverWait

driver = webdriver.Chrome()
driver.get(url)
wait = WebDriverWait(driver, 10)
html = wait.until(lambda driver: driver.find_element_by_tag_name('html'))
soup = BeautifulSoup(html.get_attribute('innerHTML'), 'html.parser')

这段代码会使用Selenium打开Chrome浏览器，等待10秒钟，直到HTML文件加载完毕。然后从浏览器中获取HTML文件，并且使用BeautifulSoup进行解析。

参考文献：

Beautiful Soup Documentation: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

你可能也喜欢

BeautifulSoup报”TypeError: argument of type ‘NoneType’ is not iterable “异常的原因以及解决办法

BeautifulSoup报”UnicodeEncodeError: ‘ascii’ codec can’t encode character “异常的原因以及解决办法

BeautifulSoup报”AttributeError: ‘NoneType’ object has no attribute ‘get’ “异常的原因以及解决办法