Python模块BeautifulSoup提取锚点href

前端之家收集整理的这篇文章主要介绍了Python模块BeautifulSoup提取锚点href前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

我正在使用BeautifulSoup模块以这种方式从html中选择所有href:

def extract_links(html):
  soup = BeautifulSoup(html)
  anchors = soup.findAll('a')
  print anchors
  links = []
  for a in anchors:
    links.append(a['href'])
  return links

但有时它失败了这个错误信息:

Traceback (most recent call last):
File "C:\py\main.py",line 33,in 
最佳答案
并非所有锚标签都具有href属性.在尝试访问该属性之前,应检查锚是否具有href.

if a.has_key('href')
  links.append(a['href'])

在这里查看了一些评论后,我认为这是处理这种情况的最pythonic方式.

原文链接:https://www.f2er.com/html/426385.html

猜你在找的HTML相关文章