频道导航

练练正则

2020-06-20 正则表达式前端之家

前端之家收集整理的这篇文章主要介绍了练练正则，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

#!user/bin/python
# coding: utf-8
from bs4 import BeautifulSoup
import urllib
import re


def get_html(url):

    req = urllib.urlopen(url).read()
    return req

def handle_html(html):

    reg1 = re.compile(r'<span class="atc_title">.*?</span>',re.S)
    reg2 = re.compile(r'<span class="atc_title">\s*<a title=".*" target="_blank" href="(?P<link>.*)">(?P<title>.*)</a></span>')
    list1 = re.findall(reg1,html)
    list2 = []
    for title in list1:
        n = re.search(reg2,title)
        print n.group('title') + '\t' + n.group('link')
        list2.append(n.group('link'))
    return list2



def load_html(result):

    count = 0
    for link in result:
        count += 1
        urllib.urlretrieve(link,'D:\Documents\%s.html' % count)



if __name__ == '__main__':

    url = 'http://blog.sina.com.cn/s/articlelist_1191258123_0_1.html'
    html = get_html(url)
    result = handle_html(html)
    load_html(result)

上一篇：华为机试题----找一句话中最长的单下一篇：三个例子理解正则匹配里面的最小匹

猜你在找的正则表达式相关文章

常用正则表达式-手机号、身份证、邮箱

一、校验数字的表达式 1 数字：^[0-9]*$ 2 n位的数字：^d{n}$ 3 至少n位的数字：^d{n,}$ 4...

作者：前端之家时间：2021-01-10

JS正则表达式详解

正则表达式非常有用，查找、匹配、处理字符串、替换和转换字符串，输入输出等。下面整理一...

作者：前端之家时间：2020-12-29

组内正则培训记录

0. 注：不同语言中的正则表达式实现都会有一些不同。下文中的代码示例除特别说明的外，都...

作者：前端之家时间：2020-12-20

高级正则表达式技术（Python版）

正则表达式是从信息中搜索特定的模式的一把瑞士军刀。它们是一个巨大的工具库，其中的...

作者：前端之家时间：2020-07-22

史上最全最常用的正则表达式

一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,...

作者：前端之家时间：2020-07-22

正则表达式工具

作者：前端之家时间：2020-07-22

正则表达式初步

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

　　正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编...

作者：前端之家时间：2020-07-22

分享5个可视化的正则表达式编辑工具

正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器...

作者：前端之家时间：2020-07-22

[知识积累]--正则表达式记忆表

在工作中常常遇到正则表达式问题，有时候又会忘记这则的语法。下面就分享一份正则表达式记...

作者：前端之家时间：2020-07-22

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章