用户工具

站点工具


python-hacks:re-find

得到正则表达式中特定单元内容

下面的例子是用Python得到网页的标题

代码

import urllib
import re
f = urllib.urlopen("http://www.google.com/")
raw_html = f.read()
patt = """<title>([^<]*)</title>"""
all = re.findall(patt, raw_html, re.IGNORECASE)
title = "".join(all)
print title

技巧

使用 join 方法可以将得到的列表转为字符串

python-hacks/re-find.txt · 最后更改: 2010/06/02 01:18 (外部编辑)