目录

得到正则表达式中特定单元内容

下面的例子是用Python得到网页的标题

代码

import urllib
import re
f = urllib.urlopen("http://www.google.com/")
raw_html = f.read()
patt = """<title>([^<]*)</title>"""
all = re.findall(patt, raw_html, re.IGNORECASE)
title = "".join(all)
print title

技巧

使用 join 方法可以将得到的列表转为字符串