def getImg(html):
reg = r'[^<]*[^u]*[^r]*[^l]*[^>]* '
imgae = re.compile(reg) #comile拼写错了
imglist = re.findall(imgae, str(html))
return imglist
#正则也需要修改下,如下:
import re, urllib
def sfinds(start_str, end, html):
start = html.find(start_str)
if start >= 0:
start += len(start_str)
end = html.find(end, start)
if end >= 0:
return html[start:end].strip()
def getHtml(url):
p = urllib.urlopen(url)
html = p.read()
return html
def getImg(html):
reg = r'imgae = re.compile(reg)
imglist = re.findall(imgae, str(html))
return imglist
print getImg(getHtml('http://image.baidu.com/'))
如果解决了您的问题请采纳!
如果未解决请继续追问
def getImg(html):
reg=r'
imgae=re.comile(reg)
imglist=image.findall(html.decode('utf-8')) #image是re对象,怎么当字符串用
return imglist
第二处错误
f start>=0:
start+=len(start_str)
end=html.find(end,start) # end,start都 是数字,find是用来查找字符串的,第二个参数怎么能是数字