注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

时间记录器

记录我的Linux、Android学习之路

 
 
 

日志

 
 

python 抓取网页中的图片  

2011-10-10 22:32:58|  分类: Linux |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

#/usr/bin/python
# -*- coding: utf-8 -*-
import HTMLParser
import urllib
import sys
import urllib2, htmllib, formatter

urlString = "http://www.winddesktop.com"
def getImage(addr):
 u = urllib.urlopen(addr)
 data = u.read()
 splitPath = addr.split('/')
 fName = splitPath.pop()
 print "Saving %s" % fName
 f = open(fName, 'wb')
 f.write(data)
 f.close()

class parseImages(HTMLParser.HTMLParser):
 def handle_starttag(self, tag, attrs):
  if tag == 'img':
   for name,value in attrs:
    if name == 'src':
     getImage(urlString + "/" + value)

lParser = parseImages()
u = urllib.urlopen(urlString)
print "Opening URL\n===================="
print u.info()
lParser.feed(u.read())
lParser.close()

  评论这张
 
阅读(495)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017