AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

python 采集小程序

时间：2023-01-15分类：CentOS作者：编程之家

# coding=utf8
#LINUXQQ for crawler data v0.1
import os
import re
import urllib

videourl = ‘http://www.centoscn.com/’
rootdir = ‘D:\\video\\’

def progress(blocknum,blocksize,totalsize):
per = 100.0 * blocknum * blocksize / totalsize
if per > 100:
per = 100
print “%.2f%%”% per

def contact(link,directory):
newlink = link.replace(‘&’,'&’)
newhtml = urllib.urlopen(str(videourl + newlink))
newdata = re.compile(‘ req = re.search(newdata,newhtml.read())
if req:
os.mkdir(rootdir + directory )
download = req.group(1).replace('html','swf')
if urllib.urlretrieve(download,rootdir + directory + '\\study.swf',progress):
print directory + 'download ok'
else:
print directory + 'download failure'

def crawler(url):
html = urllib.urlopen('http://www.51zxw.net/list.aspx?cid=359')
data = re.compile(r' ]*?>(.*?)‘,re.S|re.U)
req = re.findall(data,html.read())
for i in req:
contact(i[0],i[1])\s.*?>

if __name__==’__main__’:
i = 8
p = 1
while p <= i:
url = ‘http://www.51zxw.net/list.aspx?page=%d&cid=359′ % (p)
p += 1
crawler(url)

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

Centos下搭建性能监控Spotlight

Centos下搭建性能监控Spotlight

作者：编程之家时间：2023-02-09

CentOS 6.3下Strongswan搭建IPSec VPN

CentOS 6.3下Strongswan搭建IPSec VPN

作者：编程之家时间：2023-02-09

在CentOS6.5上安装Skype与QQ

在CentOS6.5上安装Skype与QQ

作者：编程之家时间：2023-02-09

阿里云基于centos6.5主机VPN配置

阿里云基于centos6.5主机VPN配置

作者：编程之家时间：2023-02-09

CentOS 6.3下配置multipah

CentOS 6.3下配置multipah

作者：编程之家时间：2023-02-09

CentOS安装、配置APR和tomcat-native

CentOS安装、配置APR和tomcat-native

作者：编程之家时间：2023-02-09

centos6.5下postgres-XC集群安装与配置

centos6.5下postgres-XC集群安装与配置

作者：编程之家时间：2023-02-09

CentOS 6使用openssl搭建根CA

CentOS 6使用openssl搭建根CA

作者：编程之家时间：2023-02-09

CentOS6.6中安装VNC server

CentOS6.6中安装VNC server

作者：编程之家时间：2023-02-09

CentOS下更新Python最新版本

CentOS下更新Python最新版本

作者：编程之家时间：2023-02-09