您的位置: 首页 > 软件教程 > python > python编写爬虫小程序的方法

python编写爬虫小程序的方法

6.0分
出处:网络 时间:2018-02-26

您可能感兴趣的话题: python  

核心提示: 我们可以通过python 来实现这样一个简单的爬虫功能,把我们想要的代码爬取到本地。下面就看看如何使用python来实现这样一个功能。

  我们可以通过python 来实现这样一个简单的爬虫功能,把我们想要的代码爬取到本地。下面就看

python编写爬虫小程序的方法

  看如何使用python来实现这样一个功能。

  起因  深夜忽然想下载一点电子书来扩充一下kindle,就想起来python学得太浅,什么“装饰器”啊、“多线程”啊都没有学到。  想到廖雪峰大神的python教程很经典、很著名。就想找找有木有pdf版的下载,结果居然没找到!!CSDN有个不完整的还骗走了我一个积分!!尼玛!!  怒了,准备写个程序直接去爬廖雪峰的教程,然后再html转成电子书。  过程  过程很有趣呢,用浅薄的python知识,写python程序,去爬python教程,来学习python。想想有点小激动……  果然python很是方便,50行左右就OK了。直接贴代码:  ?

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

# coding:utf-8

import urllib

domain = 'http://www.liaoxuefeng.com' #廖雪峰的域名

path = r'C:Userscyhhao2013Desktoptemp' #html要保存的路径

# 一个html的头文件

input = open(r'C:Userscyhhao2013Desktop.html', 'r')

head = input.read()

# 打开python教程主界面

f = urllib.urlopen("http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000")

home = f.read()

f.close()

网友评论
精品软件课程
更多 >
C++是一种静态数据类型检查的,支持多重编程... [详细]
Java,是由Sun Microsystem... [详细]
C语言是一种面向过程的计算机程序设计语言。多... [详细]
Visual Basic是一种由微软公司开发... [详细]
Oracle Database,又名Orac... [详细]
Visual Basic.NET是从 Vis... [详细]