首页 热点资讯 义务教育 高等教育 出国留学 考研考公

python爬虫怎么获取到的网站的所有url

发布网友 发布时间:2022-04-24 18:27

我来回答

1个回答

热心网友 时间:2022-04-18 09:49

首先我们可以先获取要下载图片的整个页面信息。
getjpg.py
#coding=utf-8
import
urllib
def
getHtml(url):
page
=
urllib.urlopen(url)
html
=
page.read()
return
html
print
html
  Urllib
模块提供了读取web页面数据的接口,我们可以像读取本地文件一样读取www和ftp上的数据。首先,我们定义了一个getHtml()函数:
  urllib.urlopen()方法用于打开一个URL地址。
  read()方法用于读取URL上的数据,向getHtml()函数传递一个网址,并把整个页面下载下来。执行程序就会把整个网页打印输出。

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com