网络爬虫及应用实验报告

本文由用户“Lnny丶玲”分享发布 更新时间:2021-08-04 19:29:49 举报文档

以下为《网络爬虫及应用实验报告》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

XX***实验报告

课程名称:python程序设计 院(系):计*** 专业/年级: 软件工程2018级

姓名: 吴某某 学号: ***89

实验八——网络爬虫及应用

实验目的

(1)熟悉常见HTML标签的用法。

(2)理解网页源代码的结构。

(3)掌握requests库的使用。

(4)掌握BeautifulSoup库的使用

实验内容

在认真阅读教材及实验指导书的基础上,完成以下实验内容。

1.编程实现下述功能。

文件ngchina.html保持了网页源代码,请将该页面中图片的URL提取出来,并输出所有图像的URL。

将正确的程序保存于文件ex8.p 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。

def showResults(urls):

count =1

for url in urls:

print("第{:2}个URL:{}".format(count,url))

count +=1

def main():

inputfile="ngchina.html"

htmllines=getHTMLlines(inputfile)

imageUrls=extractImageUrls(htmllines)

showResults(imageUrls)

main()





简述本次实验过程中出现的问题、解决方法、结果如何。

四、实验总结。





[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]

以上为《网络爬虫及应用实验报告》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

图片预览