网络爬虫及应用实验报告

本文由用户“Lnny丶玲”分享发布更新时间：2021-08-04 19:29:49 举报文档

以下为《网络爬虫及应用实验报告》的无排版文字预览，完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的，下载的文档就是什么样的。

XX***实验报告

课程名称：python程序设计院（系）：计*** 专业/年级：软件工程2018级

姓名：吴某某学号： ***89

实验八——网络爬虫及应用

实验目的

（1）熟悉常见HTML标签的用法。

（2）理解网页源代码的结构。

（3）掌握requests库的使用。

（4）掌握BeautifulSoup库的使用

实验内容

在认真阅读教材及实验指导书的基础上，完成以下实验内容。

1.编程实现下述功能。

文件ngchina.html保持了网页源代码，请将该页面中图片的URL提取出来,并输出所有图像的URL。

将正确的程序保存于文件ex8.p 内容过长，仅展示头部和尾部部分文字预览，全文请查看图片预览。

def showResults(urls):

count =1

for url in urls:

print("第{:2}个URL:{}".format(count,url))

count +=1

def main():

inputfile="ngchina.html"

htmllines=getHTMLlines(inputfile)

imageUrls=extractImageUrls(htmllines)

showResults(imageUrls)

main()

简述本次实验过程中出现的问题、解决方法、结果如何。

四、实验总结。

[文章尾部最后300字内容到此结束,中间部分内容请查看底下的图片预览]

以上为《网络爬虫及应用实验报告》的无排版文字预览，完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的，下载的文档就是什么样的。

图片预览