南开21春学期(1709-2103)《网络爬虫与信息提取》在线作业-答案1.doc

想预览更多内容,点击预览全文

申明敬告:

本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己完全接受本站规则且自行承担所有风险,本站不退款、不进行额外附加服务;如果您已付费下载过本站文档,您可以点击这里二次下载

文档介绍

[南开大学]21春学期(1709-2103)《网络爬虫与信息提取》在线作业试卷总分:100得分:100一、单选题(共20道试题,共40分)1.下列说法错误的是()A.小程序的请求极其简单,基本上没有验证信息B.用Python来请求小程序的后台接口从而获取数据,比请求异步加载网页的后台接口要复杂很多。C.如果目标网站有微信小程序,那么一定要优先调查能否通过小程序的接口来抓取数据。D.小程序的反爬虫能力比网页版的低很多。使用小程序的接口来爬数据,能极大提高爬虫的开发效率。[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B2.()是一个传递信息的通道。它负责将爬取博文列表页获取到的信息传递给负责爬取正文页的方法中。A.metaB.headC.headerD.body[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A3.启动MongoDB使用命令mongod--()usr/local/etc/mongod.confA.configB.installC.startD.begin[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A4.HTTP常用状态码表明服务器不允许访问那个资源的是()A.500B.503C.403D.405[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:C5.Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为()A.空B.空列表C.空元组D.不返回[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:B6.Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成A.列表B.元组C.字典D.集合[请认真分析题目,从上述选项中选择您认为正确的填写作答]正确选择:A7.在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作?()A.

最近下载