本周作业
Python网络爬虫进阶实战第十一周闯关作业
一、 本周作业:
- 完成一个完整的《豆瓣图书网信息爬取项目》,具体要求详见第23节。
- 使用Python编程语言编写一个网络爬虫项目,将豆瓣读书网站上的所有图书信息爬取下来,并存储到MySQL数据库中。
爬取信息字段要求:
[ID号、书名、作者、出版社、原作名、译者、出版年、页数、定价、装帧、丛书、ISBN、评分、评论人数]
二、 解题提示:
- 可参考上周Scrapy分布式爬取案例。
三、 批改标准:
1)项目代码(80分) 2)数据库信息(15分) 3)其他项:(5分)(文件结构清晰,代码整洁,要求适量的注释)