本周作业

Python网络爬虫进阶实战第十一周闯关作业

一、 本周作业:

  • 完成一个完整的《豆瓣图书网信息爬取项目》,具体要求详见第23节。
  • 使用Python编程语言编写一个网络爬虫项目,将豆瓣读书网站上的所有图书信息爬取下来,并存储到MySQL数据库中。
  • 爬取信息字段要求:
    [ID号、书名、作者、出版社、原作名、译者、出版年、页数、定价、装帧、丛书、ISBN、评分、评论人数]

二、 解题提示:

  • 可参考上周Scrapy分布式爬取案例。

三、 批改标准:

1)项目代码(80分) 2)数据库信息(15分) 3)其他项:(5分)(文件结构清晰,代码整洁,要求适量的注释)

results matching ""

    No results matching ""