花了3天的下班时间写了个爬虫

爬取喜马拉雅的音频信息

Posted by dzt on December 6, 2018

爬取喜马拉雅网站上所有音频专辑的基本信息

简单分析了网页源码之后 就开始下手去做了

还是遇到不少难题,还好有很多人都做过类似爬虫,查阅相关资料,最终如愿完成

源码在我的github上 —> https://github.com/yanshigou/ximalaya

基本信息

  • 音频名字
  • 专辑名字
  • 图片地址
  • mp3地址
  • m4a地址
  • aac地址

爬取到信息后写入txt文件中和excel文件中