微信公众号文章下载工具
https://github.com/xiaoguyu/wechatDownload
项目介绍
技术栈
Electron + Typescript
原理
获取微信公号文章列表,需要 3 个特殊参数:
- _biz:公众号的 id
- uin:微信用户的 ID
功能
设置中心有啥就支持啥
- 支持选择下载范围
- 将网页抓换成HTML、Markdown、PDF
- 将网页源码保存至Mysql(下载来源是网络才有效)
- 下载图片、音频到本地
- 添加原文链接、元数据(作者、时间、公号名)
- 跳过现有文章
- 下载评论
- 下载来源(此选项只影响批量下载):
- 网络:就是从微信接口获取文章
- 数据库:如果选择了保存至Mysql选项,数据库中会保存文章的网页源码,此时如果需要将源码转换成HTML、Markdown ,选择下载来源是数据库即可。(微信接口用得多会被限制)
- key:不知道是啥
这 3 个参数通过 http 代理获取,剩下的就是普通爬虫的做法了