关于微博的内容爬取
距离上次更新已经过了 355 天,文中部分内容可能已经过时,如有疑问,请在下方留言。
1. 接口鉴权
微博的内容大部分接口是需要鉴权的,主要是针对cookies
中的SUBP
但是移动端的接口可以匿名访问,不做鉴权限制,但是数据返回的可能不全,但在不要求数据精度的情况下,不失为一个好的选择;
以下分享几个接口
2. 免鉴权的接口
1. 获取用户的微博_无 since_id 参数(一般作为入口)
2. 获取用户的微博_有 since_id 参数(作为连续爬取)
3. 根据关键词搜用户
4. 获取用户信息(此接口会返回 containerid ,这个参数是获取微博的关键)
版权声明:
本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自
有限进步!
喜欢就支持一下吧
打赏
微信
支付宝