文章总结: WxProbe是一款针对微信公众号的敏感信息收集工具,支持Token+Cookie登录公众平台批量爬取文章,或通过搜狗搜索无需登录获取文章。工具集成DeepSeekAI与正则双引擎自动识别手机号、身份证、邮箱、IP、银行卡等敏感数据,提供图形化操作界面和结果导出功能。作者强调工具仅限合法学习使用,需避免频繁操作触发反爬机制。 综合评分: 78 文章分类: 安全工具,WEB安全,红队,渗透测试,数据安全
WxProbe —— 公众号敏感信息收集工具
泷羽Sec-陌离
2026年5月14日 15:04 宁夏
在小说阅读器读本章
去阅读
❝
作者: 仙草里没有草噜丶白小羽 来源: 泷羽Sec 安全团队 原文: https://longyusec.com/longyushoulu/1181/ 原文链接: https://mp.weixin.qq.com/s/PmGYqI4rbRwbPGOWq7cCsw
❝
工具获取方式: 关注公众号
一、工具简介
WxProbe 的灵感源于一次北京红队金融项目。在信息收集阶段,针对微信公众号的情报挖掘往往需要人工逐个翻阅,效率极低。为此,作者专门开发了这款工具。
核心定位: 微信公众号文章批量获取 + AI 智能敏感信息分析
主要功能
| 能力 | 说明 | | — | — | | 🔐 登录认证 | 通过 Token + Cookie 登录微信公众平台 | | 📦 批量抓取 | 获取指定公众号的历史文章列表及全文正文 | | 🤖 AI 分析 | 利用 DeepSeek AI + 正则双引擎识别敏感信息 | | 🔎 搜狗搜索 | 无需登录,通过搜狗引擎搜索公众号文章 | | 📎 URL 抓取 | 支持单条/批量粘贴文章链接后直接分析 | | 📤 结果导出 | 一键导出分析报告,支持二次数据处理 |
二、免责声明
❝
⚠️ 本工具仅限学习交流使用,严禁用于任何非法用途。若因使用本工具造成不良后果,一切法律责任由使用者自行承担,与工具开发者及泷羽Sec安全团队无关。 本工具禁止逆向源码,违者后果自负。如需源码二次开发,可联系作者购买(白菜价一次性买断)。
—— 白小羽
三、技术架构
模块结构
WxProbe
├── WeChatLogin # Token + Cookie 登录管理
├── ArticleFetcher # 文章列表获取 + 正文抓取
│ ├── scrapling # Headless 隐身模式(防反爬)
│ └── requests # 降级保底方案
├── SensitiveInfoAnalyzer
│ ├── _regex_scan # 正则快速扫描(手机号/身份证/邮箱/IP 等)
│ └── analyze_single # DeepSeek AI 深度分析
├── WechatSogouAPI # 搜狗微信搜索(可选模块)
└── ShadowEyeApp(UI)
├── 公众号情报 Tab
├── 搜狗搜索 Tab
├── URL 抓取 Tab
└── 设置 / 导出
功能模块说明
| 模块 | 工作流程 | | — | — | | 🔐 公众号情报 | Token 登录 → 搜索公众号 → 多页爬取 → AI 分析 → 导出报告 | | 🔎 搜狗搜索 | 无需登录 → 搜索文章 → 一键抓取 → AI 分析敏感信息 | | 📎 URL 抓取 | 粘贴链接(单条/批量)→ 抓取正文 → AI 分析 | | 🤖 AI 分析 | DeepSeek + 正则双引擎,覆盖手机号、身份证、邮箱、IP、银行卡、密钥等 |
四、使用教程
Step 1:登录微信公众平台
- 访问微信公众平台,扫码完成登录
- 登录成功后,在浏览器中复制当前页面的 Token
- 同步复制当前会话的 Cookie
- 将 Token 和 Cookie 分别填入工具对应的输入框
- 点击”登录”,提示成功即可
❝
💡 提示: Token 和 Cookie 均可在浏览器开发者工具(F12)→ Network 面板中找到。
Step 2:搜索并爬取公众号
- 在工具搜索框中输入目标公众号名称
- 默认爬取 5 页文章,可按需调整页数
- 从搜索结果中选定目标公众号,点击”爬取”按钮
Step 3:配置 AI 分析
-
初始状态下不会自动进行 AI 分析,需手动开启
-
在系统设置中填入:
-
DeepSeek API Key
-
使用的模型名称(如
deepseek-chat) -
配置完成后,返回主界面点击开启分析
Step 4:查看分析结果
AI 分析完成后,可在敏感信息栏中查看以下内容:
个人信息(PII)
| 类型 | 示例 |
| — | — |
| 手机号 | 138xxxx0001 |
| 身份证号 | 110101xxxxxxxx1234 |
| 邮箱地址 | [email protected] |
| IP 地址 | 192.168.x.x |
| 银行卡号 | 6222xxxx |
| 密码/密钥/Token | secret_key_xxx |
| 车牌号 | 京Axxxxx |
| QQ / 微信号 | 12345678 |
| 其他 PII | 姓名、地址、域名等 |
企业信息(工商)
| 类型 | 说明 | | — | — | | 统一社会信用代码 | 18 位企业识别码 | | 注册资金 / 实缴资本 | 资本规模信息 | | 法定代表人 / 股东结构 | 管理层信息(AI 生成,仅供参考) | | 注册时间 / 公司结构 | 基本工商信息 |
Step 5:导出结果
- 对分析结果满意后,使用导出功能保存报告
- 导出文件可用 Excel 或其他工具进行二次分析
五、搜狗搜索功能
❝
本工具已绕过搜狗基础反爬机制,可直接通过搜狗引擎搜索微信公众号相关文章,无需登录即可进行敏感信息分析。
使用注意事项
- 请不要频繁点击,每次操作后耐心等待执行完成
- 数据量较大时,等待时间可能为 10 分钟至 1 小时
- 等待期间可双击某篇文章预览详情
- 每篇文章只抓取一次,重复抓取极易触发反爬拦截
六、URL 抓取功能
如已掌握一批公众号文章的链接,可使用 URL 抓取功能批量处理。
支持的链接格式
https://mp.weixin.qq.com/s/caVRY62bhNZm5Ri81oqUwg
https://mp.weixin.qq.com/s/hcB1m6tmDFfx9PA7rNzOZA
❝
✅ 针对已登录账号的文章爬取,可全面绕过限制,稳定抓取,无需担心被拦截。 ⚠️ 使用前请确保已在「公众号情报」Tab 完成登录。
七、工具获取
- 获取方式: 扫描文中二维码,加入 FreeBuf 知识大陆 即可获取
-
获取工具:
-
限时赠品(2026年6月1日前): 香港免备案服务器一个月使用权
-
配置:4 核 / 4GB 内存 / 40GB 硬盘 / 10Mbps 峰值带宽 / 无流量限制
-
注:使用服务器需要实名,介意者可忽略此赠品
八、常见问题 FAQ
Q1:搜狗搜索提示验证码拦截?
❝
解决方案: 先手动执行一次搜索,让系统建立 session 缓存。搜索成功后,后续抓取会自动复用该 session,无需重复验证。
Q2:URL 抓取按钮一直显示”分析中”?
❝
原因 1: 未在「公众号情报」Tab 完成登录,请先完成登录。 原因 2: 网络问题导致请求卡住,程序会在 2 分钟后自动超时恢复。
Q3:分析结果为空或提示”未获取到正文”?
❝
原因: scrapling(隐身模式)可能被目标站点反爬检测拦截。 处理逻辑: 程序会自动降级至
requests + BeautifulSoup保底方案重试。 手动排查: 检查文章链接是否有效,或链接是否需要登录权限。
内容来源:泷羽Sec 安全团队
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:泷羽Sec-陌离 《WxProbe —— 公众号敏感信息收集工具》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。







评论