WxProbe——公众号敏感信息收集工具

admin 2026-05-16 05:44:48 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: WxProbe是一款针对微信公众号的敏感信息收集工具,支持Token+Cookie登录公众平台批量爬取文章,或通过搜狗搜索无需登录获取文章。工具集成DeepSeekAI与正则双引擎自动识别手机号、身份证、邮箱、IP、银行卡等敏感数据,提供图形化操作界面和结果导出功能。作者强调工具仅限合法学习使用,需避免频繁操作触发反爬机制。 综合评分: 78 文章分类: 安全工具,WEB安全,红队,渗透测试,数据安全


cover_image

WxProbe —— 公众号敏感信息收集工具

泷羽Sec-陌离

2026年5月14日 15:04 宁夏

在小说阅读器读本章

去阅读

作者: 仙草里没有草噜丶白小羽 来源: 泷羽Sec 安全团队 原文: https://longyusec.com/longyushoulu/1181/ 原文链接: https://mp.weixin.qq.com/s/PmGYqI4rbRwbPGOWq7cCsw

工具获取方式: 关注公众号

一、工具简介

WxProbe 的灵感源于一次北京红队金融项目。在信息收集阶段,针对微信公众号的情报挖掘往往需要人工逐个翻阅,效率极低。为此,作者专门开发了这款工具。

核心定位: 微信公众号文章批量获取 + AI 智能敏感信息分析

主要功能

| 能力 | 说明 | | — | — | | 🔐 登录认证 | 通过 Token + Cookie 登录微信公众平台 | | 📦 批量抓取 | 获取指定公众号的历史文章列表及全文正文 | | 🤖 AI 分析 | 利用 DeepSeek AI + 正则双引擎识别敏感信息 | | 🔎 搜狗搜索 | 无需登录,通过搜狗引擎搜索公众号文章 | | 📎 URL 抓取 | 支持单条/批量粘贴文章链接后直接分析 | | 📤 结果导出 | 一键导出分析报告,支持二次数据处理 |


二、免责声明

⚠️ 本工具仅限学习交流使用,严禁用于任何非法用途。若因使用本工具造成不良后果,一切法律责任由使用者自行承担,与工具开发者及泷羽Sec安全团队无关。 本工具禁止逆向源码,违者后果自负。如需源码二次开发,可联系作者购买(白菜价一次性买断)。

—— 白小羽


三、技术架构

模块结构

WxProbe
├── WeChatLogin              # Token + Cookie 登录管理
├── ArticleFetcher           # 文章列表获取 + 正文抓取
│   ├── scrapling            # Headless 隐身模式(防反爬)
│   └── requests             # 降级保底方案
├── SensitiveInfoAnalyzer
│   ├── _regex_scan          # 正则快速扫描(手机号/身份证/邮箱/IP 等)
│   └── analyze_single       # DeepSeek AI 深度分析
├── WechatSogouAPI           # 搜狗微信搜索(可选模块)
└── ShadowEyeApp(UI)
    ├── 公众号情报 Tab
    ├── 搜狗搜索 Tab
    ├── URL 抓取 Tab
    └── 设置 / 导出

功能模块说明

| 模块 | 工作流程 | | — | — | | 🔐 公众号情报 | Token 登录 → 搜索公众号 → 多页爬取 → AI 分析 → 导出报告 | | 🔎 搜狗搜索 | 无需登录 → 搜索文章 → 一键抓取 → AI 分析敏感信息 | | 📎 URL 抓取 | 粘贴链接(单条/批量)→ 抓取正文 → AI 分析 | | 🤖 AI 分析 | DeepSeek + 正则双引擎,覆盖手机号、身份证、邮箱、IP、银行卡、密钥等 |


四、使用教程

Step 1:登录微信公众平台

  1. 访问微信公众平台,扫码完成登录
  2. 登录成功后,在浏览器中复制当前页面的 Token
  3. 同步复制当前会话的 Cookie

  1. 将 Token 和 Cookie 分别填入工具对应的输入框

  1. 点击”登录”,提示成功即可

💡 提示: Token 和 Cookie 均可在浏览器开发者工具(F12)→ Network 面板中找到。


Step 2:搜索并爬取公众号

  • 在工具搜索框中输入目标公众号名称
  • 默认爬取 5 页文章,可按需调整页数
  • 从搜索结果中选定目标公众号,点击”爬取”按钮


Step 3:配置 AI 分析

  • 初始状态下不会自动进行 AI 分析,需手动开启

  • 系统设置中填入:

  • DeepSeek API Key

  • 使用的模型名称(如 deepseek-chat

  • 配置完成后,返回主界面点击开启分析


Step 4:查看分析结果

AI 分析完成后,可在敏感信息栏中查看以下内容:

个人信息(PII)

| 类型 | 示例 | | — | — | | 手机号 | 138xxxx0001 | | 身份证号 | 110101xxxxxxxx1234 | | 邮箱地址 | [email protected] | | IP 地址 | 192.168.x.x | | 银行卡号 | 6222xxxx | | 密码/密钥/Token | secret_key_xxx | | 车牌号 | 京Axxxxx | | QQ / 微信号 | 12345678 | | 其他 PII | 姓名、地址、域名等 |

企业信息(工商)

| 类型 | 说明 | | — | — | | 统一社会信用代码 | 18 位企业识别码 | | 注册资金 / 实缴资本 | 资本规模信息 | | 法定代表人 / 股东结构 | 管理层信息(AI 生成,仅供参考) | | 注册时间 / 公司结构 | 基本工商信息 |


Step 5:导出结果

  • 对分析结果满意后,使用导出功能保存报告
  • 导出文件可用 Excel 或其他工具进行二次分析


五、搜狗搜索功能

本工具已绕过搜狗基础反爬机制,可直接通过搜狗引擎搜索微信公众号相关文章,无需登录即可进行敏感信息分析。

使用注意事项

  • 不要频繁点击,每次操作后耐心等待执行完成
  • 数据量较大时,等待时间可能为 10 分钟至 1 小时
  • 等待期间可双击某篇文章预览详情
  • 每篇文章只抓取一次,重复抓取极易触发反爬拦截


六、URL 抓取功能

如已掌握一批公众号文章的链接,可使用 URL 抓取功能批量处理。

支持的链接格式

https://mp.weixin.qq.com/s/caVRY62bhNZm5Ri81oqUwg
https://mp.weixin.qq.com/s/hcB1m6tmDFfx9PA7rNzOZA

✅ 针对已登录账号的文章爬取,可全面绕过限制,稳定抓取,无需担心被拦截。 ⚠️ 使用前请确保已在「公众号情报」Tab 完成登录。


七、工具获取

  • 获取方式: 扫描文中二维码,加入 FreeBuf 知识大陆 即可获取

  • 获取工具:

  • 限时赠品(2026年6月1日前): 香港免备案服务器一个月使用权

  • 配置:4 核 / 4GB 内存 / 40GB 硬盘 / 10Mbps 峰值带宽 / 无流量限制

  • 注:使用服务器需要实名,介意者可忽略此赠品


八、常见问题 FAQ

Q1:搜狗搜索提示验证码拦截?

解决方案: 先手动执行一次搜索,让系统建立 session 缓存。搜索成功后,后续抓取会自动复用该 session,无需重复验证。


Q2:URL 抓取按钮一直显示”分析中”?

原因 1: 未在「公众号情报」Tab 完成登录,请先完成登录。 原因 2: 网络问题导致请求卡住,程序会在 2 分钟后自动超时恢复。


Q3:分析结果为空或提示”未获取到正文”?

原因: scrapling(隐身模式)可能被目标站点反爬检测拦截。 处理逻辑: 程序会自动降级至 requests + BeautifulSoup 保底方案重试。 手动排查: 检查文章链接是否有效,或链接是否需要登录权限。


内容来源:泷羽Sec 安全团队


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:泷羽Sec-陌离 《WxProbe —— 公众号敏感信息收集工具》

评论:0   参与:  0