WxProbe,一款自研的公众号敏感信息收集工具

admin 2026-05-16 06:21:29 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: WxProbe是一款自研的微信公众号敏感信息收集工具,通过Token登录微信公众平台实现公众号文章批量抓取,结合正则表达式和DeepSeekAI双引擎智能识别手机号、身份证、邮箱等敏感信息及企业工商数据。工具提供公众号情报采集、搜狗搜索和URL抓取三种模式,包含图形化操作界面和导出功能,作者强调仅限于合法学习使用并需自行承担法律责任。 综合评分: 78 文章分类: 安全工具,爬虫,数据安全,WEB安全,解决方案


cover_image

WxProbe,一款自研的公众号敏感信息收集工具

泷羽Sec-Norsea

2026年5月14日 09:55 浙江

在小说阅读器读本章

去阅读

以下文章来源于泷羽Sec ,作者仙草里没有草噜丶

泷羽Sec .

B站:泷羽Sec,团队专注于网络安全领域的内容创作与分享,为网络安全而战。来自一个从零开始学习网安的见习生。很菜,不喜勿喷。

此工具的灵感主要是源于一次北京红队金融项目,在公众号这块的信息收集实验比较少,要手动一个一个公众号去翻,特意写的一个工具

这个工具主要用于敏感信息收集工具,专注于微信公众号文章批量获取与 AI 智能分析。

通过 Token 登录微信公众平台,批量抓取指定公众号发布的历史文章,利用 DeepSeek AI 识别手机号、身份证、邮箱、车牌号、密码等等敏感信息。以及公司关联信息,公司注册资金、统一信用代码,法定代表人,股东结构等等信息(AI生成的结果,仅供参考)

白小羽

注:此工具仅限于学习使用,请勿用于非法用途,若造成不良后果,与工具开发者以及泷羽Sec安全团队无关,请自行承担相应的法律责任,此工具禁止逆向源码,一旦发现,后果自负,若需要源码二开,可以自行联系工具作者一次性买断(白菜价)。

技术架构

WxProbe
├── WeChatLogin          # Token + Cookie 登录管理
├── ArticleFetcher       # 文章列表获取 + 正文抓取
│   ├── scrapling        # headless 隐身模式(反爬)
│   └── requests         # 保底方案
├── SensitiveInfoAnalyzer
│   ├── _regex_scan      # 正则快速扫描(手机号/身份证/邮箱/IP等)
│   └── analyze_single   # DeepSeek AI 深度分析
├── WechatSogouAPI       # 搜狗微信搜索(可选)
└── ShadowEyeApp (UI)
    ├── 公众号情报 Tab
    ├── 搜狗搜索 Tab
    ├── URL 抓取 Tab
    └── 设置 / 导出

| 模块 | 功能 | | — | — | | 🔐 公众号情报 | Token 一键登录 → 搜索公众号 → 多页爬取文章 → AI 分析 → 导出报告 | | 🔎 搜狗搜索 | 无需登录,直接搜索微信文章 → 一键抓取 → AI 分析敏感信息 | | 📎 URL 抓取 | 粘贴微信文章链接(单条/批量),抓取正文并用 AI 分析 | | 🤖 AI 分析 | DeepSeek + 正则双引擎:手机号、身份证、邮箱、IP、银行卡、密钥等 |

使用教程

打开微信公众平台扫码登录

image-20260509143934747

登录后复制token

image-20260509182545104

复制cookie

image-20260509180735598

复制到这上面来

image-20260509182431402

输入之后就能登录成功

image-20260509182617642

尝试搜索公众号

image-20260509182646331

默认是五页选择自己要爬取的公众号后点击爬取

image-20260509182719211

刚开始是没有敏感信息的,需要手动点击是否进行AI分析,这里使用的AI是deepseek

image-20260509182835739

需要在系统设置,设置自己的apikey和模型名称

image-20260513172540921

AI分析完成后,可以在敏感信息中看到常见的手机号、身份证号、姓名、邮箱、地址、IP地址、银行卡号、网站链接/域名、密码/密钥/Token、组织机构代码、车牌号、QQ/微信号、其他PII等等,对于公司信息会调出企业工商信息,比如(注册资金,实缴资本、统一社会信用代码、注册时间等等工商信息,以及公司结构)这对于公众号这块的信息来讲是非常的有用的

image-20260513194050156

中国债卷尝试

image-20260513194139812

image-20260513194315066

若您对结果不满意,可以导出功能,自行对数据进行分析

image-20260509183800370

2、信息收集部分,本工具已绕过搜狗基础反爬功能,您可以通过搜狗搜索引擎,搜索到微信公众号相关文章,利用AI进行敏感信息分析,和前面一样比如邮箱、手机号等等信息,为了稳定请不要频繁点击某一个功能,耐心等待工具执行(若数据量较大可能要等待10分钟、一小时),在此期间可以双击某一个文章查看文章详情

白小羽

注意:对于搜狗搜索引擎,单个文章建议请抓取一次即可,不要重复抓取,否则极易促发反爬。

image-20260511215052744

image-20260513152316128

3、若您已经拥有了一定数量的公众号相关的URL,则可以使用URL抓取功能

image-20260513152525644

例如

https://mp.weixin.qq.com/s/caVRY62bhNZm5Ri81oqUwg

https://mp.weixin.qq.com/s/hcB1m6tmDFfx9PA7rNzOZA

白小羽

注意:对于某号文章爬取,可全面绕过,稳定爬取,无需担心被拦截,但需要确保你已成功登录

image-20260513154540630

image-20260513155756422

工具获取方式,扫描下方二维码加入freebuf知识大陆即可获取,券后仅需79

此时加入,可获取香港免备案服务器一个月使用权(配置:4核心 4GB 硬盘:40G  带宽:10Mbps 峰值 流量:无流量限制),限时到2026年6月1日之前,之后不再赠送

白小羽

注:服务器使用需要实名,介意的话可以忽略赠品

常见问题

Q: 搜狗搜索提示验证码拦截? 先执行一次搜索(让系统建立 session),搜索成功后 session 会缓存,后续抓取会复用该 session。

Q: URL 抓取按钮一直”分析中”? 需要先在「公众号情报」tab 完成登录。如果已登录仍卡住,可能是网络问题,2 分钟超时后会自动恢复。

Q: 分析结果为空或”未获取到正文”? scrapling 可能被反爬。程序会自动降级到 requests + BeautifulSoup 保底方案。如仍失败,检查文章链接是否有效。

github地址:https://github.com/baibaixiaoyu2024/WxProbe/

原文地址:https://longyusec.com/longyushoulu/1181/


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:泷羽Sec-Norsea 《WxProbe,一款自研的公众号敏感信息收集工具》

评论:0   参与:  0