【技巧】这份3148页、约261万字的美国最新制裁名单该如何用AI处理?

admin 2026-01-23 10:57:15 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 文档分享利用AI处理美国OFAC巨额制裁名单的方法,针对文件过大限制,采用PDF拆分技术将其分割为15个小文件,并借助KimiAI逐个分析提取涉华实体信息,最终汇总去重名单,为海量情报数据分析提供了解决方案。 综合评分: 60 文章分类: 威胁情报,软文广告,数据安全


cover_image

【技巧】这份3148页、约261万字的美国最新制裁名单该如何用AI处理?

原创

丁爸 丁爸

丁爸 情报分析师的工具箱

2026年1月22日 07:05 四川

2026年1月16日,美国财政部外国资产控制办公室(OFAC)发布了最新的被制裁实体名单(“SDN名单”),总共有3148页261万字。文档里提及“china”的共有5071处,提及“chinese”的共有1174处,合计6245处与中国相关的信息。想要用AI提取文档中与中国相关的实体信息,用常见的AI进行处理,都会提示文件太大,无法处理。哪我们该如何处理呢?

一、问deepseek这份3148页、约261万字的文档该如何用AI处理?

deepseek回答:考虑到你的文档体量,可以按以下步骤尝试:

  1. 首选尝试大容量模型:直接在Kimi Chat阿里通义千问的官网或App中尝试上传整个文档,这是最快捷的测试方式。如果上传成功,你可以直接进行提问和交互分析。
  2. 准备分卷处理方案:如果单个文件上传失败,你需要将文档按逻辑分卷(例如每500-1000页为一个文件)。之后,可以:
  • UPDF AI这类工具中创建一个项目,将所有分卷文件上传,进行跨文档分析
  • 使用DeepSeek等模型,逐卷上传并分析,最后人工或指导AI进行跨卷总结。

二、问Qwen3-Max能否处理

三、问Kimi能否处理

四、使用PDF工具将文件拆分为15个文件。

经比较发现Kimi一次能处理20万字的单个文件,可将文件拆分为小于20字的文档逐一进行处理,使用PDF编辑工具将该文档拆分为15份文件。

五、再用kimi对文档逐一进行处理

六、最后汇总所有结果,去重后输出全部实体

序号 实体名称(去重后统一名称)

1 北京中传合道文化发展有限公司

2 北京首企文化传播有限公司

3 上海汐之月文化科技合伙企业(有限合伙)

4 厦门影像维度科技合伙企业(有限合伙)

5 上海三摩地信息有限公司

6 宿迁一合相文化合伙企业(有限合伙)

7 湖州汐之月文化艺术工作室

8 佛山金时代电机技术有限公司

9 福建和悦海洋渔业发展有限公司

10 福建南安市进出口公司

11 福建省平潭县远洋渔业集团有限公司

12 福建鑫富旺国际贸易有限公司

13 舟山富捷石化有限公司

14 福州宏龙海洋水产有限公司

15 香港伊国际贸易有限公司(FY International Trading Co., Limited)

16 香港盖伦有限公司(Gainon Co., Limited)

17 高景峰(个人)

18 高兰芳(个人)

19 高琪(个人)

20 高燕(个人)

21 甘雪碧(个人)

22 郎岗山(个人)

23 香港银河轴承有限公司(Galaxy Bearings Ltd)

24 香港银河管理有限公司(Galaxy Management NV)

25 香港银河石油自由贸易区公司(Galaxy Oil FZ LLC / FZE)

26 香港银河石化自由贸易区公司(Galaxy Petrochemical FZE)

27 香港甘苏实业公司(Gansu Endo Industries Co., Limited)

28 金边花园城酒店(Garden City Hotel)

29 香港加维娅化妆品公司(Gavia Beauty Cosmetics Pty Ltd)

30 香港G&S钻石公司(G and S Diamond FZE)

31 香港G&G国际公司(G Y G Internacional S.A.S.)

32 香港GM农场公司(G M Farm SARL)

33 香港Galax贸易公司(Galax Inc. / Galax Trading Co., Ltd.)

34 香港Galenit投资公司(Galenit Invest AD)

35 香港Galeria Page公司(Galeria Page / Galeria Page I)

36 爱玛芯科技有限公司(IMAXCHIP Technology Co., Limited)

37 香港英诺电子科技有限公司(Innovia Electronic Technology Co Limited)

38 永信至成科技集团股份有限公司(Integrity Technology Group, Incorporated)

39 巨航航空科技深圳有限公司

40 南京凯凯科技有限公司(含南京凯凯聚氨酯有限公司、南京凯凯科技发展有限公司)

41 凯丰碳纤维有限公司(开封平煤新型炭材料科技有限公司)

42 瑞诚海运股份有限公司(含瑞邦海运、瑞荣船舶管理,台湾+香港注册)

43 凯兴隆环球能源有限公司(Kai Heng Long Global Energy Limited)

44 优品国际食品有限公司(PLZCOME Limited / YUMIKO International Food Trade Limited)

45 Juliet Trading Limited

46 JTU Energy Limited

47 JST Group Limited

48 JT Trading Limited / JT Trading Ltd

49 广州金升阳科技有限公司(Mornsun Guangzhou Science & Technology Co Ltd)

50 崇德宇航天津科技有限公司

51 上海墨星文化传播有限公司

52 雷素贸易上海有限公司(Reso Trading Shanghai Co Ltd)

53 香港RichTek电子公司(RichTek HK Electronic Co Ltd)

54 香港RG Solutions Limited

55 珠海:RI Chin-hyo‘k(个人)

56 珠海:RI Chun Hwan(个人)

57 北京:RI Chun Song(个人)

58 北京:RI Song-hyok(个人)

59 沈阳:RI Tong Hyok(个人)

60 集安:RI Tok Jin(个人)

61 丹东:RI Sok(个人)

62 北京海奕环境科技有限公司(Shanghai Oceanen Environmental Science and Technology Co., Ltd.)

63 上海黑英信息技术有限公司

64 上海弘漫动漫设计工作室

65 上海嘉瑞德实业有限公司

66 上海久泰新材料有限公司

67 上海驰顺精细化工有限公司

68 上海碳辰新材料科技有限公司

69 上海智航船舶管理有限公司

70 深圳市柏欧森生物科技有限公司

71 深圳比广贸易有限公司

72 深圳联力盛生物科技有限公司

73 深圳益昇达国际技术有限公司

74 四川无声信息技术有限公司

75 四川聚信和网络科技有限公司

76 诗瓦贝光电深圳有限公司

77 诗瓦贝光电梅州有限公司

78 上意源资源青岛有限公司(Shine Resources Qingdao Co Ltd)

79 深圳宴图进出口有限公司

80 深圳亚新通用机械有限公司(含南昌分公司)

81 深圳五力高科创新科技有限公司

82 深圳深创辉科技有限公司

83 深圳华圣工业有限公司

84 深圳华朔半导体有限公司

85 深圳佳思博科技有限公司

86 深圳锦宏电子有限公司

87 深圳瑞扬电子有限公司

88 深圳荣越科技有限公司

89 深圳世强科技有限公司

90 深圳盛南贸易有限公司

91 深圳鑫鑫船务有限公司

92 深圳智宇国际贸易有限公司

93 深圳优信科技有限公司

94 河北冠朗生物科技有限公司(Shijiazhuang Fa Ke Trading Company)

95 延边银星网络科技有限公司

96 中国银星互联网技术公司(China Silver Star Internet Technology Company)

97 沈阳亘丰网络技术有限公司

98 深圳凯斯普洛科技有限公司

99 深圳艾美国际物流有限公司

100 深圳大协国际货运代理有限公司

101 深圳国盛大进设备有限公司

102 深圳明纬电器有限公司

103 深圳博宇进出口有限公司

104 深圳C S进出口有限公司

105 深圳金安科技(Shenzhen One World International Logistics Co Ltd)

106 深圳银桥航运有限公司(Silver Bridge Shipping Co., Limited)

107 金湖明生制药机械有限公司

108 蓬莱巨涛海洋工程重工有限公司

**原文及涉中国实体名单已上传知识星球

长按识别下面的二维码可加入星球

里面已有万余篇资料供下载

续费五折优惠

**


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:丁爸 情报分析师的工具箱 丁爸 丁爸《【技巧】这份3148页、约261万字的美国最新制裁名单该如何用AI处理?》

评论:0   参与:  0