AI与AI安全:Transformer原理初步①文字版

admin 2026-05-11 08:06:37 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 本文是AI与AI安全系列第三篇,重点解析Transformer架构原理及其在LLM中的应用。文章详细介绍了注意力机制、多头注意力计算过程,以及LLM从词元输入到文本生成的完整工作流程。作者通过通俗比喻解释技术概念,并提供了原始论文参考链接,帮助读者建立AI安全领域的基础认知框架。 综合评分: 72 文章分类: AI安全,技术标准,安全培训,WEB安全,其他


cover_image

AI与AI安全:Transformer原理初步①文字版

原创

AugustTheodor AugustTheodor

重生之成为赛博女保安

2026年5月7日 10:17 吉林

在小说阅读器读本章

去阅读

前注

本篇是原定的AI与AI安全系列的第一篇。当然后面由于各种原因,一个是AI投毒事件,一个是我想试试讲课,被拖到第三篇。

这篇和https://www.bilibili.com/video/BV183ojBuE1Y(同样的,点击阅读原文)配套,同时如果两边的描述有不一致,介于两者创作的时间差——尽量以视频为准(当然鉴于直播时要把讲的部分串起来,所以本文中的很多其他原理部分就没有涉及)。

以下原文:

写在系列开始之前

首先,由于笔者苯人也不怎么懂。所以在这个系列里我们不太可能进行数学上的探讨。

本系列中所有关于原理的解释,都仅致力于让读者简单理解:

①LLM中的部分原理

②AI行业的一些术语

③AI衍生的应用方向的实现方式(MCP、Skill、Agent、龙虾…)

④AI安全

所以在准确度和专业度上可能会差强人意,请各位读者谅解。

这个系列随着AI的蓬勃发展(现已火热进行中)会不断更新。

1 基础背景小知识

1.1 基础名词解释

LLM:Large Language Model,大语言模型,可以简单理解为文生文模型。

Transformer:一个架构,当前广泛应用于模型训练中。

卷积:在AI中,卷积是指对一个“窗口”内的数据做加权求和。当作一种数学运算就行。

Embdding(嵌入):在AI中是将离散数据转换为连续向量的技术(etc.“我”->[1,3,2,1…..]),也就是用数学上一个可以量化对比的数据反映原始数据。

Tokenizer(分词器):简单来说就是将一段话切成对应词元ID的数组(etc.“我爱安全”->[123,456,789])。

Sampling(采样):对模型的运行结果进行一定处理(比如添加一个小随机数),然后根据处理后的结果选出对应输出。

残差连接:一种将输入与输出直接相加的技术(请想象两条曲线的Y轴相加),这个技术旨在保留训练数据的梯度。

梯度:可以简单理解为“某一个值的变化速度”,也可以理解成“导数的斜率”。总得来说,在LLM中这个值不能太大(梯度爆炸)也不能太小(梯度消失)。

反向传播(BP):在AI训练中被使用的一种方法,它能够根据误差向回推算每一层的梯度,进而对每一层进行校准。

归一化:将一系列参数进行放缩令其和为1。

Hidden State(隐藏状态):

lm_head(输出头):一个函数。输入隐藏状态,得到词表得分(Logits)。简单来说,输入一个向量,得到一个可能对应的词元的列表。

FFN(Feed-Forward Network,前馈网络):FFN是一个广泛应用于所有深度学习框架中的神经网络,它会对输入进行一系列变换然后输出。在目前情况下我们可以简单理解它为一种运算单元。

1.2 AI的工作原理

数学建模

Yes It Is!AI的原理就是通过一系列训练让所有输入->输出拟合训练集的输入->输出。

天气是可以预测的,情绪是可以预演的!对这个数学的世界绝望了^ ^!

1.3 LLM的工作原理

这句话应该会贯彻本系列的所有文章:当前绝大多数(其实可以说是所有)LLM的工作方式是“续写”,也就是根据当前所有输入,预测下一个输出。所谓的skill、agent等模式实际上都是在此基础上的变体。

1.4 Transformer背景小知识

很难想象,Transformer这个架构仅在九年前被提出。在2017年,一篇由谷歌研究员发表的原文仅有11页(去掉引用只有9页)的论文《Attention Is All You Need》提出了一个全新的架构Transformer,它与传统模型RNN或CNN的不同在于,完全基于注意力机制,能够以相对极高的效率处理大量文本。

感兴趣的读者可以通过传送门拜读原文:

https://proceedings.neurips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf

需要注意的是,当下几乎所有主流LLM都基于Transformer架构。这也是我们在学习AI安全之前要先了解这个架构的原因。

1.5 Encoder/Decoder

在AI领域中,我们可以简单地将Encoder理解为“将输入(文字、图)拆解成抽象表示(向量)”的模块。与此相对的,Decoder则可以称为“以抽象表示为上下文,生成输出”的模块。

这两个模块最初发明于翻译类大模型中,而在当代以“续写”为核心主流LLM中通常只有Decoder。

2 注意力(Attention)

2.1 背景,名词解释

简单说说,注意这里不涉及任何数学问题,不然主播现在应该在北大而不是加里敦。

首先,注意力机制在2014年还是被谷歌的研究员提出。

https://proceedings.neurips.cc/paper_files/paper/2014/file/3e456b31302cf8210edd4029292a40ad-Paper.pdf

当然,这个机制在后续经过了非常多迭代发展,并非完全是14年提到的样子。这里给出的文章仅供参考。

需要注意的是,注意力机制有很多变体。而Transformer中使用的自注意力(Self-Attention)机制则是其中之一,除此之外,还有传统注意力(Cross-Attention)、稀疏注意力等。

3 Attention

3.1 简单的原理

先使用人话解释一下。注意,这里全部都是笔者个人理解,不是实际上的精确原理。

In practice, we compute the attention function on a set of queries simultaneously, packed together

into a matrix Q. The keys and values are also packed together into matrices K and V .

首先,对于每个输入source(s),存在查询Q、键值对K和V。Q意为当前s的需求(要找什么),K意为当前s拥有的身份(是什么),V意为当前s可以提供的内容(带有什么)。

对每个输入,经过这样的拆分后互相运算,得到当前输入的融合后矩阵Attention(Q,K,V)。

3.2 简单的计算过程

需要一些小小的离散数学。当然不懂也没事,知道个大概就好。

我们假设输入文本为S。

S=[s1...sn]

其中,sn代表一个词元。由于LLM会使用一个不定维数的向量表示词元,所以实际上S是一个向量数组(矩阵)。

对于每一个Transformer层,有三个矩阵Wq、Wk、Wv。当文本输入后,对于每个词元sn,得到`Qn=Sn*Wq、`Kn=Sn*Wk、`Vn=Sn*Wv

然后得到S的整个Q=[`Q1...`Qn],以此类推。

然后再经历一系列运算,这里摘抄原文的公式表示:

Attention(Q,K,V)=[`s1...`sn]

当然这里仍然可以再用人话表示一下(具体请看视频),矩阵A*矩阵A`转置*矩阵A``/标量=矩阵A```=>它的输入和输出行列数是相同的,这也是它能连续经过N个同样的层的原因。

3.3 Multi-Head Attention(多头注意力)

正如上文所言,在LLM中一个词元会被视为一个有n个维度的向量。在此基础上我们自然可以想到:当维度过多时,对其进行运算的精度损失会变多——就像一个人如果同时关注很多事情,那么TA的注意力肯定也会被分散削减。

在多头注意力中,输入的维度会被分割成多个头分别单独处理(至于怎么分,不是我们的重点,可以跳过),以改善上面提到的精度损失问题。

4 Transformer LLM构造(以下为直播补充部分)

4.1 一个词元是怎么进入大模型的?

4.2 运算后的向量是怎么还原成一个词的?

4.3 LLM运作流程

![](https://mmbiz.qpic.cn/mmbiz_png/bcFEmmDxVAjdMU2NGzkCD8B0WdkYfNUYyiaOzk1G5lB2WKR45ttc5x2J4PtP8fqMxr9lA0QwptB8jibibaYfnJ0cS7WFfwHPoX9ZftbqQtUWIc/640?wx_fmt=png&from=appmsg&watermark=1#imgIndex=5)

. . . * . *  🌟  * . * . . .

本文为AI与AI安全系列第 3 篇。

喜欢这个系列的读者可以关注一下我的公众号。咱们之后见。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:重生之成为赛博女保安 AugustTheodor AugustTheodor《AI与AI安全:Transformer原理初步①文字版》

评论:0   参与:  0