2026-05-20 04:48:23 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 该教程系统介绍AI图片制作全流程，涵盖扩散模型原理、主流工具对比（Midjourney、DALL-E3、StableDiffusion等）、提示词六大模块结构化写法、风格控制技巧及Midjourney实战操作。核心结论表明具体化描述与模块化提示词可显著提升出图质量，并提供十大优化技巧如镜头焦距设定、光线情绪渲染等解决常见问题如人物手指变形。 综合评分： 85 文章分类： AI安全,安全培训,技术标准,解决方案,应用安全

cover_image

AI教程之图片制作AI图片制作教程：从零开始，做出好看的AI

原创

amuxiaohuo amuxiaohuo

黑客网络安全

2026年5月13日 09:06 广东

在小说阅读器读本章

去阅读

一句话描述，电脑帮你画出一张专业插画——这件几年前听起来像天方夜谭的事，今天已经成了普通人触手可及的工具。本文手把手教你掌握AI绘图的完整方法，从选工具到写提示词，从控制风格到优化细节，全部讲清楚。

一、AI绘图能做什么

AI绘图工具的核心技术叫”扩散模型”。它的原理是：用几十亿张图片训练神经网络，让它学会视觉规律，当你输入一段文字，AI把文字转化成数学向量，在庞大的视觉知识库里找到最匹配的内容，一步步”去噪”生成图像。

你不需要懂这些细节，你只需要知道：AI能看懂你写的文字，并把它变成图片。

目前AI绘图广泛用于以下场景：

个人创作

：头像、壁纸、艺术插画、故事绘本
内容创作

：文章配图、公众号封面、小红书图片
商业设计

：电商主图、广告素材、产品场景图
游戏影视

：概念艺术、角色设计、分镜参考
教育科普

：教学插图、信息图表

当然，AI绘图也有局限：图片内嵌文字容易出错，人物手指容易变形，同一角色跨图保持一致性比较难。了解这些，是为了在遇到问题时知道该换什么思路。

二、主流工具对比，选对工具少走弯路

市面工具不少，但真正值得花时间学习的就几个，下面逐一介绍。

Midjourney —— 艺术感最强

Midjourney是目前公认艺术感最强的工具。它生成的图片构图讲究、色调协调，即便随手一条提示词，出来的效果也往往令人惊艳。

费用

：付费订阅，10美元/月起
平台

：Discord（有轻微上手门槛）
优点

：美学输出顶级，风格统一
缺点

：需付费，对精准控制支持较弱
适合

：追求高质量艺术图的创作者

DALL-E 3 —— 最适合新手

集成在ChatGPT里，对中文支持极好，理解自然语言能力强，上手几乎零门槛。直接用中文描述你想要的图，它就能生成。

费用

：ChatGPT Plus，20美元/月（也有免费次数）
平台

：网页/App
优点

：中文友好，理解力强，操作最简单
缺点

：风格偏商业插画，个性相对弱
适合

：初学者、办公场景快速出图

Stable Diffusion —— 最强可控性

开源免费，可本地部署，有数千种社区模型和插件，可控性极高。能做到其他工具做不到的精细定制。

费用

：免费（本地运行需要显卡）
平台

：本地部署 / 在线平台（如Civitai、LiblibAI）
优点

：完全免费，高度可定制，社区资源丰富
缺点

：学习曲线陡峭，需要技术基础
适合

：有折腾精神的技术用户、专业创作者

国内工具 —— 入门首选

即梦（字节出品）、通义万相、文心一格等，中文提示词支持好，有免费额度，非常适合入门试水。

如何选择：

完全新手 → 先用即梦或DALL-E 3，找到感觉

追求艺术感 → 投入Midjourney

想深度定制、不想花钱 → 学Stable Diffusion

Adobe设计师 → 用Firefly（PS内置）

三、提示词的底层逻辑：越具体越好

提示词（Prompt）是你与AI沟通的语言。它不是魔法咒语，而是有规律可循的信息传递方式。

AI是如何”读懂”提示词的？

你写的每个词，都会被转化为数学向量，影响最终图像。靠前的词权重更高，重复强调的词权重更高，模型在训练中见过更多的专业术语（比如艺术家名字）权重也更高。

三个核心认知：

① 具体胜于抽象

“美丽的风景”不如”阿尔卑斯山脉的清晨，前景是枯黄草地和古旧木屋，远处雪峰在粉色晨光中”。AI的训练数据是具体的图片，越具体的描述，越能命中它学到的视觉内容。

② 词序影响权重

把最重要的内容——主体、风格——放在提示词开头，细节补充放后面。

③ 正向描述胜于负向描述

不要在主提示词里写”没有文字，没有边框”，要写”干净背景，纯色背景”。负向排除用专门的”负面提示词”（Negative Prompt）功能。

四、提示词结构：专业写法的六大模块

一个专业的提示词通常包含六个模块，按顺序组合效果最稳定：[主体描述] + [环境场景] + [艺术风格] + [光线氛围] + [质量参数] + [负面提示]

模块一：主体描述（最重要）

主体是画面核心，要尽可能具体，包括外观、状态、表情、动作。

❌ 差的写法：一个美丽的女孩

✅ 好的写法：

一位20多岁的年轻亚洲女性，一头飘逸的黑发，

穿着复古米色亚麻连衣裙，坐在

阳光明媚的窗户上挂着温暖的笑容，双手搂着

陶瓷咖啡杯

差别在哪里：好的写法明确了年龄、发型、服装、动作、情绪、道具，AI不需要”猜测”，自然输出更符合预期。

模块二：环境场景

描述时间、地点、天气：

在舒适的咖啡馆里，温暖的午后阳光，秋叶

透过窗户可见，柔和的散景背景

模块三：艺术风格

这是决定图片气质的关键词。常用写法：

引用艺术家名：in the style of Monet（莫奈风格）、Studio Ghibli style（吉卜力风格）
描述媒介：oil painting（油画）、watercolor（水彩）、pencil sketch（铅笔素描）、digital illustration（数字插画）
描述风格流派：cyberpunk（赛博朋克）、minimalist（极简主义）、Art Deco（装饰艺术）

模块四：光线氛围

光线对图片情绪影响极大，是最容易被忽略却效果最显著的参数：

模块五：质量参数

添加这些词可以提升整体精细度：highly detailed, 8K resolution, sharp focus, professional photography, masterpiece, best quality

在Midjourney中还可以加版本参数：--v 6.1``--ar 16:9（宽高比）--s 750（风格化强度）

模块六：负面提示词

告诉AI你不想看到什么。常用通用负面提示词：blurry, low quality, deformed hands, extra fingers, bad anatomy, watermark, text, signature, ugly, poorly drawn

五、完整提示词实战示例

把以上模块组合起来，看两个完整案例。

案例一：城市夜景插画

提示词：

夜晚霓虹灯闪烁的赛博朋克城市鸟瞰图，高耸

摩天大楼上用中文和日文写着发光的广告，

洒满雨水的街道反射着五颜六色的灯光和小人物

伞在下面走，远处有雾，

电影照明、超精细数字插图，

8K分辨率，采用《银翼杀手2049》风格

负面提示词：模糊、低质量、日光、卡通、动漫、水印

关键分析：主体是城市鸟瞰，明确了科幻赛博朋克风格，加入了霓虹灯、雨水反射、雾气等细节，引用了《银翼杀手2049》的风格参考，光线用”电影感打光”定调。

案例二：新中式人物肖像

提示词：

一位30多岁的优雅中国女性的肖像，穿着

丝绸旗袍，精致的花朵刺绣，坐在

传统的花园亭被盛开的牡丹所环绕，

柔和的晨光透过竹叶，

宁静而优美的表情，中国传统水墨

绘画风格细腻，细节细腻，

专业肖像摄影构图

关键分析：民族文化元素（旗袍、牡丹、亭台）+ 光线设定（清晨柔光）+ 混合风格（国画水墨+水彩）= 独特的新中式审美。

六、风格控制：让图片有自己的气质

风格是AI图片的灵魂。以下几类风格控制方式效果最稳定。

引用艺术家名字

这是最直接、效果最强的风格控制方式：

in the style of Van Gogh

— 梵高的粗犷笔触和强烈色彩
Hayao Miyazaki style

— 宫崎骏的温暖童话感
Greg Rutkowski

— 当代奇幻艺术，史诗级光效
Alphonse Mucha

— 新艺术运动，装饰性线条
Zaha Hadid style

— 流线型建筑美学

用媒介描述风格oil painting on canvas（布面油画） `vintage film photograph（胶片老照片） traditional Chinese ink wash painting（中国水墨画） Risograph print（日式胶版印刷，有颗粒感） linocut print（版画，粗犷线条）`

#

用时代背景定风格1920s Art Deco poster（二十年代装饰艺术海报） `1980s synthwave aesthetic（八十年代合成波） 90s anime style（九十年代日本动漫风）`

七、Midjourney实战操作步骤

Midjourney是最多人使用的工具，这里专门讲操作流程。

第一步：进入Discord并加入Midjourney服务器

访问 midjourney.com，点击”Join the Beta”，用Discord账号登录后加入官方服务器，找到任意 #newbies 频道即可开始使用。

第二步：订阅计划

在对话框输入 /subscribe，根据需求选择订阅方案。基础版每月10美元，包含约200张图的生成量；标准版每月30美元，包含无限放松模式生成。

第三步：发送提示词

在频道对话框输入 /imagine，选择弹出的命令，然后在 prompt 栏输入你的提示词，回车发送。

第四步：理解生成结果

大约一分钟后，AI会生成一张包含4个选项的预览图。图片下方有8个按钮：

U1~U4

：Upscale（放大精细化某一张）
V1~V4

：Variation（基于某一张生成变体）

先看4张图选出最喜欢的，再点U放大，最后还可以点**Vary（Subtle）做小幅调整，或者Vary（Strong）**做大幅变体。

第五步：常用参数速查

在提示词末尾加上这些参数，直接影响输出效果：

–ar 16:9 宽高比16:9（横屏） --ar 9:16       宽高比9:16（竖屏/手机壁纸） --ar 1:1        正方形 --s 200         风格化强度低（更写实） --s 1000        风格化强度高（更艺术） --chaos 50      增加随机性，结果更多样 --no text       排除文字（等同于负面提示） --v 6.1         使用最新版本模型

八、让图片更好看的十个实战技巧

掌握了基本操作之后，这十个技巧能让你的出图质量明显提升。

技巧一：用情绪词定调

在提示词中加入情绪或氛围词，AI会理解整体基调：melancholic（忧郁）、ethereal（空灵）、nostalgic（怀旧）、epic（史诗感）、cozy（温馨）。

技巧二：指定镜头焦距

摄影类图片加入镜头参数，视觉效果截然不同：35mm lens（街拍感）、85mm portrait lens（人像虚化）、wide angle lens（广角宏大感）、macro photography（微距特写）。

技巧三：用光线制造情绪

“黄金时段光线”（golden hour）几乎是万能的加分项，能让任何普通场景变得有电影感。backlit（逆光）则适合营造轮廓光和神秘感。

技巧四：加入材质细节

材质词让图片更有质感：velvet texture（丝绒质感）、worn leather（做旧皮革）、frosted glass（磨砂玻璃）、rough concrete（粗糙混凝土）。

技巧五：颜色方案要统一

不要堆砌所有颜色，要指定一个主色调方案：muted earth tones（低饱和大地色）、pastel color palette（马卡龙色系）、monochromatic blue tones（蓝色单色调）、high contrast black and white（高对比黑白）。

技巧六：参考具体的电影或摄影师

cinematic shot from Wes Anderson film（韦斯·安德森电影感）、National Geographic photography style（国家地理摄影风格）——这类具体参考往往比抽象描述更精准。

技巧七：控制画面主次

告诉AI主体占画面多大比例：close-up portrait（脸部特写）、full body shot（全身）、wide establishing shot（大全景）、rule of thirds composition（三分法构图）。

技巧八：迭代而非重新开始

看到一张大方向对但细节不满意的图，用V（Variation）生成变体，而不是修改提示词重新生成。通过多轮变体逐步逼近理想效果，比每次大改提示词效率高很多。

技巧九：保存好的提示词

当你找到一条出图稳定的提示词，一定要记录下来。建议建一个文档，分类整理”风景类””人物类””产品类”等，下次直接调用和修改，效率翻倍。

技巧十：向社区学习

Midjourney官方网站的Explore页面、Civitai社区、Pinterest的AI art板块，都是学习提示词和参考风格的宝库。看到喜欢的图，点开查看它的提示词，分析学习，是进步最快的方式。

九、常见问题与解决方法

Q：为什么我的人物手指总是变形？

A：这是目前所有AI工具的通病，扩散模型对”手”的学习还不够精准。解决方法：在负面提示词中加入 deformed hands, extra fingers, bad anatomy；或者使用ControlNet（Stable Diffusion的插件）进行精确控制；或者生成后用Photoshop的”创成式填充”功能修复局部。

Q：我的提示词写得很长，为什么出图效果还是很普通？

A：长不等于好。提示词的质量比数量更重要。很多初学者会堆砌大量词汇，但这往往导致AI”顾此失彼”。建议先只写核心描述（主体+风格），等效果方向对了，再逐步加入细节词。另外检查词序，最重要的内容一定在最前面。

Q：同样的提示词，每次出的图都不一样，能固定吗？

A：AI生成本身有随机性，这是由设计决定的。在Stable Diffusion里，可以固定”随机种子”（Seed）来复现同一张图。Midjourney目前不直接支持固定种子，但可以用已有图片的种子值参数 --seed XXXX 让结果更接近某次生成。

Q：生成的图片可以商用吗？

A：不同工具规则不同。Midjourney的付费用户默认获得商业使用权，但具体条款请查看官方协议；DALL-E 3生成的图片OpenAI允许商用；Stable Diffusion因为是开源工具，本身无使用限制，但如果你使用了基于特定艺术家数据训练的模型，可能存在版权争议。Adobe Firefly是目前版权最清晰的商业工具。

十、学习路线建议

如果你是刚入门的新手，建议按照以下路线循序渐进：

第一阶段（1~2周）：找感觉

选择一个工具（推荐即梦或DALL-E 3），每天用中文生成10~20张图，不追求完美，只是熟悉工具响应，建立对提示词和效果关系的基本直觉。

第二阶段（1个月）：学结构

开始学习本文介绍的六模块提示词结构，每次生成都用规范格式写提示词。同时开始收集喜欢的AI图片，分析它们的提示词。

第三阶段（持续）：专攻一个方向

根据自己的需求，选择一个细分方向深入：人像摄影感、风景插画、商业产品图、赛博朋克概念艺术……专注在一个风格里反复打磨，比什么都浅尝一遍成长快得多。

第四阶段（进阶）：学后期处理

AI出图只是第一步，配合Photoshop的创成式填充、Lightroom的调色、甚至Topaz的AI超清放大，才能做出真正专业级别的最终作品。

结语

AI绘图工具的本质，是一种创意放大器。它不会替代你的审美判断，也不会代替你对美的感知和理解——它只是把这些变成了可执行的东西。你对画面的理解越深，你写出的提示词就越准确，AI能帮你实现的就越多。

学好AI绘图，不是在学一项软件技能，而是在学一种新的视觉语言。

从今天开始，打开工具，输入第一条提示词。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：黑客网络安全 amuxiaohuo amuxiaohuo《AI教程之图片制作AI图片制作教程：从零开始，做出好看的AI》