文章总结: 该教程系统介绍AI图片制作全流程,涵盖扩散模型原理、主流工具对比(Midjourney、DALL-E3、StableDiffusion等)、提示词六大模块结构化写法、风格控制技巧及Midjourney实战操作。核心结论表明具体化描述与模块化提示词可显著提升出图质量,并提供十大优化技巧如镜头焦距设定、光线情绪渲染等解决常见问题如人物手指变形。 综合评分: 85 文章分类: AI安全,安全培训,技术标准,解决方案,应用安全
AI教程之图片制作AI图片制作教程:从零开始,做出好看的AI
原创
amuxiaohuo amuxiaohuo
黑客网络安全
2026年5月13日 09:06 广东
在小说阅读器读本章
去阅读
一句话描述,电脑帮你画出一张专业插画——这件几年前听起来像天方夜谭的事,今天已经成了普通人触手可及的工具。本文手把手教你掌握AI绘图的完整方法,从选工具到写提示词,从控制风格到优化细节,全部讲清楚。
一、AI绘图能做什么
AI绘图工具的核心技术叫”扩散模型”。它的原理是:用几十亿张图片训练神经网络,让它学会视觉规律,当你输入一段文字,AI把文字转化成数学向量,在庞大的视觉知识库里找到最匹配的内容,一步步”去噪”生成图像。
你不需要懂这些细节,你只需要知道:AI能看懂你写的文字,并把它变成图片。
目前AI绘图广泛用于以下场景:
-
个人创作
:头像、壁纸、艺术插画、故事绘本
-
内容创作
:文章配图、公众号封面、小红书图片
-
商业设计
:电商主图、广告素材、产品场景图
-
游戏影视
:概念艺术、角色设计、分镜参考
-
教育科普
:教学插图、信息图表
当然,AI绘图也有局限:图片内嵌文字容易出错,人物手指容易变形,同一角色跨图保持一致性比较难。了解这些,是为了在遇到问题时知道该换什么思路。
二、主流工具对比,选对工具少走弯路
市面工具不少,但真正值得花时间学习的就几个,下面逐一介绍。
Midjourney —— 艺术感最强
Midjourney是目前公认艺术感最强的工具。它生成的图片构图讲究、色调协调,即便随手一条提示词,出来的效果也往往令人惊艳。
-
费用
:付费订阅,10美元/月起
-
平台
:Discord(有轻微上手门槛)
-
优点
:美学输出顶级,风格统一
-
缺点
:需付费,对精准控制支持较弱
-
适合
:追求高质量艺术图的创作者
DALL-E 3 —— 最适合新手
集成在ChatGPT里,对中文支持极好,理解自然语言能力强,上手几乎零门槛。直接用中文描述你想要的图,它就能生成。
-
费用
:ChatGPT Plus,20美元/月(也有免费次数)
-
平台
:网页/App
-
优点
:中文友好,理解力强,操作最简单
-
缺点
:风格偏商业插画,个性相对弱
-
适合
:初学者、办公场景快速出图
Stable Diffusion —— 最强可控性
开源免费,可本地部署,有数千种社区模型和插件,可控性极高。能做到其他工具做不到的精细定制。
-
费用
:免费(本地运行需要显卡)
-
平台
:本地部署 / 在线平台(如Civitai、LiblibAI)
-
优点
:完全免费,高度可定制,社区资源丰富
-
缺点
:学习曲线陡峭,需要技术基础
-
适合
:有折腾精神的技术用户、专业创作者
国内工具 —— 入门首选
即梦(字节出品)、通义万相、文心一格等,中文提示词支持好,有免费额度,非常适合入门试水。
如何选择:
- 完全新手 → 先用即梦或DALL-E 3,找到感觉
- 追求艺术感 → 投入Midjourney
- 想深度定制、不想花钱 → 学Stable Diffusion
- Adobe设计师 → 用Firefly(PS内置)
三、提示词的底层逻辑:越具体越好
提示词(Prompt)是你与AI沟通的语言。它不是魔法咒语,而是有规律可循的信息传递方式。
AI是如何”读懂”提示词的?
你写的每个词,都会被转化为数学向量,影响最终图像。靠前的词权重更高,重复强调的词权重更高,模型在训练中见过更多的专业术语(比如艺术家名字)权重也更高。
三个核心认知:
① 具体胜于抽象
“美丽的风景”不如”阿尔卑斯山脉的清晨,前景是枯黄草地和古旧木屋,远处雪峰在粉色晨光中”。AI的训练数据是具体的图片,越具体的描述,越能命中它学到的视觉内容。
② 词序影响权重
把最重要的内容——主体、风格——放在提示词开头,细节补充放后面。
③ 正向描述胜于负向描述
不要在主提示词里写”没有文字,没有边框”,要写”干净背景,纯色背景”。负向排除用专门的”负面提示词”(Negative Prompt)功能。
四、提示词结构:专业写法的六大模块
一个专业的提示词通常包含六个模块,按顺序组合效果最稳定:[主体描述] + [环境场景] + [艺术风格] + [光线氛围] + [质量参数] + [负面提示]
模块一:主体描述(最重要)
主体是画面核心,要尽可能具体,包括外观、状态、表情、动作。
❌ 差的写法:一个美丽的女孩
✅ 好的写法:
一位20多岁的年轻亚洲女性,一头飘逸的黑发,
穿着复古米色亚麻连衣裙,坐在
阳光明媚的窗户上挂着温暖的笑容,双手搂着
陶瓷咖啡杯
差别在哪里:好的写法明确了年龄、发型、服装、动作、情绪、道具,AI不需要”猜测”,自然输出更符合预期。
模块二:环境场景
描述时间、地点、天气:
在舒适的咖啡馆里,温暖的午后阳光,秋叶
透过窗户可见,柔和的散景背景
模块三:艺术风格
这是决定图片气质的关键词。常用写法:
- 引用艺术家名:
in the style of Monet(莫奈风格)、Studio Ghibli style(吉卜力风格) - 描述媒介:
oil painting(油画)、watercolor(水彩)、pencil sketch(铅笔素描)、digital illustration(数字插画) - 描述风格流派:
cyberpunk(赛博朋克)、minimalist(极简主义)、Art Deco(装饰艺术)
模块四:光线氛围
光线对图片情绪影响极大,是最容易被忽略却效果最显著的参数:
| 关键词 | 效果 | | — | — | | golden hour lighting | 黄金时段的温暖橙光 | | dramatic side lighting | 戏剧性侧光,强对比 | | soft diffused light | 柔和散射光,温柔氛围 | | cinematic lighting | 电影感打光 | | neon lights | 霓虹灯氛围 | | moonlight | 月光,清冷神秘 |
模块五:质量参数
添加这些词可以提升整体精细度:highly detailed, 8K resolution, sharp focus, professional photography, masterpiece, best quality
在Midjourney中还可以加版本参数:--v 6.1``--ar 16:9(宽高比)--s 750(风格化强度)
模块六:负面提示词
告诉AI你不想看到什么。常用通用负面提示词:blurry, low quality, deformed hands, extra fingers, bad anatomy, watermark, text, signature, ugly, poorly drawn
五、完整提示词实战示例
把以上模块组合起来,看两个完整案例。
案例一:城市夜景插画
提示词:
夜晚霓虹灯闪烁的赛博朋克城市鸟瞰图,高耸
摩天大楼上用中文和日文写着发光的广告,
洒满雨水的街道反射着五颜六色的灯光和小人物
伞在下面走,远处有雾,
电影照明、超精细数字插图,
8K分辨率,采用《银翼杀手2049》风格
负面提示词:模糊、低质量、日光、卡通、动漫、水印
关键分析:主体是城市鸟瞰,明确了科幻赛博朋克风格,加入了霓虹灯、雨水反射、雾气等细节,引用了《银翼杀手2049》的风格参考,光线用”电影感打光”定调。
案例二:新中式人物肖像
提示词:
一位30多岁的优雅中国女性的肖像,穿着
丝绸旗袍,精致的花朵刺绣,坐在
传统的花园亭被盛开的牡丹所环绕,
柔和的晨光透过竹叶,
宁静而优美的表情,中国传统水墨
绘画风格细腻,细节细腻,
专业肖像摄影构图
关键分析:民族文化元素(旗袍、牡丹、亭台)+ 光线设定(清晨柔光)+ 混合风格(国画水墨+水彩)= 独特的新中式审美。
六、风格控制:让图片有自己的气质
风格是AI图片的灵魂。以下几类风格控制方式效果最稳定。
引用艺术家名字
这是最直接、效果最强的风格控制方式:
-
in the style of Van Gogh— 梵高的粗犷笔触和强烈色彩
-
Hayao Miyazaki style— 宫崎骏的温暖童话感
-
Greg Rutkowski— 当代奇幻艺术,史诗级光效
-
Alphonse Mucha— 新艺术运动,装饰性线条
-
Zaha Hadid style— 流线型建筑美学
用媒介描述风格oil painting on canvas(布面油画) vintage film photograph(胶片老照片) traditional Chinese ink wash painting(中国水墨画) Risograph print(日式胶版印刷,有颗粒感) linocut print(版画,粗犷线条)
#
用时代背景定风格1920s Art Deco poster(二十年代装饰艺术海报) 1980s synthwave aesthetic(八十年代合成波) 90s anime style(九十年代日本动漫风)
七、Midjourney实战操作步骤
Midjourney是最多人使用的工具,这里专门讲操作流程。
第一步:进入Discord并加入Midjourney服务器
访问 midjourney.com,点击”Join the Beta”,用Discord账号登录后加入官方服务器,找到任意 #newbies 频道即可开始使用。
第二步:订阅计划
在对话框输入 /subscribe,根据需求选择订阅方案。基础版每月10美元,包含约200张图的生成量;标准版每月30美元,包含无限放松模式生成。
第三步:发送提示词
在频道对话框输入 /imagine,选择弹出的命令,然后在 prompt 栏输入你的提示词,回车发送。
第四步:理解生成结果
大约一分钟后,AI会生成一张包含4个选项的预览图。图片下方有8个按钮:
-
U1~U4
:Upscale(放大精细化某一张)
-
V1~V4
:Variation(基于某一张生成变体)
先看4张图选出最喜欢的,再点U放大,最后还可以点**Vary(Subtle)做小幅调整,或者Vary(Strong)**做大幅变体。
第五步:常用参数速查
在提示词末尾加上这些参数,直接影响输出效果:
–ar 16:9 宽高比16:9(横屏) --ar 9:16 宽高比9:16(竖屏/手机壁纸)
--ar 1:1 正方形
--s 200 风格化强度低(更写实)
--s 1000 风格化强度高(更艺术)
--chaos 50 增加随机性,结果更多样
--no text 排除文字(等同于负面提示)
--v 6.1 使用最新版本模型
八、让图片更好看的十个实战技巧
掌握了基本操作之后,这十个技巧能让你的出图质量明显提升。
技巧一:用情绪词定调
在提示词中加入情绪或氛围词,AI会理解整体基调:melancholic(忧郁)、ethereal(空灵)、nostalgic(怀旧)、epic(史诗感)、cozy(温馨)。
技巧二:指定镜头焦距
摄影类图片加入镜头参数,视觉效果截然不同:35mm lens(街拍感)、85mm portrait lens(人像虚化)、wide angle lens(广角宏大感)、macro photography(微距特写)。
技巧三:用光线制造情绪
“黄金时段光线”(golden hour)几乎是万能的加分项,能让任何普通场景变得有电影感。backlit(逆光)则适合营造轮廓光和神秘感。
技巧四:加入材质细节
材质词让图片更有质感:velvet texture(丝绒质感)、worn leather(做旧皮革)、frosted glass(磨砂玻璃)、rough concrete(粗糙混凝土)。
技巧五:颜色方案要统一
不要堆砌所有颜色,要指定一个主色调方案:muted earth tones(低饱和大地色)、pastel color palette(马卡龙色系)、monochromatic blue tones(蓝色单色调)、high contrast black and white(高对比黑白)。
技巧六:参考具体的电影或摄影师
cinematic shot from Wes Anderson film(韦斯·安德森电影感)、National Geographic photography style(国家地理摄影风格)——这类具体参考往往比抽象描述更精准。
技巧七:控制画面主次
告诉AI主体占画面多大比例:close-up portrait(脸部特写)、full body shot(全身)、wide establishing shot(大全景)、rule of thirds composition(三分法构图)。
技巧八:迭代而非重新开始
看到一张大方向对但细节不满意的图,用V(Variation)生成变体,而不是修改提示词重新生成。通过多轮变体逐步逼近理想效果,比每次大改提示词效率高很多。
技巧九:保存好的提示词
当你找到一条出图稳定的提示词,一定要记录下来。建议建一个文档,分类整理”风景类””人物类””产品类”等,下次直接调用和修改,效率翻倍。
技巧十:向社区学习
Midjourney官方网站的Explore页面、Civitai社区、Pinterest的AI art板块,都是学习提示词和参考风格的宝库。看到喜欢的图,点开查看它的提示词,分析学习,是进步最快的方式。
九、常见问题与解决方法
Q:为什么我的人物手指总是变形?
A:这是目前所有AI工具的通病,扩散模型对”手”的学习还不够精准。解决方法:在负面提示词中加入 deformed hands, extra fingers, bad anatomy;或者使用ControlNet(Stable Diffusion的插件)进行精确控制;或者生成后用Photoshop的”创成式填充”功能修复局部。
Q:我的提示词写得很长,为什么出图效果还是很普通?
A:长不等于好。提示词的质量比数量更重要。很多初学者会堆砌大量词汇,但这往往导致AI”顾此失彼”。建议先只写核心描述(主体+风格),等效果方向对了,再逐步加入细节词。另外检查词序,最重要的内容一定在最前面。
Q:同样的提示词,每次出的图都不一样,能固定吗?
A:AI生成本身有随机性,这是由设计决定的。在Stable Diffusion里,可以固定”随机种子”(Seed)来复现同一张图。Midjourney目前不直接支持固定种子,但可以用已有图片的种子值参数 --seed XXXX 让结果更接近某次生成。
Q:生成的图片可以商用吗?
A:不同工具规则不同。Midjourney的付费用户默认获得商业使用权,但具体条款请查看官方协议;DALL-E 3生成的图片OpenAI允许商用;Stable Diffusion因为是开源工具,本身无使用限制,但如果你使用了基于特定艺术家数据训练的模型,可能存在版权争议。Adobe Firefly是目前版权最清晰的商业工具。
十、学习路线建议
如果你是刚入门的新手,建议按照以下路线循序渐进:
第一阶段(1~2周):找感觉
选择一个工具(推荐即梦或DALL-E 3),每天用中文生成10~20张图,不追求完美,只是熟悉工具响应,建立对提示词和效果关系的基本直觉。
第二阶段(1个月):学结构
开始学习本文介绍的六模块提示词结构,每次生成都用规范格式写提示词。同时开始收集喜欢的AI图片,分析它们的提示词。
第三阶段(持续):专攻一个方向
根据自己的需求,选择一个细分方向深入:人像摄影感、风景插画、商业产品图、赛博朋克概念艺术……专注在一个风格里反复打磨,比什么都浅尝一遍成长快得多。
第四阶段(进阶):学后期处理
AI出图只是第一步,配合Photoshop的创成式填充、Lightroom的调色、甚至Topaz的AI超清放大,才能做出真正专业级别的最终作品。
结语
AI绘图工具的本质,是一种创意放大器。它不会替代你的审美判断,也不会代替你对美的感知和理解——它只是把这些变成了可执行的东西。你对画面的理解越深,你写出的提示词就越准确,AI能帮你实现的就越多。
学好AI绘图,不是在学一项软件技能,而是在学一种新的视觉语言。
从今天开始,打开工具,输入第一条提示词。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:黑客网络安全 amuxiaohuo amuxiaohuo《AI教程之图片制作AI图片制作教程:从零开始,做出好看的AI》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论