AI教程之图片制作AI图片制作教程:从零开始,做出好看的AI

admin 2026-05-20 04:48:23 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 该教程系统介绍AI图片制作全流程,涵盖扩散模型原理、主流工具对比(Midjourney、DALL-E3、StableDiffusion等)、提示词六大模块结构化写法、风格控制技巧及Midjourney实战操作。核心结论表明具体化描述与模块化提示词可显著提升出图质量,并提供十大优化技巧如镜头焦距设定、光线情绪渲染等解决常见问题如人物手指变形。 综合评分: 85 文章分类: AI安全,安全培训,技术标准,解决方案,应用安全


cover_image

AI教程之图片制作AI图片制作教程:从零开始,做出好看的AI

原创

amuxiaohuo amuxiaohuo

黑客网络安全

2026年5月13日 09:06 广东

在小说阅读器读本章

去阅读

一句话描述,电脑帮你画出一张专业插画——这件几年前听起来像天方夜谭的事,今天已经成了普通人触手可及的工具。本文手把手教你掌握AI绘图的完整方法,从选工具到写提示词,从控制风格到优化细节,全部讲清楚。


一、AI绘图能做什么

AI绘图工具的核心技术叫”扩散模型”。它的原理是:用几十亿张图片训练神经网络,让它学会视觉规律,当你输入一段文字,AI把文字转化成数学向量,在庞大的视觉知识库里找到最匹配的内容,一步步”去噪”生成图像。

你不需要懂这些细节,你只需要知道:AI能看懂你写的文字,并把它变成图片。

目前AI绘图广泛用于以下场景:

  • 个人创作

    :头像、壁纸、艺术插画、故事绘本

  • 内容创作

    :文章配图、公众号封面、小红书图片

  • 商业设计

    :电商主图、广告素材、产品场景图

  • 游戏影视

    :概念艺术、角色设计、分镜参考

  • 教育科普

    :教学插图、信息图表

当然,AI绘图也有局限:图片内嵌文字容易出错,人物手指容易变形,同一角色跨图保持一致性比较难。了解这些,是为了在遇到问题时知道该换什么思路。


二、主流工具对比,选对工具少走弯路

市面工具不少,但真正值得花时间学习的就几个,下面逐一介绍。

Midjourney —— 艺术感最强

Midjourney是目前公认艺术感最强的工具。它生成的图片构图讲究、色调协调,即便随手一条提示词,出来的效果也往往令人惊艳。

  • 费用

    :付费订阅,10美元/月起

  • 平台

    :Discord(有轻微上手门槛)

  • 优点

    :美学输出顶级,风格统一

  • 缺点

    :需付费,对精准控制支持较弱

  • 适合

    :追求高质量艺术图的创作者

DALL-E 3 —— 最适合新手

集成在ChatGPT里,对中文支持极好,理解自然语言能力强,上手几乎零门槛。直接用中文描述你想要的图,它就能生成。

  • 费用

    :ChatGPT Plus,20美元/月(也有免费次数)

  • 平台

    :网页/App

  • 优点

    :中文友好,理解力强,操作最简单

  • 缺点

    :风格偏商业插画,个性相对弱

  • 适合

    :初学者、办公场景快速出图

Stable Diffusion —— 最强可控性

开源免费,可本地部署,有数千种社区模型和插件,可控性极高。能做到其他工具做不到的精细定制。

  • 费用

    :免费(本地运行需要显卡)

  • 平台

    :本地部署 / 在线平台(如Civitai、LiblibAI)

  • 优点

    :完全免费,高度可定制,社区资源丰富

  • 缺点

    :学习曲线陡峭,需要技术基础

  • 适合

    :有折腾精神的技术用户、专业创作者

国内工具 —— 入门首选

即梦(字节出品)、通义万相、文心一格等,中文提示词支持好,有免费额度,非常适合入门试水。


如何选择

  • 完全新手 → 先用即梦DALL-E 3,找到感觉
  • 追求艺术感 → 投入Midjourney
  • 想深度定制、不想花钱 → 学Stable Diffusion
  • Adobe设计师 → 用Firefly(PS内置)

三、提示词的底层逻辑:越具体越好

提示词(Prompt)是你与AI沟通的语言。它不是魔法咒语,而是有规律可循的信息传递方式。

AI是如何”读懂”提示词的?

你写的每个词,都会被转化为数学向量,影响最终图像。靠前的词权重更高,重复强调的词权重更高,模型在训练中见过更多的专业术语(比如艺术家名字)权重也更高。

三个核心认知:

① 具体胜于抽象

“美丽的风景”不如”阿尔卑斯山脉的清晨,前景是枯黄草地和古旧木屋,远处雪峰在粉色晨光中”。AI的训练数据是具体的图片,越具体的描述,越能命中它学到的视觉内容。

② 词序影响权重

把最重要的内容——主体、风格——放在提示词开头,细节补充放后面。

③ 正向描述胜于负向描述

不要在主提示词里写”没有文字,没有边框”,要写”干净背景,纯色背景”。负向排除用专门的”负面提示词”(Negative Prompt)功能。


四、提示词结构:专业写法的六大模块

一个专业的提示词通常包含六个模块,按顺序组合效果最稳定:[主体描述] + [环境场景] + [艺术风格] + [光线氛围] + [质量参数] + [负面提示]

模块一:主体描述(最重要)

主体是画面核心,要尽可能具体,包括外观、状态、表情、动作。

❌ 差的写法:一个美丽的女孩

✅ 好的写法:

一位20多岁的年轻亚洲女性,一头飘逸的黑发,

穿着复古米色亚麻连衣裙,坐在

阳光明媚的窗户上挂着温暖的笑容,双手搂着

陶瓷咖啡杯

差别在哪里:好的写法明确了年龄、发型、服装、动作、情绪、道具,AI不需要”猜测”,自然输出更符合预期。

模块二:环境场景

描述时间、地点、天气:

在舒适的咖啡馆里,温暖的午后阳光,秋叶

透过窗户可见,柔和的散景背景

模块三:艺术风格

这是决定图片气质的关键词。常用写法:

  • 引用艺术家名:in the style of Monet(莫奈风格)、Studio Ghibli style(吉卜力风格)
  • 描述媒介:oil painting(油画)、watercolor(水彩)、pencil sketch(铅笔素描)、digital illustration(数字插画)
  • 描述风格流派:cyberpunk(赛博朋克)、minimalist(极简主义)、Art Deco(装饰艺术)

模块四:光线氛围

光线对图片情绪影响极大,是最容易被忽略却效果最显著的参数:

| 关键词 | 效果 | | — | — | | golden hour lighting | 黄金时段的温暖橙光 | | dramatic side lighting | 戏剧性侧光,强对比 | | soft diffused light | 柔和散射光,温柔氛围 | | cinematic lighting | 电影感打光 | | neon lights | 霓虹灯氛围 | | moonlight | 月光,清冷神秘 |

模块五:质量参数

添加这些词可以提升整体精细度:highly detailed, 8K resolution, sharp focus, professional photography, masterpiece, best quality

在Midjourney中还可以加版本参数:--v 6.1``--ar 16:9(宽高比)--s 750(风格化强度)

模块六:负面提示词

告诉AI你不想看到什么。常用通用负面提示词:blurry, low quality, deformed hands, extra fingers, bad anatomy, watermark, text, signature, ugly, poorly drawn


五、完整提示词实战示例

把以上模块组合起来,看两个完整案例。

案例一:城市夜景插画

提示词:

夜晚霓虹灯闪烁的赛博朋克城市鸟瞰图,高耸

摩天大楼上用中文和日文写着发光的广告,

洒满雨水的街道反射着五颜六色的灯光和小人物

伞在下面走,远处有雾,

电影照明、超精细数字插图,

8K分辨率,采用《银翼杀手2049》风格

负面提示词:模糊、低质量、日光、卡通、动漫、水印

关键分析:主体是城市鸟瞰,明确了科幻赛博朋克风格,加入了霓虹灯、雨水反射、雾气等细节,引用了《银翼杀手2049》的风格参考,光线用”电影感打光”定调。


案例二:新中式人物肖像

提示词:

一位30多岁的优雅中国女性的肖像,穿着

丝绸旗袍,精致的花朵刺绣,坐在

传统的花园亭被盛开的牡丹所环绕,

柔和的晨光透过竹叶,

宁静而优美的表情,中国传统水墨

绘画风格细腻,细节细腻,

专业肖像摄影构图

关键分析:民族文化元素(旗袍、牡丹、亭台)+ 光线设定(清晨柔光)+ 混合风格(国画水墨+水彩)= 独特的新中式审美。


六、风格控制:让图片有自己的气质

风格是AI图片的灵魂。以下几类风格控制方式效果最稳定。

引用艺术家名字

这是最直接、效果最强的风格控制方式:

  • in the style of Van Gogh

    — 梵高的粗犷笔触和强烈色彩

  • Hayao Miyazaki style

    — 宫崎骏的温暖童话感

  • Greg Rutkowski

    — 当代奇幻艺术,史诗级光效

  • Alphonse Mucha

    — 新艺术运动,装饰性线条

  • Zaha Hadid style

    — 流线型建筑美学

用媒介描述风格oil painting on canvas(布面油画) vintage film photograph(胶片老照片) traditional Chinese ink wash painting(中国水墨画) Risograph print(日式胶版印刷,有颗粒感) linocut print(版画,粗犷线条)

#

用时代背景定风格1920s Art Deco poster(二十年代装饰艺术海报) 1980s synthwave aesthetic(八十年代合成波) 90s anime style(九十年代日本动漫风)


七、Midjourney实战操作步骤

Midjourney是最多人使用的工具,这里专门讲操作流程。

第一步:进入Discord并加入Midjourney服务器

访问 midjourney.com,点击”Join the Beta”,用Discord账号登录后加入官方服务器,找到任意 #newbies 频道即可开始使用。

第二步:订阅计划

在对话框输入 /subscribe,根据需求选择订阅方案。基础版每月10美元,包含约200张图的生成量;标准版每月30美元,包含无限放松模式生成。

第三步:发送提示词

在频道对话框输入 /imagine,选择弹出的命令,然后在 prompt 栏输入你的提示词,回车发送。

第四步:理解生成结果

大约一分钟后,AI会生成一张包含4个选项的预览图。图片下方有8个按钮:

  • U1~U4

    :Upscale(放大精细化某一张)

  • V1~V4

    :Variation(基于某一张生成变体)

先看4张图选出最喜欢的,再点U放大,最后还可以点**Vary(Subtle)做小幅调整,或者Vary(Strong)**做大幅变体。

第五步:常用参数速查

在提示词末尾加上这些参数,直接影响输出效果:

–ar 16:9       宽高比16:9(横屏) --ar 9:16       宽高比9:16(竖屏/手机壁纸) --ar 1:1        正方形 --s 200         风格化强度低(更写实) --s 1000        风格化强度高(更艺术) --chaos 50      增加随机性,结果更多样 --no text       排除文字(等同于负面提示) --v 6.1         使用最新版本模型


八、让图片更好看的十个实战技巧

掌握了基本操作之后,这十个技巧能让你的出图质量明显提升。

技巧一:用情绪词定调

在提示词中加入情绪或氛围词,AI会理解整体基调:melancholic(忧郁)、ethereal(空灵)、nostalgic(怀旧)、epic(史诗感)、cozy(温馨)。

技巧二:指定镜头焦距

摄影类图片加入镜头参数,视觉效果截然不同:35mm lens(街拍感)、85mm portrait lens(人像虚化)、wide angle lens(广角宏大感)、macro photography(微距特写)。

技巧三:用光线制造情绪

“黄金时段光线”(golden hour)几乎是万能的加分项,能让任何普通场景变得有电影感。backlit(逆光)则适合营造轮廓光和神秘感。

技巧四:加入材质细节

材质词让图片更有质感:velvet texture(丝绒质感)、worn leather(做旧皮革)、frosted glass(磨砂玻璃)、rough concrete(粗糙混凝土)。

技巧五:颜色方案要统一

不要堆砌所有颜色,要指定一个主色调方案:muted earth tones(低饱和大地色)、pastel color palette(马卡龙色系)、monochromatic blue tones(蓝色单色调)、high contrast black and white(高对比黑白)。

技巧六:参考具体的电影或摄影师

cinematic shot from Wes Anderson film(韦斯·安德森电影感)、National Geographic photography style(国家地理摄影风格)——这类具体参考往往比抽象描述更精准。

技巧七:控制画面主次

告诉AI主体占画面多大比例:close-up portrait(脸部特写)、full body shot(全身)、wide establishing shot(大全景)、rule of thirds composition(三分法构图)。

技巧八:迭代而非重新开始

看到一张大方向对但细节不满意的图,用V(Variation)生成变体,而不是修改提示词重新生成。通过多轮变体逐步逼近理想效果,比每次大改提示词效率高很多。

技巧九:保存好的提示词

当你找到一条出图稳定的提示词,一定要记录下来。建议建一个文档,分类整理”风景类””人物类””产品类”等,下次直接调用和修改,效率翻倍。

技巧十:向社区学习

Midjourney官方网站的Explore页面、Civitai社区、Pinterest的AI art板块,都是学习提示词和参考风格的宝库。看到喜欢的图,点开查看它的提示词,分析学习,是进步最快的方式。


九、常见问题与解决方法

Q:为什么我的人物手指总是变形?

A:这是目前所有AI工具的通病,扩散模型对”手”的学习还不够精准。解决方法:在负面提示词中加入 deformed hands, extra fingers, bad anatomy;或者使用ControlNet(Stable Diffusion的插件)进行精确控制;或者生成后用Photoshop的”创成式填充”功能修复局部。

Q:我的提示词写得很长,为什么出图效果还是很普通?

A:长不等于好。提示词的质量比数量更重要。很多初学者会堆砌大量词汇,但这往往导致AI”顾此失彼”。建议先只写核心描述(主体+风格),等效果方向对了,再逐步加入细节词。另外检查词序,最重要的内容一定在最前面。

Q:同样的提示词,每次出的图都不一样,能固定吗?

A:AI生成本身有随机性,这是由设计决定的。在Stable Diffusion里,可以固定”随机种子”(Seed)来复现同一张图。Midjourney目前不直接支持固定种子,但可以用已有图片的种子值参数 --seed XXXX 让结果更接近某次生成。

Q:生成的图片可以商用吗?

A:不同工具规则不同。Midjourney的付费用户默认获得商业使用权,但具体条款请查看官方协议;DALL-E 3生成的图片OpenAI允许商用;Stable Diffusion因为是开源工具,本身无使用限制,但如果你使用了基于特定艺术家数据训练的模型,可能存在版权争议。Adobe Firefly是目前版权最清晰的商业工具。


十、学习路线建议

如果你是刚入门的新手,建议按照以下路线循序渐进:

第一阶段(1~2周):找感觉

选择一个工具(推荐即梦或DALL-E 3),每天用中文生成10~20张图,不追求完美,只是熟悉工具响应,建立对提示词和效果关系的基本直觉。

第二阶段(1个月):学结构

开始学习本文介绍的六模块提示词结构,每次生成都用规范格式写提示词。同时开始收集喜欢的AI图片,分析它们的提示词。

第三阶段(持续):专攻一个方向

根据自己的需求,选择一个细分方向深入:人像摄影感、风景插画、商业产品图、赛博朋克概念艺术……专注在一个风格里反复打磨,比什么都浅尝一遍成长快得多。

第四阶段(进阶):学后期处理

AI出图只是第一步,配合Photoshop的创成式填充、Lightroom的调色、甚至Topaz的AI超清放大,才能做出真正专业级别的最终作品。


结语

AI绘图工具的本质,是一种创意放大器。它不会替代你的审美判断,也不会代替你对美的感知和理解——它只是把这些变成了可执行的东西。你对画面的理解越深,你写出的提示词就越准确,AI能帮你实现的就越多。

学好AI绘图,不是在学一项软件技能,而是在学一种新的视觉语言。

从今天开始,打开工具,输入第一条提示词。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:黑客网络安全 amuxiaohuo amuxiaohuo《AI教程之图片制作AI图片制作教程:从零开始,做出好看的AI》

涉W资讯专刊-第7期 网络安全文章

涉W资讯专刊-第7期

文章总结: 该文档为网络安全资讯简报第7期,包含16条今日导读内容,主要涉及开源信息7条、暗网论坛8条及勒索网站1条,并预告将推出AI攻防动态等专题。文档仅提供
评论:0   参与:  0