这是一个非常好的问题。对于制作绘本来说,最核心的需求不仅是“多”,更是“一致性”(同一个角色、同一种画风在不同场景中保持不变)。
首先要明确一点:目前的绝大多数主流AI绘画工具(如Midjourney, DALL-E 3, Stable Diffusion等),通常一次交互只能生成一张图片,或者一个包含4张小图的网格。它们很难做到像“打印机”一样,你输入一个长故事,它一次性吐出20页完美的、连续的绘本插图。
但是,我们可以通过特定的工作流和技巧,来“曲线救国”,高效地生成一套连贯的绘本图片。
以下是为你整理的针对绘本创作的“批量化 + 一致性”生成策略:
核心策略:从“单张生成”转向“连续工作流”
制作绘本不能指望“一键生成全书”,而是要分三步走:定角色/风格 -> 定分镜 -> 批量生产。
方法一:利用“角色设定图(Character Sheet)”确立一致性
这是目前最有效的方法。在开始画故事之前,先画好主角的“说明书”。
-
第一步:生成角色设定图 通过一个复杂的提示词,要求AI在一个画面里画出角色的多角度、多表情。
- 提示词范例(以Midjourney为例):
Character design sheet for a cute little fox girl named Lily, wearing a green overall dress. multiple poses and expressions, happy, sad, running, jumping, full body view, side view, back view, watercolor illustration style for children's book, white background --ar 16:9 --niji 6 (角色设计图,一只名叫Lily的可爱小狐狸女孩,穿着绿色背带裙。多种姿势和表情,开心,难过,跑,跳,全身视图,侧视图,后视图,儿童绘本水彩画风格,白背景)
- 提示词范例(以Midjourney为例):
-
第二步:固定风格和角色
- Midjourney用户: 拿到满意的设定图后,右键复制图片链接。在后续每一张图的提示词最前方,都加上这个链接作为参考(Image Prompt)。
- Stable Diffusion用户: 使用“ControlNet”配合“Reference only”或“IP-Adapter”模型,锁定角色的特征。
- DALL-E 3用户(如ChatGPT内置版): 它是对话式的。你可以先生成角色,然后告诉它:“保持上一张图片中的小狐狸角色和水彩风格不变,现在让她在森林里采蘑菇。”
-
第三步:根据分镜逐张生成 有了固定的角色参考,你就可以快速生成不同场景了,因为AI已经“认识”了这个角色。
方法二:巧用“网格图”或“分镜图”提示词 (一次生成多图的变通法)
如果你希望一次性看到多个画面,可以通过提示词让AI把一张大图分割成几个小图。
-
适用场景: 快速构思故事板、生成简单的四格漫画。
-
提示词技巧: 使用诸如 "split panel", "comic strip layout", "4-panel grid", "storyboard" 等词汇。
-
提示词范例:
A 4-panel comic strip layout showing a story sequence. Panel 1: A boy finds a mysterious seed. Panel 2: The boy plants the seed in a pot. Panel 3: It rains and a giant beanstalk grows. Panel 4: The boy looks up at the beanstalk in amazement. Children's book illustration style, consistent character style. --ar 2:3 (一个四格漫画布局,展示一个故事序列。第一格:男孩发现神秘种子。第二格:男孩种下种子。第三格:下雨了,长出巨大豆茎。第四格:男孩惊讶地看着豆茎。儿童绘本风格,角色风格一致。)
-
缺点: 这种方法生成的图片分辨率较低,通常需要后期裁剪并放大。
方法三:使用“种子值(Seed)”锁定画面特征(进阶)
在AI绘画中,每一个生成的图像都有一个唯一的数字身份证,叫“Seed”。如果你使用相同的提示词和相同的Seed,理论上会得到一模一样的图。
- 如何用于绘本: 你可以找到一个满意的画面风格和角色的Seed值,然后在后续的生成中,稍微修改提示词中的动作或环境,但强制使用这个Seed值。这有助于保持整体氛围和构图的某种连贯性(虽然不如方法一的角色锁定那么精准)。
方法四:借助第三方批量工具或脚本(高阶玩家)
对于Stable Diffusion WebUI的用户,可以使用一些插件来实现真正的批量化:
- XYZ Plot脚本: 你可以设置一个X轴为不同的动作(跑、跳、睡),Y轴为不同的场景(森林、家里、学校),然后让AI自动跑一个矩阵表格出来。
- Dynamic Prompts插件: 允许你编写带有变量的提示词,比如
{在森林里|在沙滩上|在屋顶上},一只猫在{睡觉|吃鱼|玩球},AI会自动组合这些变量批量生成几十张图。
总结:绘本创作的建议工作流程
不要追求“一次生成20张”,要追求“高质量、一致性的连续生成”。
- 先写好文本故事和分镜脚本。 (例如:P1: 小熊起床;P2: 小熊刷牙;P3: 小熊出门...)
- 花最多的时间打磨第一张图(角色设定)。 确保风格、色彩、角色形象完美。
- 利用第一张图作为“锚点”(通过图片链接参考、Seed值或对话上下文),开始一张一张地生成后续分镜。
- 后期处理: AI生成的图片通常还需要在Photoshop等软件中进行微调、排版和加字。
如果你使用的是ChatGPT中的DALL-E 3,最好的办法是进行长对话。
- “请设计一只名叫波波的蓝色小象,它是绘本主角,画风要像蜡笔画。”(生成成功后)
- “很好,保持波波的样子和蜡笔画风。现在画一张波波在河边用鼻子喷水的图。”
- “保持一致。下一张,波波遇到了这只红色的小鸟(上传小鸟参考图),它们在打招呼。”
通过这种“保持一致”的指令,是在目前的技术条件下,实现绘本批量生产最现实的路径。