这几天,一部名为《 完蛋!我被美女包围了!》的游戏爆火了。这是一款全动态影像单人视觉小说游戏。

视觉小说,能否用生成式AI来制作?

我之前一直想测试#视觉小说工作流,今天抽空花了2个小时快速地验证下整体的流程。

主要使用了以下几种工具/技术:

Ren’Py

Ren’Py是一个开源的视觉小说引擎——帮助你使用文字、图像和声音来讲述互动故事。类似于Markdown语言,提供了易于使用的脚本语言,任何人都可以高效地撰写大型视觉小说。

LLM – ChatGPT

自发布以来,展示了非常强大的文字生成能力,可以根据规则和任务要求执行文本的生成任务。

MixCopilot

知识引擎,提供AI工作流编辑和执行功能,完成AI使用流程的自动化。

ComfyUI

基于Stable diffusion的节点式UI,低显存占用,完成SD使用流程的自动化。

测试的DEMO效果如下视频所示:

创建游戏

使用Ren’Py新建游戏,主要修改script.rpy文件。

visual code编辑器里安装插件

所涉及的语法,本次主要包括人物定义,对白,旁白,图像和转场。

把生成的文字粘贴到script.rpy 里,重新加载游戏,体验下效果:


接下来,填充视觉小说的剧情对白和图像。

# 编写prompt

设计prompt,实现故事的生成和格式化。

1 / 生成故事

2/让LLM学会输出renpy文件格式

# 搭建工作流

使用 MixCopilot 的用户输入和自定义 prompt 节点,完成文字生成工作流。

有了稳定的工作流,我们开始批量生产制作100款。

故事工作流:

# 图像生成工作流实现

使用 Comfyui 生成图像的工作流搭建,先把生成的故事,继续让 LLM 来描绘里面的画面,使用简单的 prompt,比如:“描绘下 medieval_forest 的画面”。把AI返回的图像描述粘贴到 Comfyui 的文字输入里,依次创建不同图像的生成流程。

本次实验耗时不多2小时完成了全部流程,整个流程还有很大的优化空间,主要包括:

renpy脚本生成的语法规则细化,比如人物出现在画面哪个位置这个语法的添加:

show xiaoming at right

人物表情的生成,需要在脚本生成时考虑不同的表情,并输出图像的描述。

图像描述生成,需要在脚本生成的时候,同时把涉及的场景、人物等图像描述,分类输出,供comfyui节点使用。

针对场景、人物的模型优化,游戏风格、人物角色的一致性、场景细节等等需要分别优化。比如,针对人物,还需要优化抠图细节,避免破损等情况。


生成式人工智能让我们拥有了豪华的文案和具有创意的视觉团队,通过工作流的搭建,实现了流程的自动化,让创作具备了产品化的可能。如果你对工作流感兴趣,欢迎交流。