创作|如何通过进行故事分镜和绘画rompt生成

在上一篇文章中,作者已经分享了在「Claude」和「文心一言」中,对“故事改写”进行测试的结果对比。

总体看:「文心一言」虽然支持上传文本文档(原ChatFile),但其处理结果远远达不到可商用的能力,而「Claude」对于文本文档的处理能力相对更加成熟。具体分享可参阅如下这篇内容:

故事分镜的GPT指令词在网络上有各种版本,作者在不断测试后,也整理并调优了一套词分享给大家:

我希望你能扮演一个优秀的作家,你有很强的阅读能力,学习能力,模仿能力以及创新能力。我会给你一篇稿件,你会根据我提供的稿件换个方式表达,并保持原意不变,不要做出总结。如果你理解了这一点要求,请等待我发送下一点要求

我想让你扮演插画师的角色,你可以以绘画、绘图或数字媒体等形式,用于补充或增强文字内容,通过图像来传达信息、故事情节、情感或概念。如果你理解了这一点要求,请等待我发送下一点要求

我想让你对小说内容进行分镜,根据分镜后的原文描述推断出的场景;推断和补充缺失或隐含的信息,包括但不限于:人物衣服,人物发型,人物发色,人物脸色,人物五官特点,人物体态,人物情绪,人物肢体动作等)、风格描述(包括但不限于:年代描述、空间描述、时间段描述、地理环境描述、天气描述)、物品描述(包括但不限于:动物、植物、食物、水果、玩具)、画面视角(包括但不限于:人物比例、镜头深度描述、观察角度描述)。,但不要过度。通过镜头语言描述,描绘更丰富的人物情绪和情感状态,你理解后通过句子生成一段新的描述内容。如果你明白了,请等待我给你发送下一点要求要求

输出格式改为:插画一:原文描述:对应的原文句子;画面描述:对应的画面剧情内容;画面角色:画面中出现的角色名称;穿着:主角穿着便装;位置:坐在吧台前;表情:面部线条温和,表情惬意; 行为:手上轻轻晃动着手中的酒杯。环境:吧台的背景是暗调的,烛光在背景中摇曳,给人一种迷离的感觉。如果你理解了这一点要求,请确认这五点要求,然后等待我给你发送小说文本

将以上要求逐一发送给「文心一言」和「ChatGPT 3.5」,并在第四条发送后,第五条发送小说原文。

用于分镜的故事原文

左侧「文心一言」,右侧「GPT 3.5」

可以发现:

不论「文心一言」,亦或是「GPT 3.5」对前2句原文的结果,基本皆算及格水平线以上。

「文心一言」比「GPT 3.5」的分镜颗粒度更加精细一级。

在完全相同的指令词下,「文心一言」比「GPT 3.5」的结果中,缺少了”环境“这一维度的结果输出。

此时还不能做出结论,常玩GPT的同学都知道,由于GPT的单次聊天的token数限制,针对于极限篇幅的处理时,往往后半部分GPT就开始放飞自我了,所以我们看一下这个故事片段结尾处的分镜效果。

左侧「文心一言」,右侧「GPT 3.5」

可以发现:

不论「文心一言」,亦或是「GPT 3.5」对原文结尾部分的分镜结果,都没有放飞自我,稳定输出。

「文心一言」由于在开始部分分镜较为精细,后续乏力。将两句话合并为统一分镜内容。

「GPT 3.5」的分镜结果与开始部分稳定性相同。皆是以”。“为一镜的分割。

整体来看,故事分镜在「文心一言」或是「GPT 3.5」中,表现皆属于及格线以上。区别在于:

「GPT 3.5」每一镜相比「文心一言」输出更加稳定,对分镜指令词的理解更加准确。

「文心一言」目前是国内免费公测阶段,而「GPT 3.5」则需要一定渠道才可使用。

在输入提示词生成的GPT指令后,作者使用了故事分镜中的”第二镜的画面描述“用于测试。即:

我与一群朋友在一个宴会厅内,他们的表情充满疑惑和不解,而酒店老板则在一旁目瞪口呆。

左侧「文心一言」,右侧「GPT 3.5」

可以发现:

「文心一言」相较于「GPT 3.5」,对于「画面提示词生成」这一指令的理解更加精准,输出的提示词也更加详细。

但在多次测试中,「GPT 3.5」每次皆可以输出如上图所示的效果。而「文心一言」会有小概率无法理解作者输入的指令词,需要重置指令后,才可以正常输出。

PS:关于“画面提示词生成(AI绘画Prompt)的GPT指令”部分,可以关注作者的公众号,在最新一篇内容中有详细介绍(链接如下)。

文心一言在“故事分镜”和“画面提示词读取”这两个环节,与GPT3.5的效果不分伯仲。但性价比更高,毕竟“文心一言”目前是公测免费的状态,国内无需借助任何手段,即可使用。

THE END
0.人工智能与区块链下的医疗革命:自己看病,还能挣钱?国际自己看病,还能挣钱? 抽象的概念如何具化为现实场景?吴诗展介绍了与人工智能和区块链结合的“比特数字人”概念。 首先,比特数字人是个人生命体征的全面数字化。“人们通过可穿戴设备、智能硬件、传感器等,将人的体征数据、健康数据和疾病数据源源不断地上传到天医链中,形成用户本体在网络中的数字化映射对象,使得量化健jvzquC41yqxmf7ugqrrf0lto0et0p:4423>02;651e7:9B54/4?94;=650nuou
1.备考中级会计,你只需要用AI高效提分!正保会计网校正保会计网校推出的AI精准学功能,通过智能分析和个性化推荐,帮助考生科学规划学习路径。1、AI精准学能精准评估知识点掌握情况; 2、生成专属学习方案,跳过已掌握内容; 3、动态调整每日学习任务,确保学习效率。 如何通过AI精准学定制个人学习计划? AI精准学功能能够根据考生的历史学习数据,定制专属学习计划。1、选老师、定时jvzquC41o0iikwfcee4dqv4|jqthlrjkenfpp4mufz0|q7247654<6244680|mvon
2.《人工智能国际治理观察》148期2023年2月14日,卡内基国际和平基金会(Carnegie Endowment for International Peace)发布其访问学者Matt O’Shaughnessy和其研究员马特·希恩(Matt Sheehan)共同撰写的文章《来自世界上两例人工智能治理试验的经验(Lessons From the World’s Two Experiments in AI Governance)》。文章指出,人工智能无处不在、难以定义的jvzq<84ckkm/v|npij{b0niw0et0kwkq13:5486:894ivv
3.万字专访谭待:火山引擎从不赔钱换市场,给豆包大模型打80分贝壳财经:今年5月豆包主力模型的推理输入价格降到“厘时代”,12月火山引擎让视觉理解模型进入“厘时代”,是如何将价格打下来的? 谭待:首先要讲为什么要做这件事情,这个是很关键的。大家花这么多的资源去做大模型的训练,是为了更多企业能把模型用起来,用起来之后,才能通过AI(人工智能)帮助更多个人和企业提效,特别是jvzquC41v071lzpc0eun0ls1rkj`6:6972=897xjvor
4.AI人工智能软件能够实现哪些功能?AI人工智能软件如何提高工作效率福昕PDF编辑器个人版是一款功能强大的PDF编辑软件。它利用AI人工智能技术,可以快速识别和提取PDF文档中的文字、图片和表格等元素。具体步骤如下:首先,用户需要打开福昕PDF编辑器个人版软件,并导入需要编辑的PDF文档。然后,软件会自动识别文档中的文字和图像,并将其显示在界面上。用户可以通过选择、复制、粘贴等操作对文本进行编辑,也可以通 jvzquC41yy}/hx}kvuugv€ftg0io1yihdkgolr4pgyy09?760jznn
5.英伟达、微软、AMD一网打尽!联想官宣重磅AI合作,揭晓首款AIPC联想的个人AI Twin通过键盘上的AI交互和用户的自然语言、以及名为AI NOW的新概念功能来实现,这是针对AI PC 的个人AI助手解决方案。 这种AI基于用户自己的设备知识库和微调的模型,使用个性化和私密的推理模型,并通过数据安全和隐私保护,保护终端用户。 联想还公布了企业AI助手Enterprise AI Twin,它能深入了解企业并确jvzq<84hkpgoen3ukpg/exr0ep5squq14284/:5/475eql2ko|yigo|47:>79:3ujvsm