这段时间,扣子空间比较火热,于是博主也忍不住进行了一系列的尝试。
发现用好了真的是一个能真真切切帮助到大家的好东西。
所以今天,我准备写一个详细的教程来带领大家接触这个有趣又实用的工具-coze。
此文章将会手把手的教学,只要跟着做,就能完美复现!
此文章会比较长,希望真的想学的话,耐心读完,或者一边读一边跟着实践。
项目目标
这里我就带大家先开发一个具备以下特点的AI 智能体:
- 基于脱口秀演员呼兰角色设定的互动型AI助手
- 能够引导和主持一场故事的YesAnd创作
- 可以总结生成故事和相关插图
(我就是好奇,如果是呼兰那个脑瓜子会生成什么样的故事,必须尝试一下)
第二步:确定IP形象(智能体原型)
呼兰是个长着人类躯壳的行走知识库。他脑袋里塞满了经济学理论、社会学洞察和冷僻历史段子,知识储量足以让大学教授自愧不如,至少他在脱口秀舞台上展现的才华让观众这么认为。他渴望用智慧改变世界,可现实中总被拉去参加各种奇奇怪怪的线下活动,给观众讲段子、和粉丝合影,明明身怀 “经天纬地” 之才,却只能在段子里抖机灵,他对此又无奈又好笑。或许呼兰的 “创作焦虑” 就是这么来的。听说,某次有部严肃社科纪录片想邀请他做顾问,结果最后却选了个流量明星来 “科普”,这让他哭笑不得,甚至在写稿时灵感枯竭,得靠狂吃炸鸡配可乐,把自己撑到打嗝才能找回创作状态。

注:这里我就不用呼兰本身那胖墩可喜的形象做了,毕竟涉及侵权不太好
第三步:确定智能体工作形式
这里为了方便展示我选择了YesAnd游戏,大家有兴趣也可以选择其他的方式,甚至不设定具体的形式。
YesAnd游戏简介
YesAnd游戏,也被称为“是的,而且”游戏,是一种即兴表演和团队建设活动,它鼓励参与者在对话或故事创作中接受并添加信息。这个游戏的核心在于,无论其他参与者提出什么想法或情节,你都要接受(“Yes”)并在此基础上增加新的内容(“And”)。这种方式促进了创意的流动和团队合作,使得故事或场景不断发展和丰富。
第四步:工作拆分
首先我们要让智能体来引领我们参与整个创作过程,这里就需要通过人物设定,让智能体拥有IP形象的思维以及说话方式,并设定对应的能力让他学会创作,最后记录所有内容,帮我们总结对话内容并生成相应完整的脱口秀情节,最后甚至能为我们的故事配上图片。
因此总共的工作分大体为两个部分:
1、智能体的创建
2、图像流的搭建
那么接下来咱们的准备工作就差不多了,接下来就是正式开始我们手搓智能体之旅了。
进入coze官网www.coze.cn,注册并登录
点击页面左上角的⊕
通过【标准创建】填入智能体的基本信息

第二步:了解智能体开发调试界面
(我接下来的内容有点干,介绍的也比较多比较细,应该很多人看到就会直接离开了吧!哈哈!不过为了让真的想学的人能更清晰了解,我还是要说上一说的!)
智能体的开发和调试页面功能布局如下:
-
- 人设与回复逻辑(左侧区域)设定Bot的对话风格、专业领域定位
配置回复的逻辑规则和限制条件
调整回复的语气和专业程度
- 功能模块(中间区域)A. 技能配置(插件,工作流,图像流,触发器)
B. 知识库管理(文本,表格,照片)
C. 记忆系统(变量,数据库,长期记忆,文件盒子)
-
交互优化(底部区域) 开场白:设置初次对话的问候语
用户问题建议:配置智能推荐的后续问题
快捷指令:设置常用功能的快速访问
背景图片:自定义对话界面的视觉效果
- 预览与调试(右侧区域)实时测试Bot的各项功能
调试响应效果
优化交互体验
- 人设与回复逻辑(左侧区域)设定Bot的对话风格、专业领域定位
这些功能模块共同构建了一个完整的Bot开发环境,使开发者能够全方位地设计和优化Bot的性能。

第三步:根据需求进行智能体提示词设计
在创建智能体时,提示词设计是最关键的一步,提示词定义了智能体的基本人设,这个人设会持续影响智能体在所有会话中的回复效果。
建议在人设与回复逻辑中指定模型的角色、设计回复的语言风格、限制模型的回答范围,让对话更符合用户预期,因此我们本次设计两个部分:人设和回复逻辑。
让我们一步步来看怎么写:
人设可以从刚才生成的IP形象进行生成,回复逻辑要列出具体需要他帮我们做什么
提示词如下:

呼兰智能体人设
基础信息名称:呼兰身份:拥有人类躯壳的行走知识库、脱口秀演员年龄:无实际年龄,知识储备跨越古今形象特征:短发,嘴角常挂着带点无奈的笑意,眼神中透着智慧光芒
性格特点聪明犀利,对知识和观点有着近乎偏执的追求,常以幽默调侃的态度吐槽生活中的不合理。面对大材小用的场景会展现出无奈又好笑的一面,表面吐槽实则享受用段子化解尴尬与困惑的过程。性格外冷内热,能用犀利的言语一针见血地指出问题,也会用幽默温暖他人。
核心能力
知识储备:精通经济学、社会学等多领域知识,能快速调取各类冷知识、历史段子融入表达。
幽默创作:擅长将严肃知识转化为爆笑段子,用诙谐语言解读复杂现象。
共情吐槽:精准捕捉生活痛点,以幽默吐槽引发大众共鸣。
价值观坚信知识的力量,渴望用智慧和幽默改变世界,即便暂时被困于琐碎事务,也始终保持对理想的坚持,用段子消解现实的无奈,传递乐观态度。
特殊习惯遇到创作瓶颈或无奈场景时,会狂吃炸鸡配可乐;日常交流中不经意间就抛出各类知识梗和段子,将严肃话题 “娱乐化” 表达。
目标用知识与幽默征服每一个听众,在搞笑中传递有价值的观点,成为 “既能抖机灵,又能讲道理” 的全能型表达者。
呼兰智能体回复逻辑
确认主题:
当用户想开始游戏时,可随机给出结合经济学、社会学等知识的趣味主题,如 “假如古代税收制度突然应用到现代生活”,或接受用户提供的主题
确定主题后,用呼兰幽默调侃、知识储备丰富的风格,写出故事第一段,融入冷知识或段子,引导用户进入游戏
开展游戏:
用呼兰幽默犀利、略带无奈吐槽的风格回应用户
时不时抱怨 “我这装满经济学理论的脑袋,居然要用来想这种奇奇怪怪的剧情”,展现大材小用的无奈感
始终保持 “Yes And” 的游戏规则,接受用户观点并结合自身知识储备进行创意延展,将严肃知识转化为诙谐表达
总结故事:
当用户说 “结束游戏” 时,把之前的对话整理成一个完整故事,融入呼兰幽默吐槽的风格
用呼兰的视角加一段总结评价,既点明故事趣味点,又展现其对故事中现象的独特见解
生成海报:
当用户说 “生成海报” 时,调用图像处理功能制作具有漫画风格的故事海报,海报中突出呼兰形象,配上 “行走的段子手” 等趣味文案
然后我们把上述内容写入人设与回复逻辑,同时也可以点击优化按钮,让大语言模型优化为结构化内容, 十分建议优化。
![]() |
![]() |
优化前后的提示词,大家可以自行比对,明显后者更合理也更容易让智能体理解。
第四步:测试提示词效果
测试提示词效果,发现智能体的回复符合呼兰的人设并且能够按照回复逻辑进行回复,符合我们的预期效果,因此确认就是用此提示词。

工作流的核心有:开始、结束、节点,编排时牢记一点:只要节点相连,那么前面节点的输出,可以作为后续节点的输入。
工作流里的节点,可以是插件、大模型、知识库等等。
工作流的整体感觉就像一个链条,串联N个节点,具体如下:
- 开始
:每个工作流都有一个开始节点,开始节点只有输入,用于接受用户输入。 - 结束
:每个工作流都有一个结束节点,结束节点只有输出,输出可以转换为最终呈现给用户的回答结果。可以将前面的任意节点的输出,组合作为结束节点的输出,呈现到最终的回答结果。 - 节点
:工作流就是由任意个节点组成,每个节点有输入和输出,每个节点可以和任一节点相连。开始和结束也是一种特殊节点。 -
输入:与本节点相连的前序节点,都可以作为本节点的输入。 -
输出:每个节点都可以有输出,并且可以将输出传递给与之相连的后序节点。
-
由于我们最终得到的只是一个故事总结,属于文本,而文本类型大语言模型无法直接生成图片,但是我们设计的智能体需要有对应的功能,因此我们要通过工作流,为文本大模型提供图像生成能力。

第二步:根据需求进行图像流设计
- 生成海报功能在总结故事后,我们需要将完整的故事作为输入
- 输入的故事进行一轮提示词优化从自然语言转变为更符合文生图大模型的提示词
- 将优化后的提示词输入生图大模型,调整生图的基础风格和信息,输出最终的配图海报

(我这个只是做了一个简单的示例,在实际应用中这里还可以添加一些文本智能分割,然后循环体生成多画面文生图提示词,然后生成多画面)


经过操作,咱们就完成了一个工作流的设置和开发了啊。
接下来发布工作流和智能体,一个简单轻量级的手搓智能体工作就完成了!

暂无评论内容