image-cog技能使用说明
Image Cog - 由CellCog驱动的AI图像生成
使用AI创建专业图像 - 从单张图像到一致性角色集,再到产品摄影。
先决条件
此技能需要cellcog技能来进行SDK设置和API调用。
clawhub install cellcog
首先阅读cellcog技能以进行SDK设置。本技能向您展示可实现的功能。
快速模式 (v1.0+):
# 即发即弃 - 立即返回
result = client.create_chat(
prompt="[您的图像请求]",
notify_session_key="agent:main:main",
task_label="image-task",
chat_mode="agent" # 简单图像使用"agent",复杂图像使用"agent team"
)
# 守护进程完成后通知您 - 请勿轮询
我们使用哪些模型
| 模型 | 提供商 | 主要用途 |
|---|---|---|
| Nano Banana 2(Gemini 3.1 Flash Image) | 默认图像生成 — 逼真场景、复杂构图、文本渲染、多轮角色一致性 | |
| GPT Image 1.5 | OpenAI | 透明背景图像 — 徽标、贴纸、产品抠图、叠加图形 |
| Recraft | Recraft AI | 可缩放矢量插图 (SVG) 和图标生成 |
Nano Banana 2是所有图像生成的默认模型。CellCog的智能代理会在任务需要时智能地路由到其他模型 — 例如,透明PNG会自动由GPT Image 1.5处理,矢量/图标请求则发送给Recraft。如果您希望使用特定模型,只需在提示中提及即可 (例如,"使用ChatGPT/OpenAI图像生成")。
您可以创建哪些图像
单张图像创建
根据文本描述生成任何图像:
- 场景:"清晨阳光透过窗户洒入的舒适咖啡馆内部"
- 肖像:"身着商务装、充满自信女性的专业头像照"
- 产品:"大理石表面上一双白色运动鞋的极简主义产品图"
- 抽象"海军蓝与金色的几何抽象艺术"
- 自然:"日出时分雾霭笼罩的山景,一位孤独的徒步者"
图像编辑
转换现有图像:
- 风格迁移:"将这张照片转换成水彩画风格"
- 背景移除:"移除背景并置于干净的白色背景上"
- 增强:"增强色彩并添加戏剧性的光影效果"
- 修改:"将人物的服装改成红色连衣裙"
一致性角色
创建同一角色在不同场景下的多张图像:
- 角色系列:"创建一个科技创业者角色,然后展示他们:1) 在办公桌前编程,2) 向投资者展示,3) 庆祝产品发布"
- 吉祥物变体:"设计一个友好的机器人吉祥物,然后为以下场景创建版本:欢迎页面、错误页面、成功信息页面、加载屏幕"
- 故事序列:"创建一个主角,然后用5个场景来描绘他们的旅程"
这对于以下方面非常有用:
- 漫画条和故事板
- 具有一致性角色的营销活动
- 视频帧生成
- 跨不同情境的品牌吉祥物
产品摄影风格
专业产品视觉效果:
- 主视觉图:"智能手表在渐变背景上的产品主视觉图"
- 生活方式图:"人物在现代客厅中使用智能手机"
- 平铺展示:"护肤品的平铺展示,搭配植物元素"
- 360度视图:"皮制手提包的多个角度视图 - 正面、侧面、背面、细节"
相关图像集
为宣传活动或系列创建多张风格统一的图像:
- 社交媒体套装"为健身品牌设计5张Instagram帖子图片 - 风格统一,内容多样"
- 网站主视觉图:"为SaaS产品落地页设计3张主视觉图 - 专业、现代、科技感"
- 广告变体:"4个版本的产品广告,背景和氛围各不相同"
- 博客插图:"为一篇关于效率技巧的博客文章设计一套6张插图"
基于参考的生成
使用现有图片作为风格、角色或构图的参考:
- 风格匹配:"参照此示例的艺术风格,创作一张新图片"
- 角色一致性:"以此人物为参考,创作一个他们正在徒步的新场景"
- 品牌一致性:"创建符合此品牌视觉风格的产品图片"
- 构图参考:"创建类似构图,但使用不同的主体"
图像规格
| 方面 | 选项 |
|---|---|
| 长宽比 | 1:1(正方形)、16:9、9:16、4:3、3:4、3:2、2:3、21:9 |
| 尺寸 | 1K(约1024像素)、2K(约2048像素)、4K(约4096像素) |
| 风格 | 照片写实、插画、水彩、油画、动漫、数字艺术、矢量图 |
| 格式 | PNG(默认) |
尺寸推荐:
- 1K:快速迭代、缩略图、社交媒体帖子、草稿
- 2K:标准网页内容、演示文稿、营销材料
- 4K:主视觉图、印刷材料、注重细节的最终交付成果
何时使用智能体团队模式
对于图像生成,chat_mode="智能体团队"推荐用于:
- 需要多种元素的复杂场景
- 保持角色一致性的系列
- 需要分析的基于参考图像的生成
- 一组相关的图像
对于简单的单一图像,`chat_mode="agent"`可以工作得更快。
示例图像提示
专业肖像照:
"创建一张30多岁、友善的亚洲女性的专业肖像照,身穿海军蓝西装外套,柔和的影棚灯光,中性灰色背景,表情自信但平易近人。1:1方形,2K画质,照片级真实感。"
产品摄影:
"高端无线耳机充电盒的产品照片,哑光黑色表面,置于带有微妙蓝色点缀灯光的反光深色表面上。极简主义、高端科技美学。4:3横向,4K画质用于主图。"
一致性角色系列:
"创建一个角色:年轻的黑人男性软件开发人员,休闲风格戴眼镜,态度友善。然后创建4张图像:
- 在站立式办公桌前工作,面前有多个显示器
- 在视频会议中,正在解释某事
- 在咖啡店用笔记本电脑,思考中
- 与团队庆祝,击掌 确保所有图像中的角色完全保持一致。"
社交媒体系列:
"为一个植物性膳食配送服务创建5个Instagram帖子:"
- 俯瞰视角下的多彩佛陀碗
- 开心的人正在拆快递包裹
- 整齐排列的备餐盒
- 新鲜食材特写
- 展示从食材到成品的制作过程对比 风格:明亮、清新、开胃、一致的暖色调。1:1方形画幅。
风格转换:
"将这张上传的城市街道照片转换成吉卜力工作室风格的动画插图。保持构图和元素,但应用吉卜力特有的温暖色调、柔和云彩和奇幻细节。"
获取更佳图像的技巧
-
描述要具体:"办公室里的女性"太模糊。"40多岁、穿着银色西装外套、自信的女性,身处现代玻璃幕墙办公室,沐浴在温暖的午后光线中"则更好。
-
指定风格:"照片级写实"、"数字插画"、"水彩画"、"极简矢量图"。
-
描述光线:"柔和的自然光"、"戏剧性的侧光"、"黄金时段的辉光"、"影棚灯光"。
-
包含氛围:"专业且自信"、"温暖而诱人"、"充满活力且色彩鲜明"。
-
提及构图:"三分法"、"中心对称"、"特写"、"广角定场镜头"。
-
确保一致性:创建角色系列时,先详细描述角色,在后续提示中引用"同一角色"。


微信扫一扫,打赏作者吧~