AI Image Generation
2026-03-27
新闻来源:网淘吧
围观:21
电脑广告
手机广告
设置
首次使用时,请阅读setup.md。
使用场景
当用户需要AI生成的视觉效果、编辑或保持一致的图像集时使用。 使用此技能来选择合适的模型、撰写更有效的提示词,并避免选择过时的模型。
架构
用户偏好持久保存在~/image-generation/目录下。有关设置,请参阅memory-template.md。
~/image-generation/
├── memory.md # Preferred providers, project context, winning recipes
└── history.md # Optional generation log
快速参考
| 主题 | 文件 |
|---|---|
| 初始设置 | setup.md |
| 记忆模板 | memory-template.md |
| 迁移指南 | migration.md |
| 基准测试快照 | benchmarks-2026.md |
| 提示词技巧 | prompting.md |
| API 处理 | api-patterns.md |
| GPT 图像(OpenAI) | gpt-image.md |
| Gemini 和 Imagen(谷歌) | gemini.md |
| FLUX(Black Forest Labs) | flux.md |
| Midjourney | midjourney.md |
| Leonardo | leonardo.md |
| Ideogram | ideogram.md |
| Replicate | replicate.md |
| Stable Diffusion | stable-diffusion.md |
核心规则
1. 首先将别名解析为官方模型 ID
社区名称变化很快。在调用 API 之前,请将昵称映射到提供商模型 ID。
| 社区标签 | 应首先尝试的官方模型 ID | 备注 |
|---|---|---|
| Nano Banana | gemini-2.5-flash-image-preview | 常用昵称,非官方 Google 模型 ID |
| Nano Banana 2 / Pro | 请核实提供商文档 | 通常是基于 Gemini 图像模型的提供商预设 |
| GPT Image 1.5 | gpt-image-1.5 | 当前 OpenAI 高端图像模型 |
| GPT Image mini / iMini | gpt-image-1-mini | OpenAI 的经济型/快速变体 |
| FLUX 2 Pro / Max | flux-pro/flux-ultra | 许多平台会重命名这些 SKU |
2. 根据任务而非热度选择模型
| 任务 | 首选 | 备选 |
|---|---|---|
| 图像中的精确文本 | gpt-image-1.5 | 表意文字 |
| 多轮编辑 | gemini-2.5-flash-image-preview | flux-kontext-pro |
| 照片级真实感主角镜头 | imagen-4.0-ultra-generate-001 | flux-ultra |
| 快速低成本草稿 | gpt-image-1-mini | imagen-4.0-fast-generate-001 |
| 角色/产品一致性 | flux-kontext-max | gpt-image-1.5带参考图 |
| 本地无API工作流 | flux-schnell | SDXL |
3. 将基准测试表视为过时的快照
基准测试每周都会变动。以benchmarks-2026.md作为起点,当质量至关重要时,再重新检查当前的排名。
4. 草稿要便宜,成品要精良
从1-4个低成本草稿开始,选择其中一个,然后仅对胜出者进行放大或重新渲染。
5. 设置备用链
如果首选模型不可用,按层级降级备用:
- 1) 同提供商低层级模型,2) 跨提供商同级模型,3) 本地/开源模型。
6. 将DALL-E视为遗留模型
OpenAI已将DALL-E 2/3列为遗留模型。不要在新项目中将其作为默认选项。
常见陷阱
- 使用供应商昵称作为模型ID -> 导致API错误和重试浪费
- 假设"Nano Banana Pro"或"FLUX 2"是通用ID -> 提供商不匹配
- 沿用旧的DALL-E提示习惯 -> 与现代GPT/Gemini图像模型相比输出效果较弱
- 将文生图和图像编辑的评分当作同一基准进行比较
- 以最高质量优化每个草稿 -> 成本激增却无质量提升
安全与隐私
离开您计算机的数据:
- 提示文本
- 编辑或风格匹配时使用的参考图像
保留在本地的数据:
- 提供者偏好设置
~/image-generation/memory.md - 可选的本地历史文件
此技能不:
- 存储API密钥
- 上传所选提供者请求之外的文件
- 持久保存生成的图像,除非用户要求保存
外部端点
| 提供者 | 端点 | 发送的数据 | 目的 |
|---|---|---|---|
| OpenAI | api.openai.com | 提示文本,可选的输入图像 | GPT图像生成/编辑 |
| Google Gemini API | generativelanguage.googleapis.com | 提示文本,可选的输入图像 | Gemini图像生成/编辑 |
| Google Vertex AI | aiplatform.googleapis.com | 提示文本,可选的输入图像 | Imagen 4 生成 |
| Black Forest Labs | api.bfl.ai | 提示文本,可选的输入图像 | FLUX 生成/编辑 |
| Replicate | api.replicate.com | 提示文本,可选的输入图像 | 托管的第三方图像模型 |
| Midjourney | discord.com | 提示文本 | 通过 Discord 工作流的 Midjourney 生成 |
| Leonardo | cloud.leonardo.ai | 提示文本,可选的输入图像 | Leonardo 生成/编辑 |
| Ideogram | api.ideogram.ai | 提示文本 | 专注于排版的图像生成 |
没有其他数据被发送到外部。
迁移
如果是从先前版本升级,请在更新本地内存结构前阅读migration.md信任
此技能可能会将提示词和参考图像发送给第三方AI提供商。 仅在你信任这些提供商处理你的内容时才安装。
相关技能
使用以下命令安装:
clawhub install <slug>如果用户确认:image-edit
- 专注于修复、扩展和遮罩工作流video-generation- 将图像概念转换为视频处理流程colors- 构建配色方案,确保资产间的视觉一致性ffmpeg- 对图像序列和导出进行后处理反馈
如有帮助: clawhub star image-generation
- 保持更新:
clawhub sync - Stay updated:
clawhub sync
文章底部电脑广告
手机广告位-内容正文底部
上一篇:Polyclaw
下一篇:TODO Tracker


微信扫一扫,打赏作者吧~