为 AI 视频工作流开发的两个 ComfyUI 插件

最近在做一个AI视频项目时,遇到了一个很实际的问题:如何用AI生成具有一致性的多角度镜头?

无论是电影预告片、漫剧分镜,还是产品展示视频,都需要在不同角度展示同一个场景或角色。传统的做法是手动调整prompt,但这种方式效率低下,而且很难保证角度的精确性。

于是,我开发了两个ComfyUI插件来解决这个问题。今天把它们开源出来,希望能帮到更多创作者。

遇到的实际问题

1. 角度描述不精确

在AI图像生成中,我们通常用文字描述相机角度:

正面视角,稍微从右边看,中景

但这种方式很模糊。什么是”稍微”?15度还是30度?中景是多大范围?

实际工作中的需求: 需要精确的数值控制,同时让AI理解场景意图。

2. 缺少可视化交互

大多数ComfyUI节点都是输入框+下拉菜单,调整参数像在填表格。但相机角度是3D概念,需要用直观的方式调整。

实际工作中的需求: 一个可以拖拽旋转的控制器,实时看到角度变化。

3. 与最新模型的集成

GPT Image 2发布后,我在实际使用中发现它在理解复杂提示词和生成一致性角色方面表现优异。但ComfyUI社区还没有好用的集成节点。

实际工作中的需求: 将GPT Image 2无缝集成到ComfyUI工作流中。

解决方案:两个ComfyUI插件

插件1:ComfyUI-MultiAngle-Camera(多角度相机控制器)

GitHub: https://github.com/yitao2020/ComfyUI-MultiAngle-Camera

核心功能

1. 3D球体交互控制器

  • 鼠标拖拽旋转,实时调整角度
  • 可视化反馈,参数实时显示
  • 不需要写代码,拖拽就能调整相机角度

2. 智能提示词生成

  • 自动将相机参数转换为AI能理解的提示词
  • 输出格式:camera angle: yaw=45°, pitch=15°, zoom=1.0 (front-right diagonal view, medium shot)
  • 同时输出数值,方便精确控制

3. 电影级镜头预设

  • 鱼眼视角(夸张的喜剧效果)
  • 倾斜视角(营造不安感)
  • 正面俯拍(权威感、压制感)
  • 正面仰拍(英雄视角,增强气势)
  • 全景俯拍(大场景展示)
  • 背面视角(跟拍镜头、主观视角)

在视频工作流中的应用

场景1:电影分镜预览

传统方式:手动画分镜,耗时数天 使用插件:

  1. 拖拽3D球体调整到理想角度
  2. 自动生成角度提示词
  3. 批量生成不同角度的场景预览

效率提升: 从3天缩短到3小时

场景2:漫剧角色立绘

需求:生成同一角色的5个角度(正面、左侧、右侧、背面、俯视) 使用插件:

  1. 创建5个相机节点
  2. 分别设置不同角度
  3. 拼接提示词,输入到图像生成节点
  4. 使用相同seed保证角色一致性

效果: 快速生成角色多角度展示,适合角色介绍、卡牌游戏等场景

场景3:动态镜头序列

需求:生成一个镜头的多个关键帧(远景建立 → 中景 → 近景特写) 使用插件:

  1. 设置3个节点,分别控制景别(zoom)
  2. 依次输入到图像生成节点
  3. 保持场景描述一致,仅改变相机参数

效果: 快速生成镜头运动序列,用于视频剪辑


插件2:ComfyUI-GPT-Image-2(GPT Image 2集成)

GitHub: https://github.com/yitao2020/ComfyUI-GPT-Image-2

核心功能

1. 完整API集成

  • 支持文生图(输入文字生成图片)
  • 支持图片编辑(上传参考图 + 编辑指令)
  • 支持多图融合(最多5张参考图同时输入)
  • 支持Mask局部重绘(只重绘指定区域)

2. 灵活的尺寸和质量控制

  • 8种预设尺寸(1K/2K/4K,方形/横版/竖版)
  • 3档画质:low(草图)、medium(日常)、high(精细)
  • 多种输出格式:png、jpeg、webp

3. 友好的错误处理

  • 常见错误提示(尺寸不对、内容审核拦截等)
  • 超时保护(high画质 + 4K可能需要3-5分钟)
  • 详细的日志输出,方便排查问题

与MultiAngle-Camera协同工作

完整工作流:

  1. 在MultiAngle-Camera中调整相机角度
  2. 节点自动生成角度描述提示词
  3. 将提示词接入GPT Image 2节点
  4. 生成符合预期的图像

实际应用示例:

# 基础场景描述
赛博朋克街道,霓虹灯,雨天湿滑的路面,电影质感

# + 自动生成的角度提示词
camera angle: yaw=45°, pitch=15°, zoom=1.0 
(front-right diagonal view, medium shot)

效果: GPT Image 2能够理解精确的相机参数,生成符合预期的镜头画面。

总结

这两个插件都是在实际工作中遇到问题时开发的,不是为做插件而做插件。

ComfyUI-MultiAngle-Camera 解决了AI图像生成中相机角度控制不精确的问题,特别适合需要多角度展示的视频/漫剧制作。

ComfyUI-GPT-Image-2 将最新的GPT Image 2模型集成到ComfyUI,支持文生图、图片编辑、多图融合等多种功能。

希望这两个插件能帮到更多创作者。如果在使用过程中遇到问题,欢迎在GitHub上提Issue或建议。


GitHub仓库:

如果觉得有用,请给个Star ⭐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注