探索和应用
一、 视觉生产
- 定义:通过一个/一系列视觉过程,产出新的视觉表达
(1) 产出:人或机器能够感知的图像视频,而不是标签或特征;
(2) 要求:新的,和输入不一样的 - 分类
(1) 生成:从0到1
(2) 拓展:从1到N
(3) 摘要:从N到1
(4) 升维:从An到An+ 1
(5) 增强/变换:从A到B
(6) 插入/合成: A+B=C
(7) 擦除: A-B=C - 通用基础框架
- 五个关键维度
(1) 可看
(2) 合理
(3) 多样
(4) 可控
(5) 可用
二、 精细理解 - 分割抠图
(1) 识别
(2) 检测
(3) 分割
难点:复杂背景、遮挡、发丝精抠、边缘反色、透明材质、多尺度/目标,数据严重不足,标注成本高 - 模型框架
三、 视觉生成 - 鹿班
- 视频生成
四、 视觉编辑 - 视频植入
- 植入位检测与定位
(1) 空白区域自动检测
(2) 遮挡、移出屏幕等复杂情况跟踪 - 视频内容擦除
- 文字擦除
- Logo擦除
- 画幅变化
- 图像尺寸变化
五、 视觉增强——修旧如新 - 人脸修复增强
- 渲染图超分
- 视频插帧
- 风格迁移
- 颜色拓展
六、 视觉制造 - 核心逻辑
- 包装几何生成
- 材质工艺
- 视觉迁移及融合
- 多样性拓展
- 2D3D融合
七、 视觉智能开放平台