探索和应用
一、 视觉生产
- 定义:通过一个/一系列视觉过程,产出新的视觉表达
(1) 产出:人或机器能够感知的图像视频,而不是标签或特征;
(2) 要求:新的,和输入不一样的 - 分类
(1) 生成:从0到1
(2) 拓展:从1到N
(3) 摘要:从N到1
(4) 升维:从An到An+ 1
(5) 增强/变换:从A到B
(6) 插入/合成: A+B=C
(7) 擦除: A-B=C - 通用基础框架

 - 五个关键维度
(1) 可看
(2) 合理
(3) 多样
(4) 可控
(5) 可用
二、 精细理解 - 分割抠图
(1) 识别
(2) 检测
(3) 分割
难点:复杂背景、遮挡、发丝精抠、边缘反色、透明材质、多尺度/目标,数据严重不足,标注成本高 - 模型框架

三、 视觉生成 - 鹿班
 - 视频生成
四、 视觉编辑 - 视频植入

 - 植入位检测与定位
(1) 空白区域自动检测
(2) 遮挡、移出屏幕等复杂情况跟踪 - 视频内容擦除

 - 文字擦除
 - Logo擦除
 - 画幅变化
 - 图像尺寸变化
五、 视觉增强——修旧如新 - 人脸修复增强
 - 渲染图超分
 - 视频插帧
 - 风格迁移

 - 颜色拓展
六、 视觉制造 - 核心逻辑
 - 包装几何生成
 - 材质工艺
 - 视觉迁移及融合
 - 多样性拓展
 - 2D3D融合
七、 视觉智能开放平台 
爱站程序员基地





![[翻译] Backpressure explained — the resisted flow of data through software-爱站程序员基地](https://aiznh.com/wp-content/uploads/2021/05/29-220x150.jpeg)

