刘光聪|剖析TensorFlow架构与设计：编程模型

刘光聪中生代技术

祝大家在2017年有新的收获。非常感谢大家在春节前夕依然还坚持参加中生代技术的分享活动，也感谢中生代提供的强大的分享平台。我是刘光聪，来自于中兴通讯技术规划部，关注敏捷软件开发，从事机器学习算法研究，目前负责AI平台架构与设计。今天我给大家分享的题目是：剖析TensorFlow架构与设计之编程模型。其目标是对深度学习有一个初步的了解，了解TensorFlow的基本编程模型，及其掌握TensorFlow的几个重要概念。

今天我的分享主要包括3个部分，简单介绍TensorFlow的架构；理解计算图的工作原理；通过Mnist实战，了解TensorFlow编程模型。

TensorFlow在跨平台，通用性，分布式，可扩展性，可视化等方面优势非常明显。

TensorFlow是一种典型的基于符号编程的数值计算框架，从总架构上分为两层：

1. 前端：负责计算图的构造，支持多语言，其中Python提供的 API最为成熟；
2. 后端：负责计算图的执行，使用C++实现，直接操作分布式的CPU/GPU环境。

计算图是TensorFlow最重要的领域概念，OP代表节点，Tensor代表边；数据从节点流入，通过OP运算，从节点流出，并做为下一节点的输入，TensorFlow的命名由此而来。

OP用于表示计算图的一个节点，完成某种抽象的计算。

TensorFlow支持丰富的OP集合，并且支持OP的扩展。

OP通过OP构造器(OP Constructor)生成OP实例，该工厂具有副作用，它将该OP实例注册到计算图中。此时用户对图实例无感知，因为其上下文存在一个默认的图实例。

OP的输入和输出以Tensor的形式传递，支持三种基本类型。

描述OP可以通过三个维度描述：

1. 类型
2. Tensor的Shape：维度，及其每一维度的大小
3. 约束：例如默认值，允许的值列表

以placeholder的OP为例，该OP是一个特殊的OP，它没有输入，只有输出。而且，他的类型为确定，待用户在构造OP是确定，可以看成一个「泛型编程」的过程。

这是placeholder OP的构造器(constructor)，或称为工厂。调用OP时，指定OP的属性，从而确定OP的基本规格。该过程类似于C++模板实例化，但还未生成对象实例(直至执行计算图阶段)。

Operation描述了OP的接口(类型，约束，属性，设备等)，Kernel是针对具体设备类型，或者数据类型，Tensor的维度及大小的某种具体实现。典型地，OP会有GPU实现的Kernel，及其CPU实现的Kernel 。这是一种典型的多态设计(区别于编程语言的多态)。

Tensor表示计算图的边实例，表示OP之间的数据流方向。

Tensor可以通过三元组描述：(Type, Rank, Shape)。

查看源代码(简化之后)，其Protobuf是如此描述Tensor的，其很好地形式化描述了Tensor的本质。

在计算图中，存在两种类型的边：

1. 正常的边：用于传递Tensor；
2. 特殊的边：用于控制依赖。

控制依赖是一种构建复杂网络模型的重要工具，它表示OP之间执行的依赖关系。

当前上下文，维护了一个指向default graph的指针；也就是说，在任何一个时刻，在上下文中都存在一个默认的图实例。图实例包括两类：

1. 隐式的图实例
2. 显式的图实例

前者的OP注册到隐式的图实例，后者的OP注册到显式的图实例中。

OP命名的层次化是一种搭建复杂网络的重要工具。例如，将OP看成西安市，那么如何从地球中找到它呢？首先，通过世界地图，先找到亚洲，然后找到中国，然后再找到陕西，最后才找到西安。当搭建复杂的网络模型时，OP命名的层次化，对于OP定位是非常有用的。

可以指定OP的设备类型，当执行计算图时，该OP会被分配到指定的设备上执行运算。

默认图实例(Default Graph)，OP命名的层次化(Name Scope)，指派设备(device)等机制，实际是由Context Manager管理，保证在某一个时刻，存在唯一的默认图实例，及其当前的Scope，及其当前的Device等等。

总结一下，TensorFlow是一种基于符号的编程模式，前端完成计算图的构造，后端完成计算图的执行。

这里举一个简单的例子，x表示模型的输入，y_表示模型的输出(Labels)；定义了W, b两个训练参数，然后使用matmul的OP，及其add的OP完成权重的线性求和，最后使用ReLU的激活函数，搭建了第一层网络模型。其中C代表后续的网络层次。

上述代码实现，构造了如上图所示的计算图实例。

通过建立一个Session，使用Mini-Batch算法实现该模型的训练。很显然，计算图被构造依次，但被执行了多次(一次一个Batch)。

这是使用Protobuf描述计算图的领域模型。

这是前端(Python)的领域模型。

这是后端的领域模型。

Session是Client与计算服务的桥梁，是一种资源，使用完成后保证被关闭；session.run建立了一个瞬时的闭包，该闭包针对于该次Batch，依次传递Tensor，完成整个计算的过程，然后再将梯度反传，最后完成参数的更新。每个子图只会构造依次，但可能被执行多次。Tensor在OP之间传递，其生命周期仅对当前批次有效，对下一个Mini-Batch无效。