TensorFlow0.8源码阅读 — 代码目录结构讲解
2013 年 8 月 5 日
<
div id=”content” contentScore=”1285″>TensorFlow0.8发布以来受到了大量机器学习领域爱好者的关注,目前其项目在github上的follow人数在同类项目中排名第一。作为google的第一个开源项目,TensorFlow的源码结构较为清晰,相关的代码注释覆盖较全。本文首先从代码结构入手,分析TesnsorFlow的各个模块构成。
根目录结构的相关介绍
以下是TensorFlow项目根目录下的文件结构(目前以TensorFlow-0.8为例)
以下是对根目录下的几个核心文件和目录的相关介绍:
- 目录tensorflow 该目录下存放着tensorflow的核心代码
- 目录google 该目录下存放着protobuf的相关代码,该目录通过在
git clone
命令后添加--recurse-submodules
可以下载得到。protobuf主要用于tensorflow中的各模块通信。 - 目录third_party/tools/util 目前这三个目录中的文件较少,还未看出其相关作用,可能会在接下来的项目发展中变得更加完善。
- 文件configure 该文件用于配置tensorflow的安装环境,运行该文件并完成tensorflow的安装环境配置后,运行
bazel build -c opt //tensorflow/cc:tutorials_example_trainer
即可完成代码的编译工作。(注 需要先安装bazel)
由于目录google 的作用仅为提供protobuf的通信支持,当前我们主要对目录tensorflow的相关结构进行分析。
tensorflow目录结构的相关介绍
以下是目录tensorflow 下的相关目录和文件
以下是对该目录下的几个重要目录的简单介绍:
- 目录core 该目录为tensorflow的C++源码的核心存放地点,接下来我们会对该目录中存放的各个模块进行简要介绍。
- 目录python 该目录下存放了tensorflow使用python编写的相关代码,个人感觉该部分代码主要是使用python封装了相关的机器学习算法,但最终的计算操作是通过调用目录core 中的C++逻辑实现的。这样做的好处是利用了python较方便的编程特性和C++较高效的执行效率。
- 目录tensorboard tensorborad是tensorflow中非常有特色的一个模块,该模块可以用于生成模型训练中实时生成图表,用于监控模型的训练程度。
- 目录models 该目录下存放这多个使用pyton实现的模型实例。
- 目录contrib 该目录下存放有其他项目贡献者添加的相关贡献代码,由于tensorflow受关注程度较高,目前该目录正急剧膨胀。
- 其他
目前来看tensorflow中很多模块正处于刚开始起步的阶段,很多逻辑还有待完善(如当前支持的模型较少、很多方法还未实现等)。
本文接下来会对核心目录core 中的文件结构进行简要的介绍。
core目录结构的相关介绍
core目录是tensorflow源码中最核心的一个目录,其代码逻辑主要为C++开发实现。
以下为该目录的代码组织结构
以下是对该目录下的几个主要模块(目录)的功能介绍
<
ul>
Variable()
)kernel/
下的op进行注册和对外声明。