Bootstrap

Tensorflow入门(1.0)

关于TensorFlow要注意以下几个要点:

(1)图是对于计算的一种描述

(2)图包含作为操作的节点。

(3)在一个给定的会话环境中执行计算。

(4)对于任何计算过程而言,图一定是在一个会话里启动。

(5)会话将图操作加载到像CPU或者GPU这样的设备上。

(6)会话提供执行图操作的方法

1.张量

张量是一个数学对象,它是对标量、向量或者矩阵的泛化。张量可以表示为一个多维数组。零秩(阶)张量就是标量。向量或者数组是秩为1的张量,而矩阵是秩为2的张量。简言之,张量可以被认为是一个n维数组。

2.计算图与会话

TensorFlow因其TensorFlow Core程序而受欢迎,TensorFlow Core有两个主要的作用:

(1)在构建阶段建立计算图

(2)在执行阶段运行计算图

我们来看一下TensorFlow是如何工作的:

(1)其程序通常被结构化为构建阶段和执行阶段。

(2)构建阶段搭建具有节点(操作)和边(张量)的图。

(3)执行阶段使用会话来执行图中的操作。

(4)最简单的操作是一个常数,它没有输入,只是传递输出给其它计算操作。

(5)一个操作的例子就是乘法(或者是取两个矩阵作为输入并输出另一个矩阵的加法或减法操作)

(6)TensorFlow库具有一个默认图来构建操作添加节点。

因此,TensorFlow程序具有构建阶段和执行阶段两部分。

构建阶段--(1)搭建一个图  (2)构建计算图中的节点(操作)和边(张量)

执行阶段-- (1)使用会话执行操作  (2)重复执行一组训练操作

计算图是由一系列的TensorFlow操作排成的节点组成的。

我们来对比一下TensorFlow和numpy。在numpy中,如果你打算将两个矩阵相乘,需要生成两个矩阵并将它们相乘。但是在TensorFlow中,你建立一个图(默认图,除非你另外创建了一个图)。接下来,需要创建变量、占位符以及常量值,然后创建会话并初始化变量。最终,把数据赋值给占位符以便调用其它操作。

实际上,为了计算节点,必须在一个会话里面运行计算图。

一个会话里囊括了TensorFlow运行时的控制和状态。

下面代码生成了一个会话(Session)对象:

sess=tf.Session()

这之后就可以用它的运行方法来充分运行计算图以计算节点1和节点2.

计算图定义了计算。它并不执行计算,也不保留任何值。它用来定义代码中提及的操作。同时,创建了一个默认的图。因此,你不必创建图,除非需要创建图用于多种目的。

会话允许你执行图或者只执行部分图。它为执行分配资源(在一个或多个CPU或者GPU上)。它还保留了中间结果和变量值。

在TensorFlow中创建的变量的值,只在一个会话内是有效的。如果你尝试在之后的第二个会话里访问其值,TensorFlow就会报错,因为变量不是在那里初始化的。

想运行任何操作,需要给图创建一个会话。会话会分配内存在存储当前变量值。

下面是演示代码:

import tensorflow as tf
sess=tf.Session()
myGraph=tf.Graph()
with myGraph.as_default():
    variable=tf.Variable(30,name="navin")
    initialize=tf.global_variables_initializer()
with tf.Session(graph=myGraph)as sess:
    sess.run(initialize)
    print(sess.run(variable))

控制台就会输出30.

3.常量、占位符与变量

TensorFlow程序使用张量数据结构来表示所有的数据--在计算图中,只有张量在操作之间被传递。可以把TensorFlow张量想象成一个n维数组或者列表。张量具有静态类型、秩以及形状。在这里,图产生一个不变的结果。变量在整个图的执行过程维持其状态。

通常,在深度学习中你不可避免要处理很多图片,因此需要给每一章图片赋以像素值,然后对所有图片重复此操作。

为了训练模型,需要能够修改图以调节一些对象,比如权重值、偏置量。简单来说,变量让你能够给图添加可训练的参数。他们在创建时就带有类型属性和初始值。

让我们在TensorFlow中创建一个常量并输出它。

import tensorflow as tf
x = tf.constant(12,dtype='float32')
sess=tf.Session()
print(sess.run(x))

 下面对每一行代码进行解释:

(1)导入TensorFlow模块并用tf来调用它。

(2)创建常量值(x)并制定其数值为12.

(3)创建会话来计算数值。

(4)只运行变量x并输出其当前值。

前两部属于构建阶段,后两部属于执行阶段。下面讨论TensorFlow的构建阶段和执行阶段。

可以把前面的代码用另一种方式重写如下:

import tensorflow as tf
x = tf.constant(12,dtype='float32')
with tf.Session() as sess:
    print(sess.run(x))

现在可以探索如何创建变量并将其初始化。以下是实现代码:

import tensorflow as tf
x = tf.constant(12,dtype='float32')
y=tf.Variable(x+11)
model=tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(model)
    print(sess.run(y))

代码解释:

(1)导入TensorFlow模块并用tf来调用它

(2)创建名为x的常量并赋予初始值12

(3)创建变量y并用方程y=x+11来定义它。

(4) 使用tf.global_variables_initializer()初始化变量。

(5)创建一个会话来计算值。

(6)运行在第4部建立的模型。

(7)只运行变量y并输出其当前值。

 4.占位符

占位符是一个可以在之后赋给它数据的变量。它是用来接收外部输入的。占位符可以是一维或者是多维,用来存储n维数组。

import tensorflow as tf
x = tf.placeholder("float",None)
y=x*10+500
# model=tf.global_variables_initializer()
with tf.Session() as sess:
    placeX=sess.run(y,feed_dict={x:[0,5,15,25]})
    print(placeX)

 代码解释:

(1)1.导入TensorFlow模块并用tf来调用它。

(2)创建占位符x,指定为float类型。

(3)创建张量y,它是x乘以10并加500的操作。注意x的初始值并未给定。

(4)创建一个会话用于计算值

(5)在feed_dict中给定x的值以运行y。

(6)输出y的值。

在下面的例子中,创建一个2*4的矩阵(一个二维数组)用于存放一些数。然后使用和之前相同的操作来实现逐元素地乘以10并加1的操作。占位符的第一个维度是None,这意味着任何行数都可以。

也可以考虑一个二维数组而非一维数组。代码如下:

import tensorflow as tf
x = tf.placeholder("float",[None,4])
y=x*10+1
# model=tf.global_variables_initializer()
with tf.Session() as sess:
    dataX=[[12,2,0,-2],
           [14,4,1,0]]
    placeX=sess.run(y,feed_dict={x:dataX})
    print(placeX)

这是一个2*4的矩阵。因此,如果把None替换为2,也可以得到相同的输出。

 

 但是如果创建一个形状为[3,4]的占位符(后面输入一个2*4的矩阵),就会报错。

 当调用tf.constant的时候,常量会被初始化,而且其值将不会再变化。而变量在你调用tf.Variable的时候并不会被初始化。想在TensorFlow程序里面初始化所有的变量,必须显式地调用如下的特殊操作。

sess.run(tf.global_variables_initializer())

认识到init是TensorFlow自居的一个句柄很重要,它用来初始化所有的全局变量。在你调用sess.run之前,变量是没有被初始化的。

 

 

;