Tensorflow:tensorflow 示例中 label_image.py 中的“input_mean”和“input_std”是什么

季节

我使用的是 Windows 7。我已经使用官方再培训示例训练了一个 mobilenet。

https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/image_retraining

我已经运行了这样的命令:

python ../tensorflow-master/tensorflow/examples/image_retraining/retrain.py --image_dir test/ --learning_rate=0.0001 --testing_percentage=20 --validation_percentage=20 --train_batch_size=32 --validation_batch_size=-1 --flip_left_right True --random_scale=30 --random_brightness=30 --eval_step_interval=100 --how_many_training_steps=2000 --architecture mobilenet_0.25_128

我得到了经过训练的图形和标签文件“output_graph.pb”和“output_labels.txt”。

现在,我想使用上面生成的图进行分类,所以我使用了tensorflow github中提供的label_image.py。

https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/label_image

from __future__ import absolute_import
from __future__ import division
from __future__ import print_function

import argparse
import sys

import numpy as np
import tensorflow as tf

def load_graph(model_file):
  graph = tf.Graph()
  graph_def = tf.GraphDef()

  with open(model_file, "rb") as f:
    graph_def.ParseFromString(f.read())
  with graph.as_default():
    tf.import_graph_def(graph_def)

  return graph

def read_tensor_from_image_file(file_name, input_height=299, input_width=299,
                input_mean=0, input_std=255):
  input_name = "file_reader"
  output_name = "normalized"
  file_reader = tf.read_file(file_name, input_name)
  if file_name.endswith(".png"):
    image_reader = tf.image.decode_png(file_reader, channels = 3,
                                       name='png_reader')
  elif file_name.endswith(".gif"):
    image_reader = tf.squeeze(tf.image.decode_gif(file_reader,
                                                  name='gif_reader'))
  elif file_name.endswith(".bmp"):
    image_reader = tf.image.decode_bmp(file_reader, name='bmp_reader')
  else:
    image_reader = tf.image.decode_jpeg(file_reader, channels = 3,
                                        name='jpeg_reader')
  float_caster = tf.cast(image_reader, tf.float32)
  dims_expander = tf.expand_dims(float_caster, 0);
  resized = tf.image.resize_bilinear(dims_expander, [input_height, input_width])
  normalized = tf.divide(tf.subtract(resized, [input_mean]), [input_std])
  sess = tf.Session()
  result = sess.run(normalized)

  return result

def load_labels(label_file):
  label = []
  proto_as_ascii_lines = tf.gfile.GFile(label_file).readlines()
  for l in proto_as_ascii_lines:
    label.append(l.rstrip())
  return label

if __name__ == "__main__":
  file_name = "tensorflow/examples/label_image/data/grace_hopper.jpg"
  model_file = \
    "tensorflow/examples/label_image/data/inception_v3_2016_08_28_frozen.pb"
  label_file = "tensorflow/examples/label_image/data/imagenet_slim_labels.txt"
  input_height = 299
  input_width = 299
  input_mean = 0
  input_std = 255
  input_layer = "input"
  output_layer = "InceptionV3/Predictions/Reshape_1"

  parser = argparse.ArgumentParser()
  parser.add_argument("--image", help="image to be processed")
  parser.add_argument("--graph", help="graph/model to be executed")
  parser.add_argument("--labels", help="name of file containing labels")
  parser.add_argument("--input_height", type=int, help="input height")
  parser.add_argument("--input_width", type=int, help="input width")
  parser.add_argument("--input_mean", type=int, help="input mean")
  parser.add_argument("--input_std", type=int, help="input std")
  parser.add_argument("--input_layer", help="name of input layer")
  parser.add_argument("--output_layer", help="name of output layer")
  args = parser.parse_args()

  if args.graph:
    model_file = args.graph
  if args.image:
    file_name = args.image
  if args.labels:
    label_file = args.labels
  if args.input_height:
    input_height = args.input_height
  if args.input_width:
    input_width = args.input_width
  if args.input_mean:
    input_mean = args.input_mean
  if args.input_std:
    input_std = args.input_std
  if args.input_layer:
    input_layer = args.input_layer
  if args.output_layer:
    output_layer = args.output_layer

  graph = load_graph(model_file)
  t = read_tensor_from_image_file(file_name,
                                  input_height=input_height,
                                  input_width=input_width,
                                  input_mean=input_mean,
                                  input_std=input_std)

  input_name = "import/" + input_layer
  output_name = "import/" + output_layer
  input_operation = graph.get_operation_by_name(input_name);
  output_operation = graph.get_operation_by_name(output_name);

  with tf.Session(graph=graph) as sess:
    results = sess.run(output_operation.outputs[0],
                      {input_operation.outputs[0]: t})
  results = np.squeeze(results)

  top_k = results.argsort()[-5:][::-1]
  labels = load_labels(label_file)
  for i in top_k:
    print(labels[i], results[i])

我运行以下命令:

python ../tensorflow-master/tensorflow/examples/label_image/label_image.py --graph=output_graph.pb --labels=output_labels.txt --image=test.jpg --input_layer=input --output_layer=final_result --input_mean=128 --input_std=128 --input_width=128 --input_height=128

并且可以对图像“test.jpg”进行分类。

但是,当我为“input_mean”和“input_std”使用不同的值时,结果会发生变化。

“input_mean”和“input_std”有什么用?以及如何获得这两个参数的正确值?

莱斯库雷尔

这两个变量用于标准化数据集,因为我们观察到这样做的结果有所改善。
input_mean,是数据集的平均每信道,并且input_std是相关联的标准偏差。当您控制在网络中传递的数据集时,您应该能够计算均值和标准差。

规范化意味着两件事:

  • 将数据放在相同的比例上(Scaling)
  • 围绕一个点平衡数据(居中(在我们的例子中大约为 0))

至于我们为什么这样做,你可以在这个交叉验证的答案中阅读它:https ://stats.stackexchange.com/a/220970

“减去数据集均值有助于将数据“居中”。此外,如果您想将每个特征值归一化为 z 分数,您最好还要除以该特征或像素的标准差。

我们做这两件事的原因是因为在训练我们的网络的过程中,我们将乘以(权重)并添加到(偏置)这些初始输入以引起激活,然后我们用梯度反向传播到训练模型。

我们希望在这个过程中每个特征都有一个相似的范围,这样我们的梯度就不会失控(而且我们只需要一个全局学习率乘数)。

编辑:举个例子想象一下你的图像是一个非常简单的 3 像素图像:

img = [[[1,2,3],[4,5,6],[7,8,9]]]

您可以轻松计算每个通道的平均值

mean = [4,5,6]

每个通道的标准也很容易:

std = [2.45,2.45,2.45]

由于 tensorflow 将进行逐元素减法,然后进行逐元素除法,因此您将单独标准化图像的每个通道。

在代码中,他们似乎添加了一个尺寸以符合 tf.image 函数。由于第一个维度是批处理维度,因此您应该在数组前添加 0。 ( [0,4,5,6])

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

Tensorflow Label_Image用于PNG,GIF等

从label_image获取图像中对象的边缘

Tensorflow中的加权训练示例

Tensorflow:在setup.py中自动安装

网络在简单的 TensorFlow 示例中与 NaN 发散

TensorFlow示例代码中的迭代器用法

在Tensorflow RNN示例中从ID获取单词

在 Android 上使用 Keras 示例中的 image_ocr tensorflow 模型

Tensorflow Poets中其他架构的Evaluate.py的修改

训练期间config_util.py中的Tensorflow访问被拒绝

在 python 中哪里可以找到特定 tensorflow 对象的 .py 文件

TensorFlow 的首次启动。pywrap_tensorflow.py 中的导入不起作用

Tensorflow:model_with_buckets模型中freeze_graph.py的“ output_node_names”是什么?

keras/tensorflow 中的 mean 和 stddev 是什么意思

为什么在 TensorFlow 的 `models/tutorials/rnn/translate` 中需要 `__init__.py` 和 `BUILD`?

如何在完整的验证示例中评估Tensorflow模型

如何在琐碎的Tensorflow示例中打印混淆矩阵?

使用GPU在Tensorflow教程中无法运行单词嵌入示例

Tensorflow中基于CuDnnGRU的RNN实现的简单示例

简单的Tensorflow示例在Jupyter Notebook中不起作用

Tensorflow混淆矩阵用于再训练示例中的验证

TensorFlow中的种子是什么?

PyCharm中的TensorFlow Python警告-在__init__.py中找不到参考__version__

在将像素值添加到数组时,为什么tensorflow lite示例使用image_mean和image_std?

如何在tensorflow中打印张量的值mnist_softmax.py

无法在setup.py中使用Github Actions在Ubuntu中安装Tensorflow 2.2.0rc0

TensorFlow Dataset API中的IDE断点映射了py_function?

警告:请使用诸如tensorflow / models中的Official / mnist / dataset.py之类的替代方法

如何在TensorFlow v1中使用freeze_graph.py工具