如何将字符串传递给 tf.contrib.rnn.MultiRNNCell？

危险奇瓦瓦007

我正在使用 TensorFlow 编写一个 LSTM，该 LSTM 根据长度为 10 的先前字符字符串（恰好对应于方向）预测布尔目标，即 URDDLRUDUD。

当我将tf.string张量传递给tf.nn.dynamic_rnn：

multi_rnn_cell = tf.contrib.rnn.MultiRNNCell(
  lstm_cells, state_is_tuple=True)
output_data, _ = tf.nn.dynamic_rnn(
  multi_rnn_cell,
  tf.reshape(input_layer, (batch_size, 10, 1)),
  initial_state=lstm_layers.zero_state(
    batch_size=batch_size,
    dtype=tf.string))

我收到一个错误：

ValueError: dtype must be convertible to float. dtype: <dtype: 
'string'>, column_name: sequence

似乎输入tf.nn.dynamic_rnn应该是一个嵌入值 - 尽管我不想传递整个长度为 10 的单词的嵌入，因为我希望 LSTM 是基于字符的。

设计和传递输入到基于字符的 LSTM 的正确方法是什么？

Qy Zuo

您需要将字符编码为 int 值

U 0
R 1
L 2
D 3

您的输入应该是：

[[0,1,2,3,2,2,3,1],[0,1,2,1,2,1,3,1]...]

并添加一个嵌入层（使用tf.contrib.layers.embed_sequence嵌入输入数据）并将编码数据输入您的 lstm 单元格。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-08-26

我来说两句

0 条评论

登录后参与评论

如何在MNIST上使用tf.contrib.model_pruning？

Tensorflow：如何从rnn_cell.BasicLSTM和rnn_cell.MultiRNNCell获取所有变量

如何将字符串传递给 tf.contrib.rnn.MultiRNNCell？

如何将字符串传递给 tf.contrib.rnn.MultiRNNCell？

隐藏发件人没有短信PHP

材质UI垂直滑块。如何改变在垂直材料UI滑块导轨的厚度（反应）

在Windows 7中无法删除文件（2）

HttpClient中的角度变化检测

Azure VM启动/停止日志

如何在 Vb.net 中使用函数返回多个值

Powerpoint-条形长度错误的堆积条形图

最新歌剧断断续续的快速拨号和渲染错误

Mac OS X更新后的GRUB 2问题

需要公式以vlookup逗号分隔单个单元格中的值

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

ggplot：对齐多个分面图-所有大小不同的分面

OS X-为什么我需要打开WiFi才能确定最近的位置

用日期数据透视表和日期顺序查询

Java Eclipse中的错误13，如何解决？

如何在Django中使用UUID

加载Microsoft Visual菜单时出现问题

具有if条件的SQL UPDATE

从JSON到JSONL的Python转换

如何在Kod中更改字体？

共享图像将路径放入地址