TensorFlow 的 TFRecord 和 QueueRunner 简介

2017-11-01 17:37:01 +08:00
 lufficc

如何将数据集转换为 TensorFlow 的 TFRecord 格式呢?为什么要转换为 TFRecord 格式?如何使用文件队列?如何生成 Batches ?

TensorFlow 的 TFRecord 和 QueueRunner 简介

2301 次点击
所在节点    Python
6 条回复
Boristype000
2017-11-01 22:26:33 +08:00
原来那个 tf.contrib.data 在 1.4 并入 tf 变成 tf.data 的数据预处理模块楼主用过吗?好多地方都推荐用这个
lufficc
2017-11-01 23:12:34 +08:00
inflationaaron
2017-11-02 02:41:08 +08:00
这种 feed data 的方法虽然性能最好,但是很不灵活,想要在 epoch 间切换到另一个 dataset 需要用 tf.where 之类的图内条件切换。这也是 TensorFlow 静态图的缺点之一。
lufficc
2017-11-02 10:09:40 +08:00
@inflationaaron TensorFlow 动态图机制 Eager Execution,10.31 号出的,你怎么看?
inflationaaron
2017-11-03 22:31:08 +08:00
@luffylcc 挺好的啊,给 TensorFlow 使用者提供了另一种选择。当然我觉得对于动态图有需求的早就转到 PyTorch 了。
zsneoks
2017-11-04 16:03:48 +08:00
我使用过,无非就是流化输入吧。有相应的 batch 接口啊,还可以 shuffle,可以参考源码里的 cifar10 的示例。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/402691

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX