推荐使用tensorflow数据集作为输入管道,可以设置如下:
# Specify dataset
dataset = tf.data.Dataset.from_tensor_slices((features, labels))
# Suffle
dataset = dataset.shuffle(buffer_size=1e5)
# Specify batch size
dataset = dataset.batch(128)
# Create an iterator
iterator = dataset.make_one_shot_iterator()
# Get next batch
next_batch = iterator.get_next()
Run Code Online (Sandbox Code Playgroud)
我应该能够获得批量大小(从数据集本身或从它创建的迭代器,即两者iterator
和next_batch
)。也许有人想知道数据集或其迭代器中有多少批次。或者已经调用了多少批次以及迭代器中剩余多少批次?人们可能还想一次获取特定元素,甚至整个数据集。
我无法在 tensorflow 文档中找到任何内容。这可能吗?如果没有,有谁知道这是否已被请求作为 tensorflow GitHub 上的问题?
我创建了一个tensorflow数据集,使其可重复,将其改组,分成若干批,并构造了一个迭代器以获取下一批。但是,当我这样做时,有时元素是重复的(在批内和批间),尤其是对于小型数据集。为什么?
我使用Python 3.6,并想定义一个函数,它接受两个整数a
,并b
返回他们的分裂c = a//b
.我想在不使用的情况下强制执行输入和输出类型assert
.根据我在文档和本网站上发现的内容,我的理解是应该将此函数定义为:
def divide(a: int, b: int) -> int:
c = a // b
return c
divide(3, 2.) # Output: 1.0
Run Code Online (Sandbox Code Playgroud)
我期待,因为一个错误(或警告),b
而c
不是整数.
assert
在不使用的情况下正确指定输入和输出类型
?