Ser*_*sta 2 c++ iterator proxy-pattern
我正在尝试实现类似容器的nD数组。可以包装基础序列容器并允许将其作为(of ...)容器的容器进行处理的东西:arr[i][j][k]应该是的(最终const)引用_arr[(((i * dim2) + j) * dim3) + k]。
好的,直到那里,arr[i]只是在子数组上有一个包装类。
当我尝试实施干预者时,我突然意识到周围到处都是龙:
operator []返回了代理或包装而不是真实的引用(什么时候容器不是容器?)真正的问题是,一旦有了代理容器,任何迭代器都无法满足对转发迭代器的以下要求:
转发迭代器[forward.iterators]
...
6如果a和b都是可取消引用的,则a == b仅当*a和*b绑定到同一对象时,则。
示例来自标准库本身:
vector<bool> 众所周知,它不遵守容器的所有要求,因为它返回代理而不是引用:
class vector [vector.bool]
...
3不需要将数据存储为bool值的连续分配。建议使用空间优化的位表示形式。
4 reference是模拟向量中单个位的引用行为的类。
文件系统路径迭代器是隐藏式迭代器:
path迭代器[fs.path.itr]
...
2 path :: iterator是一个常量迭代器,它满足双向迭代器(27.2.6)的所有要求,但对于可取消引用的迭代器a以及bpath :: iterator类型,a == b,没有这一要求*a和*b被绑定到相同的对象。
和从 cppreference:
注意:std :: reverse_iterator不适用于返回对成员对象的引用的迭代器(所谓的“隐藏式迭代器”)。存放迭代器的一个示例是std :: filesystem :: path :: iterator。
我目前发现了大量有关为什么代理容器不是真正的容器以及为什么如果标准允许代理容器和迭代器会更好的参考。但是我仍然不知道什么可以做的最好,什么是真正的限制。
所以我的问题是,为什么代理迭代器真的比隐藏迭代器好,以及它们允许使用哪种算法。如果可能的话,我真的很想找到这种迭代器的参考实现
作为参考,我的代码的当前实现已通过Code Review提交。它包含一个隐藏式迭代器(当我尝试使用时立即中断了std::reverse_iterator)
好的,我们有两个相似但截然不同的概念。因此,让我们布置它们。
但是首先,我需要区分C ++-pre-20的命名要求和为Ranges TS创建并包含在C ++ 20中的实际语言内概念。它们都被称为“概念”,但是它们的定义有所不同。因此,当我谈论小写字母c的概念时,我的意思是C ++ 20之前的要求。当我谈论带有C的概念时,我的意思是C ++ 20的东西。
代理迭代器reference是不是的迭代器value_type&,而是行为类似于对引用的其他类型value_type。在这种情况下,*it将prvalue返回给this reference。
InputIterator概念reference除了可以转换为之外,没有其他要求value_type。但是,ForwardIterator概念明确声明“ reference是对T” 的引用。
因此,代理迭代器不适合ForwardIterator概念。但是它可以仍然是一个InputIterator的。因此,您可以安全地将代理迭代器传递给仅需要InputIterators的任何函数。
因此,vector<bool>s迭代器的问题不在于它们是代理迭代器。当他们实际上只是InputIterators和OutputIterators时,他们承诺将满足RandomAccessIterator概念(尽管使用了适当的标记)。
C ++ 20中采用的Ranges提议(大部分)对迭代器概念进行了更改,使代理迭代器适用于所有迭代器。因此,在Ranges下,vector<bool>::iterator确实满足了RandomAccessIterator概念。因此,如果您针对Ranges概念编写了代码,则可以使用各种代理迭代器。
这对于处理诸如计数范围之类的事情非常有用。您可以拥有reference并且value_type是相同的类型,因此您只能以任何一种方式处理整数。
当然,如果您可以控制使用迭代器的代码,则只要不违反编写迭代器所依据的概念,就可以使其执行所需的任何操作。
隐藏式迭代器是迭代器,其中reference_type(直接或间接)引用了存储在迭代器中的对象。因此,如果您复制迭代器,则该副本将返回对与原始对象不同的对象的引用,即使它们引用的是同一元素。并且当您增加迭代器时,先前的引用将不再有效。
通常实现隐藏式迭代器,因为计算要返回的值非常昂贵。可能涉及内存分配(例如path::iterator),或者涉及可能仅执行一次的复杂操作(例如regex_iterator)。因此,您只想在必要时这样做。
ForwardIterator作为概念(或概念)的基础之一是,这些迭代器的范围表示独立于其迭代器而存在的值的范围。这样可以进行多遍操作,但也可以使其他事情变得有用。您可以存储对范围内项目的引用,然后在其他地方进行迭代。
如果需要迭代器成为ForwardIterator或更高版本,则永远不要使其成为隐藏式迭代器。当然,C ++标准库并不总是与其自身保持一致。但是它通常会指出其不一致之处。
path::iterator是隐藏式迭代器。该标准说它是一个BidirectionalIterator。但是,它也为该类型提供了引用/指针保留规则的例外。这意味着您无法传递path::iterator任何可能依赖于该保留规则的代码。
现在,这并不意味着您不能将其传递给任何东西。任何仅需要InputIterator的算法都将能够采用此类迭代器,因为此类代码无法依赖该规则。当然,可以使用您编写的任何代码或在其文档中特别声明不依赖该规则的任何代码。但是reverse_iterator,即使它说它是一个BidirectionalIterator,也不能保证可以使用它。
regex_iterator在这方面,甚至更糟。据说它们是基于其标签的ForwardIterators,但是标准从未说过它们实际上是 ForwardIterators(与不同path::iterator)。并且将它们指定为reference对成员对象的实际引用使它们不可能成为真正的ForwardIterators。
请注意,在C ++ 20之前的概念和Ranges概念之间没有区别。这是因为ForwardIterator概念仍然禁止存储迭代器。这是设计使然。
现在显然,您可以在代码中做任何您想做的事情。但是,您无法控制的代码将归其所有者所有。他们将针对旧概念,新概念或它们指定的其他某些c / Concept或要求进行写作。因此,您的迭代器需要能够与他们的需求兼容。
Ranges附加功能带来的算法使用了新的Concepts,因此您始终可以依靠它们与代理迭代器一起使用。但是,据我所知,范围概念并未反向移植到较旧的算法中。
就个人而言,我建议避免完全隐藏迭代器实现。通过提供对代理迭代器的全面支持,大多数隐藏式迭代器都可以重写为返回值,而不是对对象的引用。
例如,如果有一个path_view类型,则path::iterator可以返回该类型而不是完整类型path。这样,如果您要执行昂贵的复制操作,则可以。同样,regex_iterator可能已经返回了match对象的副本。通过支持代理迭代器,新概念使以这种方式工作成为可能。
现在,隐藏式迭代器以一种有用的方式处理缓存。迭代器可以缓存其结果,以便重复*it使用仅执行一次昂贵的操作。但是请记住隐藏迭代器的问题:返回对其内容的引用。您不需要这样做就只是要进行缓存。您可以将结果缓存在中optional<T>(当迭代器增加/减少时,该值将无效)。因此,您仍然可以返回一个值。它可能涉及其他副本,但reference不应是复杂的类型。
当然,所有这些都意味着auto &val = *it;不再是法律法规。但是,auto &&val = *it;将始终有效。实际上,这是Range TS版本迭代器的很大一部分。