问题 regex_token_iterator和regex_iterator有什么区别?


regex_token_iterator和regex_iterator之间有什么区别吗?

看来他们都做同样的工作,但不确定哪一个是更好的表现?


3184
2017-10-12 01:34


起源

如果@ ShafikYaghmour的答案解决了您的问题,请接受。我个人认为这是一个非常好的答案。 - Jonathan Mee


答案:


如果我们看一下它描述的cppreference,确实存在差异 的std :: regex_iterator 如下:

std :: regex_iterator是一个只读的ForwardIterator,用于访问基础字符序列中正则表达式的各个匹配项。

的std :: regex_token_iterator 如:

std :: regex_token_iterator是一个只读的ForwardIterator,用于访问基础字符序列中正则表达式的每个匹配项的各个子匹配项。它还可以用于访问序列中与给定正则表达式不匹配的部分(例如,作为标记化器)。

所以 std::regex_token_iterator 允许您也匹配不匹配的令牌或 n-th 子的表达。

cppreference部分 std::regex_token_iterator 我上面链接的描述了一个典型的实现如下:

std :: regex_token_iterator的典型实现包含   底层std :: regex_iterator,一个容器(例如std :: vector)   请求的子匹配索引,内部计数器等于   submatch的索引,指向std :: sub_match的指针,指向   当前匹配的当前子匹配,以及std :: match_results对象   包含最后一个不匹配的字符序列(在tokenizer中使用)   模式)。

这本书 C ++标准库 解释说 14.4  正则表达式令牌迭代器 如下:

正则表达式迭代器有助于迭代匹配的子序列。然而,   有时你也想处理匹配之间的所有内容   表达式。 [...]此外,您还可以指定积分列表   值,表示“标记化”的元素:

  • -1表示您对匹配的正则表达式(标记分隔符)之间的所有子序列感兴趣。
  • 0表示您对所有匹配的正则表达式(标记分隔符)感兴趣。
  • 任何其他值n意味着您对正则表达式中匹配的第n个子表达式感兴趣。

books网站提供了示例代码 sregex_token_iterator 和 sregex_iterator 这应该也有帮助。


11
2017-10-12 02:17