您的位置：首页 > 编程语言 > C语言/C++

C++ boost 组件简介：字符串及文本处理

2008-11-10 15:17 411 查看

字符串及文本处理

Boost.Regex

正则表达式是解决大量模式匹配问题的基础。它们常用于处理大的字符串，子串模糊查找，按某种格式tokenize字符串，或者是基于某种规则修改字符串。由于C++没有提供正则表达式支持，使得有些用户被迫转向其它支持正则表达式的语言，如Perl,
awk, 和 sed。Regex提供了高效和强大的正则表达式支持，基于与STL同样的前提而设计，这使得它很容易使用。Regex已被即将发布的Library
Technical Report接受。
Regex 的作者是 Dr. John Maddock.

Boost.Spirit

Spirit库是一个多用途的、递归的语法分析器生成框架。有了它，你可以创建命令行分析器，甚至是语言预处理器[1]。它允许程序员直接在C++代码里使用(近似于)EBNF的语法来指定语法规则。分析器非常难写，对于一个特定的问题，它们很快就变得难于维护和看懂。而Spirit解决了这些问题，而且达到了与手工制作的分析器一样或几乎一样的性能。

[1]
Wave库使用Spirit实现了一个与C++高度一致的预处理器，就证明了这一点。
Spirit 的作者是 Joel de Guzman, 以及一组熟练的程序员。

Boost.String_algo

这是一组与字符串相关的算法。包括很多有用的算法，用于大小写转换，空格清除，字符串分割，查找及替换，等等。这组算法是目前C++标准库里已有功能的扩展。
String_algo 的作者是 Pavol Droba.

Boost.Tokenizer

这个库提供了把字符序列分割成记号(token)的方法。通用的语法分析任务包括了在已分割的文本流里查找数据。如果可以把字符序列视为多个元素的容器将很有帮助，容器中的元素被执照用户定义的规则所分割。语法分析就成为了在这些元素上进行操作的单个任务，Tokenizer正好提供了这种功能。用户可以决定字符序列如何被分割，在用户请求新的元素时，库将找出相应的记号。
Tokenizer 的作者是 John Bandela.

来源：Beyond the C++ Standard Library An Introduction to Boos

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： c++ 正则表达式 regex tokenize library 算法

相关文章推荐

新的分享

章节导航