您的位置:首页 > 其它

【cl】预处理&划分测试集、训练集

2009-11-14 16:07 330 查看
没有什么技术含量,完全在处理一些琐碎的边界条件。

很久没有写程序,花了一点时间温习VC++字符串处理和文件输入输出,总耗时三个小时囧

一些需要注意的小问题:

词语之间有两个(全角?)空格;

句子有时以空格+'/n'结尾,但每段最后一句没有空格;

句子有时以'/n/r'结尾,但getline默认的终结符是'/n',需要额外处理'/r',否则划分之后会有小黑框出现在句子结尾。。。囧

每次调用string的find之类的函数需要判断返回值是否是-1,否则可能会引发错误。。。

字符串处理&文件输入输出的函数:

#include <ifstream>

#include <string>

using namespace std;

ifstream in("in.txt");

char tmp[MAXLEN];

in.getline(tmp,MAXLEN);

string str(tmp);

str.find(' ');

str.substr(offset, count);

str.erase(offset, count);

str.clear();

str.empty();

生成随机数:

#inlcude <stdlib.h>

rand() * (max-min) / (RAND_MAX+1);
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: