【cl】预处理&划分测试集、训练集
2009-11-14 16:07
330 查看
没有什么技术含量,完全在处理一些琐碎的边界条件。
很久没有写程序,花了一点时间温习VC++字符串处理和文件输入输出,总耗时三个小时囧
一些需要注意的小问题:
词语之间有两个(全角?)空格;
句子有时以空格+'/n'结尾,但每段最后一句没有空格;
句子有时以'/n/r'结尾,但getline默认的终结符是'/n',需要额外处理'/r',否则划分之后会有小黑框出现在句子结尾。。。囧
每次调用string的find之类的函数需要判断返回值是否是-1,否则可能会引发错误。。。
字符串处理&文件输入输出的函数:
#include <ifstream>
#include <string>
using namespace std;
ifstream in("in.txt");
char tmp[MAXLEN];
in.getline(tmp,MAXLEN);
string str(tmp);
str.find(' ');
str.substr(offset, count);
str.erase(offset, count);
str.clear();
str.empty();
生成随机数:
#inlcude <stdlib.h>
rand() * (max-min) / (RAND_MAX+1);
很久没有写程序,花了一点时间温习VC++字符串处理和文件输入输出,总耗时三个小时囧
一些需要注意的小问题:
词语之间有两个(全角?)空格;
句子有时以空格+'/n'结尾,但每段最后一句没有空格;
句子有时以'/n/r'结尾,但getline默认的终结符是'/n',需要额外处理'/r',否则划分之后会有小黑框出现在句子结尾。。。囧
每次调用string的find之类的函数需要判断返回值是否是-1,否则可能会引发错误。。。
字符串处理&文件输入输出的函数:
#include <ifstream>
#include <string>
using namespace std;
ifstream in("in.txt");
char tmp[MAXLEN];
in.getline(tmp,MAXLEN);
string str(tmp);
str.find(' ');
str.substr(offset, count);
str.erase(offset, count);
str.clear();
str.empty();
生成随机数:
#inlcude <stdlib.h>
rand() * (max-min) / (RAND_MAX+1);
相关文章推荐
- Python数据预处理—训练集和测试集数据划分
- R语言实现数据抽样&创建训练集和测试集
- 划分训练集和测试集和验证集
- Sklearn-train_test_split随机划分训练集和测试集
- 机器学习中训练集、验证集(开发集)、测试集如何划分
- 为什么要划分训练集、验证集、测试集?
- Sklearn-train_test_split随机划分训练集和测试集
- Sklearn-train_test_split随机划分训练集和测试集
- [机器学习]划分训练集和测试集的方法
- Sklearn-train_test_split随机划分训练集和测试集
- 【七】机器学习之路——训练集、测试集及如何划分
- r语言中怎么划分训练集和测试集
- sklearn:随机划分训练集和测试集
- Matlab划分测试集和训练集
- 机器学习中,如何利用训练集&测试集来判断 方差(varience)& 偏差(bias)
- python 划分数据集为训练集和测试集
- 使用Java随机划分数据集为训练集和测试集
- Sklearn-train_test_split随机划分训练集和测试集
- 编译原理 (预处理>编译>汇编>链接)
- 自定义屏幕中ALV 双击事件怎样触发屏幕的PAI(cl_gui_cfw=&gt;set_new_ok_code)