您的位置:首页 > 编程语言 > C语言/C++

c/c++运用nlpir进行自动化中文分词

2015-04-01 13:36 66 查看
由于毕业设计的需要,需要运用自动化分词和提取关键词,这个对于不专业的我还颇具难度,最开始把分词包直接加入到python中一直没有成功。在C下配置成功,记录一下步骤

用vs2013创建新项目,选择控制台程序,命名为nlpir

点击下一步,不要选中预编译头,然后点完成

在nlpir.cpp中写入下列代码(其中1.txt是待处理的文本):
#include <iostream>
#include <fstream>
#include <string>
using namespace std;
#include "NLPIR.h"
#pragma comment(lib,"NLPIR.lib")
int main(int argc, char *argv[])
{

	ifstream fin("1.txt", ios::in);
	if (!fin){ cout << "1.txt file read error!" << endl; return -1; }
	string text, tempstr;
	while (!fin.eof())
	{
		getline(fin, tempstr);
		text += tempstr + "\r\n";
	}
	cout<<text<<endl;
	if (!NLPIR_Init())
	{
		cout << "NLPIR_Init() error!" << endl;
		return -1;
	}
	string resulttext = NLPIR_ParagraphProcess(text.c_str(), 1);
	cout << resulttext << endl;
	int a;
	cin>>a;
	NLPIR_Exit();
	return 0;
}


下载nipir分词系统

将bin\ICTCLAS2015路径下的NLPIR.dll

根路径下的data文件夹

include路径下的NLPIR.h文件

lib\win32下的NLPIR.lib文件

复制到工程nlpir的nlpir文件夹下(共有4个文件)

将待处理文件1.txt复制到nlpir文件夹下,然后就可以运行了

配置成功后可以查看分词系统doc文件夹下的开发手册,调用其它相应的函数接口

参考文档:ht tp://hi.baidu.com/doubleysl/item/9176c689b5683b2f110ef324
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: