您的位置:首页 > 编程语言 > PHP开发

php支持scws扩展模块

2010-12-28 11:34 246 查看
SCWS 是 Simple Chinese Words Segmentation 的缩写,即简易中文分词系统。

  这是一套基于词频词典的机械中文分词引擎,它能将一整段的汉字基本正确的切分成词。词是汉语的基本语素单位,而书写的时候不像英语会在词之间用空格分开,所以如何准确而又快速的分词一直是中文分词的攻关难点。

  SCWS 在概念上并无创新成分,采用的是自行采集的词频词典,并辅以一定程度上的专有名称、人名、地名、数字年代等规则集,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些中小型搜索引擎、关键字提取等场合运用。 SCWS 采用纯 C 代码开发,以 Unix-Like OS 为主要平台环境,提供共享函数库,方便植入各种现有软件系统。此外它支持 GBK,UTF-8,BIG5 等汉字编码,切词效率高。

scws 下载:http://www.ftphp.com/scws/down/scws-1.1.3.tar.bz2
tar xjf scws-1.1.3.tar.bz2
cd scws-1.1.3
./configrue --prefix=/usr/local/scws 
make && make install 
cd phpext
/usr/local/webserver/php/bin/phpize
./configrue --with-scws=/usr/local/scws --with-php-config=/usr/local/webserver/php/bin/config-php
make && make install
这算安装scws 安装完毕! 现在对 php 进行配置,让php 支持scws模块!
vim /usr/local/webserver/php/etc/php.ini
查找extension_dir 修改 "/" 目录为 scws扩展模块的目录,并添加如下:extension_dir = extension_dir = "/usr/local/webserver/php/lib/php/extensions/no-debug-non-zts-20060613"extension = "scws.so"scws.default.charset = utf-8scws.default.fpath = /usr/local/scws/etc
修改完以后重新加载 php 配置文件 
/usr/local/webserver/php/sbin/php-fpm reload  显示如下,就算正常:


参考文章:http://looki.cn/376.htmlhttp://www.ftphp.com/scws/docs.php本文出自 “奋斗的小子” 博客,请务必保留此出处http://crazyming.blog.51cto.com/1048571/466311
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: