scws简单中文分词
2017-07-28 16:11
281 查看
demo如下:
附官网文档:http://www.xunsearch.com/scws/docs.php
php+中文分词scws+sphinx+mysql打造千万级数据全文搜索:http://blog.csdn.net/nuli888/article/details/51892776
/** * 中文分词 * @param $keyword * @param $getTop * @param $limit * @return array */ function splitWords($keyword, $getTop = false, $limit = 5): array { if (! $keyword) { return []; } $filePath = ini_get('scws.default.fpath'); $handle = scws_new(); $handle->set_charset('utf-8'); // 添加分词字典 $handle->add_dict($filePath . '/dict.utf8.xdb'); // 设置分词规则 $handle->set_rule($filePath . '/rules.utf8.ini'); // 是否复式分割 $handle->set_duality(false); // 忽略标点符号 $handle->set_ignore(true); // 是否将闲散文字自动以二字分词法聚合 $handle->set_multi(SCWS_MULTI_SHORT); $handle->send_text($keyword); if ($getTop) { $words = $handle->get_tops($limit); } else { $words = $handle->get_result(); // 根据词频降序排列 if ($words) { $sortIdf = array_map(function($item){ return $item['idf']; }, $words); array_multisort($sortIdf, SORT_DESC, $words); $words = array_slice($words, 0, $limit); } } return $words ? $words : []; }
附官网文档:http://www.xunsearch.com/scws/docs.php
php+中文分词scws+sphinx+mysql打造千万级数据全文搜索:http://blog.csdn.net/nuli888/article/details/51892776
相关文章推荐
- 让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
- php+中文分词scws+sphinx+mysql打造千万级数据全文搜索
- php中文分词系统SCWS的用法
- php中文分词系统SCWS的用法
- wamp下安装scws(中文分词)
- ThinkPHP3.2添加scws中文分词
- scws中文分词组件
- php中文分词系统SCWS的用法
- ucene + IKAnalyzer 中文分词及索引,简单实例
- 让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
- scws中文分词组件
- php中文分词系统SCWS的用法
- 使用Lucene和IKAnalyzer实现 中文简单 分词
- 使用scws组件分词和phpanalysis分词类实现简单的php分词搜索
- PHP scws中文分词扩展安装
- PHP+mysql数据库开发搜索功能:中英文分词+全文检索(MySQL全文检索+中文分词(SCWS))
- 给lucene.net增加SCWS中文分词功能
- SCWS中文分词,功能函数实例应用
- php中文分词系统SCWS的用法
- 简单实现中文分词中的常用字过滤