【码云周刊第 33 期】6款程序员必备的开源中文处理工具
2017-08-14 09:10
393 查看
摘要: 每周为您推送最有价值的开源技术内参!
##码云项目推荐
1、项目名称: 中文转拼音库 pinyin4j
**项目简介:**Pinyin4j 是一个流行的 Java 库,支持中文字符和拼音之间的转换。拼音输出格式可以定制。
**项目地址:**https://gitee.com/cocho/pinyin4j
**2、项目名称:汉字/拼音转换工具库 Pinyin4Net **
**项目简介:**Pinyin4Net 是一个 .net 下的汉字/拼音转换工具库。现支持 .net2.0, .net4.0, .netcore1.1 ( standaedlib1.6 ),针对三个 .net 版本分别有3个分支。
接口:
汉字单字转拼音
汉字字符串转拼音
汉字转拼音格式选项,可用大小写,声调以及对拼音中(v ü)的处理
获取汉字多音字的所有读音
根据拼音查询所有匹配的汉字
姓名拼音单独数据库和单独的查询接口
**项目地址:**https://gitee.com/hyjiacan/Pinyin4Net
3、项目名称:php 拼音扩展 pinyin-php
**项目简介:**pinyin-php 是一个 C 语言编写的 php 扩展,用于将汉字翻译为汉语拼音。通过逆序中文分词的方法实现提高多音字识别。将字词库置于程序之外通过 php.ini 配置文件指定路径加载。
**项目地址:**https://gitee.com/duguying2008/pinyin-php
4、项目名称:敏感词检测组件
**项目简介:**一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母,拼音模糊搜索等功能。
**项目地址:**https://gitee.com/toolgood/ToolGood.Words
**5、项目名称: 基于 PHP 的简繁体转换工具 ccsw **
**项目简介:**ccsw 是基于 opencc4 php 开发,能很智能的完成简繁体转换。功能如下所示:
转换效果: 你干什么不干我事 => 你幹什麼不干我事
地区词汇转换效果: 我鼠标哪儿去了 => 我滑鼠哪兒去了
**项目地址:**https://gitee.com/flyhope/opencc4php
6、项目名称: 拼音搜索汉字工具 UTPinYinHelper
**项目简介:**本项目是通过拼音去匹配汉字,简单来说,就是拼音搜索。
**项目地址:**https://gitee.com/tangzhengyue/UTPinYinHelper
代码片段搜索支持内容的搜索;
新增 CSDN 第三方登录;
修复项目转移后文件404的缓存问题;
个人升级为组织以及企业保留代码片段;
PR 合并支持 Squash Merge(即将需要 merge 的多个提交合并成一个提交)。
码云 Markdown 解析器更换为 CommonMark 解析器
之前码云的解析器基于用户的反馈做了很多定制化的修改,但是随着使用码云的用户越来越多,以及越来越多的Github用户往码云上迁移,我们收到了很多用户反馈,在Github正常解析渲染的Readme在码云上渲染出来的结果却有所出入,讨论再三,我们决定将码云的 Markdown 解析器更换为 CommonMark。
##推荐阅读:
【码云周刊第 32 期】程序员眼中的 Vue 与 Angular !
【码云周刊第 31 期】从实战项目开始学做微信小程序!
【码云周刊第 30 期】打造场景化的图片特效处理工具
【码云周刊第 29 期】构建高性能微服务架构
【码云周刊第 28 期】计算机视觉时代的识图技术
##请关注码云官方微信公众号,了解更多开源项目资讯!
##码云项目推荐
1、项目名称: 中文转拼音库 pinyin4j
**项目简介:**Pinyin4j 是一个流行的 Java 库,支持中文字符和拼音之间的转换。拼音输出格式可以定制。
**项目地址:**https://gitee.com/cocho/pinyin4j
**2、项目名称:汉字/拼音转换工具库 Pinyin4Net **
**项目简介:**Pinyin4Net 是一个 .net 下的汉字/拼音转换工具库。现支持 .net2.0, .net4.0, .netcore1.1 ( standaedlib1.6 ),针对三个 .net 版本分别有3个分支。
接口:
汉字单字转拼音
汉字字符串转拼音
汉字转拼音格式选项,可用大小写,声调以及对拼音中(v ü)的处理
获取汉字多音字的所有读音
根据拼音查询所有匹配的汉字
姓名拼音单独数据库和单独的查询接口
**项目地址:**https://gitee.com/hyjiacan/Pinyin4Net
3、项目名称:php 拼音扩展 pinyin-php
**项目简介:**pinyin-php 是一个 C 语言编写的 php 扩展,用于将汉字翻译为汉语拼音。通过逆序中文分词的方法实现提高多音字识别。将字词库置于程序之外通过 php.ini 配置文件指定路径加载。
**项目地址:**https://gitee.com/duguying2008/pinyin-php
4、项目名称:敏感词检测组件
**项目简介:**一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母,拼音模糊搜索等功能。
**项目地址:**https://gitee.com/toolgood/ToolGood.Words
**5、项目名称: 基于 PHP 的简繁体转换工具 ccsw **
**项目简介:**ccsw 是基于 opencc4 php 开发,能很智能的完成简繁体转换。功能如下所示:
转换效果: 你干什么不干我事 => 你幹什麼不干我事
地区词汇转换效果: 我鼠标哪儿去了 => 我滑鼠哪兒去了
**项目地址:**https://gitee.com/flyhope/opencc4php
6、项目名称: 拼音搜索汉字工具 UTPinYinHelper
**项目简介:**本项目是通过拼音去匹配汉字,简单来说,就是拼音搜索。
**项目地址:**https://gitee.com/tangzhengyue/UTPinYinHelper
码云一周更新说明
代码片段编辑器支持高亮;代码片段搜索支持内容的搜索;
新增 CSDN 第三方登录;
修复项目转移后文件404的缓存问题;
个人升级为组织以及企业保留代码片段;
PR 合并支持 Squash Merge(即将需要 merge 的多个提交合并成一个提交)。
码云 Markdown 解析器更换为 CommonMark 解析器
之前码云的解析器基于用户的反馈做了很多定制化的修改,但是随着使用码云的用户越来越多,以及越来越多的Github用户往码云上迁移,我们收到了很多用户反馈,在Github正常解析渲染的Readme在码云上渲染出来的结果却有所出入,讨论再三,我们决定将码云的 Markdown 解析器更换为 CommonMark。
##推荐阅读:
【码云周刊第 32 期】程序员眼中的 Vue 与 Angular !
【码云周刊第 31 期】从实战项目开始学做微信小程序!
【码云周刊第 30 期】打造场景化的图片特效处理工具
【码云周刊第 29 期】构建高性能微服务架构
【码云周刊第 28 期】计算机视觉时代的识图技术
##请关注码云官方微信公众号,了解更多开源项目资讯!
相关文章推荐
- 6款程序员必备的开源中文处理工具
- Java程序员必备的6款最佳开发工具
- 10款程序员必备的免费开源安全工具
- Java程序员必备的6款最佳开发工具
- Java程序员必备的6款最佳开发工具
- Java程序员必备的6款最佳开发工具
- 推荐6款常用的Java开源报表制作工具
- 程序员必备的工具
- 程序员必备Java API和类搜索辅助工具发布
- 10款Web程序员必备的CSS工具
- 推荐6款常用的Java开源报表制作工具
- 【码云周刊第 30 期】打造场景化的图片特效处理工具
- .NET 程序员十种必备工具摘抄
- [网摘].NET 程序员十种必备工具-NDoc
- Android Java 程序员必备开发工具
- Java程序性能分析工具Java VisualVM(Visual GC)—程序员必备利器
- .NET 程序员必备工具下载
- 收藏!程序员九个必备工具!