asp中利用CSW中文分词组件来实现自己网站的内容关键词自动提取
2007-03-09 00:00
696 查看
比如标题是:腾讯QQ 2006 珊瑚虫集成版 v4.5b
分词后:[此资源关键词:腾讯 QQ 珊瑚虫 集成 ]
并且把关键词做成专题,可以为每个内容页面生成相关连接了
用CSW中文分词组件
下载:http://www.vgoogle.net/Product_CSW.asp
下面是我的ASP代码,比较粗浅,但实用
codecsw 得到输出的所有分词结果,用它的组建里面有个ASP文件,你一看就知道怎么得到分词结果了,这个不详细说了。
就这样实现了,呵呵,在分词表的内容ID都是用,来分割的,读取的时候自己研究下就可以
分词后:[此资源关键词:腾讯 QQ 珊瑚虫 集成 ]
并且把关键词做成专题,可以为每个内容页面生成相关连接了
用CSW中文分词组件
下载:http://www.vgoogle.net/Product_CSW.asp
下面是我的ASP代码,比较粗浅,但实用
codecsw 得到输出的所有分词结果,用它的组建里面有个ASP文件,你一看就知道怎么得到分词结果了,这个不详细说了。
fcon=split(htm," ") fcs=ubound(fcon) for fci=0 to fcs if fci mod 2=0 then fcn=fcn&fcon(fci)&"$fc^#$" '我这里用$fc^#$来分割每个分词 else fcw=fcw&fcon(fci)&"$fc^#$" end if next fcn=left(fcn,len(fcn)-12) '去掉最前面的$fc^#$ fcw=left(fcw,len(fcw)-6) 去掉最后面的$fc^#$ don=split(fcn,"$fc^#$") donn=split(fcw,"$fc^#$") dos=ubound(don) for doi=0 to dos fcname=don(doi) '得到分词 fcsx=donn(doi) '得到分词属性 '下面是判断分词符合我所提出的属性,比如名词、名动词、动词等,排除了数词、状词和连接词等。 if fcsx="/b" or fcsx="/nz" or fcsx="/n" or fcsx="/an" or fcsx="/nx" or fcsx="/f" or fcsx="/i" or fcsx="/l" or fcsx="/ng" or fcsx="/nr" or fcsx="/ns" or fcsx="/nt" or fcsx="/nz" or fcsx="/v" or fcsx="/vn" or fcsx="/s" or fcsx="/g" then if len(fcname)>1 then if instr(fcname1,fcname&"$") then else if fcname<>" " and fcname<>"" then fcname=replace(replace(replace(trim(fcname),chr(10),""),chr(13),""),chr(10)&chr(13),"") '去除分词的换行和回车键 if len(fcname)>1 then '这里是分词入库,我的分词库只有三个字段,自动ID、分词名称和分词所属的内容ID Set Rs = CreateObject("ADODB.Recordset") sql="select top 1 * from fc where fcname='"&fcname&"'" rs.open sql,conn,1,3 if rs.eof then rs.addnew end if rs("fcname")=fcname if instr(rs("mid"),","&id&",") then else rs("mid")=rs("mid")&","&id&"," end if rs.update rs.close set rs=nothing '分词入库结束 end if end if response.write fcname&"("&fcsx&")<br>" mfc=mfc&fcname&"," end if fcname1=fcname1&fcname&"$" end if end if next '这里是将分词添加到内容表,在内容表我只多加了一个分词字段mfc if right(mfc,1)="$" then mfc=left(mfc,len(mfc)-1) Set Rs = CreateObject("ADODB.Recordset") sql="select top 1 mfc from m where mid="&id rs.open sql,conn,1,3 rs("mfc")=mfc rs.update rs.close set rs=nothing end if
就这样实现了,呵呵,在分词表的内容ID都是用,来分割的,读取的时候自己研究下就可以
相关文章推荐
- asp中利用CSW中文分词组件来实现自己网站的内容关键词自动提取
- 《利用条件随机场实现中文病历文本中时间关系的自动提取》——阅读笔记
- NLP自然语言处理 jieba中文分词,关键词提取,词性标注,并行分词,起止位置,文本挖掘,NLP WordEmbedding的概念和实现
- 利用反射实现ASP.NET控件和数据实体之间的双向绑定,并且在客户端自动验证输入的内容是否合法
- ASP.NET下利用HttpModule实现简体中文向繁体中文的自动转换
- Asp.net利用Request属性实现自动返回上次请求页面
- 【.Net码农】用asp.net实现远程获取其他网站页面指定内容
- 利用KVO实现 UITextView 通过代码方式设置内容后,自动滚动到最后一行
- ASP.NET实现网站的自动升级
- 利用ASPUPLOAD,ASPJPEG实现图片上传自动生成缩略图及加上水印
- 面向搜索引擎的内容管理系统(CMS)设计——利用Squid反相代理缓存实现网站内容静态发布
- 【lizhi125】如何方便地自动每天备份自己的网站内容与数据库?
- PHP中文分词 自动获取关键词介绍
- 长内容自动分页的实现 (asp.net C#)
- 在asp.net中长内容自动分页的实现
- c# 实现网页上用户自动登陆|asp.net 模拟网站登录
- 利用PHP实现与ASP Banner组件相似的类
- 利用批处理文件和 vbs 脚本实现网站视频自动录制
- 使用Discuz关键词服务器实现PHP中文分词
- Android自己定义组件之日历控件-精美日历实现(内容、样式可扩展)