您的位置:首页 > 其它

分词词云 logistic相关研究 2016.05.16回顾

2016-05-17 14:22 183 查看
上午研究了下分词,词频统计,生成词频云,把某几个QQ群的聊天记录导出做了实验,效果还是可以,程序是在别人的程序基础上修改的,主要涉及到jieba模块用于中文分词,wordcloud模块用于生成词云,画图是用到matplotlib,还写了个清洗QQ聊天记录的程序,主要是去掉一些系统生成的关于日期发言人等无用信息,同时也算温习了正则表达式之类的知识,还挺好玩的,我一直尝试想导出微信的数据,特别是朋友圈的文字,好像比较麻烦就作罢,空了进一步研究

后边好像很困,漫无目的地随便网上看了一会儿,后来验证了下模型结果,对于SQL做了一处修改,修改了views.py

昨天很多时间用于解决1/(1+exp(x))为什么不能收敛的问题,然后我自己推导了公式,纠正了以前的一个错误观点,取得了重大突破,但是这个体系我还有几个问题未能解决,等解决了,我会集中写一篇博客

总结:昨天总的说来还可以,效率再高点儿就更好了,还有就是睡觉要提前一些!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: