分词词云 logistic相关研究 2016.05.16回顾
2016-05-17 14:22
183 查看
上午研究了下分词,词频统计,生成词频云,把某几个QQ群的聊天记录导出做了实验,效果还是可以,程序是在别人的程序基础上修改的,主要涉及到jieba模块用于中文分词,wordcloud模块用于生成词云,画图是用到matplotlib,还写了个清洗QQ聊天记录的程序,主要是去掉一些系统生成的关于日期发言人等无用信息,同时也算温习了正则表达式之类的知识,还挺好玩的,我一直尝试想导出微信的数据,特别是朋友圈的文字,好像比较麻烦就作罢,空了进一步研究
后边好像很困,漫无目的地随便网上看了一会儿,后来验证了下模型结果,对于SQL做了一处修改,修改了views.py
昨天很多时间用于解决1/(1+exp(x))为什么不能收敛的问题,然后我自己推导了公式,纠正了以前的一个错误观点,取得了重大突破,但是这个体系我还有几个问题未能解决,等解决了,我会集中写一篇博客
总结:昨天总的说来还可以,效率再高点儿就更好了,还有就是睡觉要提前一些!
后边好像很困,漫无目的地随便网上看了一会儿,后来验证了下模型结果,对于SQL做了一处修改,修改了views.py
昨天很多时间用于解决1/(1+exp(x))为什么不能收敛的问题,然后我自己推导了公式,纠正了以前的一个错误观点,取得了重大突破,但是这个体系我还有几个问题未能解决,等解决了,我会集中写一篇博客
总结:昨天总的说来还可以,效率再高点儿就更好了,还有就是睡觉要提前一些!
相关文章推荐
- Settings.apk修改
- HDU 2665 Kth number 划分树
- UISegmentedControl的用法
- part1:15-安装Linux系统到开发板
- iOS 计时器 单例 GCD 切换控制器倒计时继续读秒
- ansible playbook 学习
- java基础第八天_多线程
- Netty 实现聊天功能
- 【Android】关于addTextChangedListener()方法的上机记录
- 杭电1495
- 简单的tcp服务
- org.apache.commons.lang3.ArrayUtils 学习笔记
- memcached添加IP白名单,只允许指定服务器调用
- 便携名片app
- 热补丁方案研究
- Iptables防火墙(基础知识)
- 前端之路
- Golang测试技术
- STM32的时钟系统RCC详细整理
- 动态的99乘法表