机器学习、自然语言处理、大数据和keras学习资料
2016-06-08 22:04
447 查看
中文keras学习资料
http://blog.csdn.net/zhoubl668/article/details/45559955http://keras-cn.readthedocs.io/en/latest/#keras_1
支持向量机通俗导论(理解SVM的三层境界)
http://blog.csdn.net/v_july_v/article/details/7624837神经网络语言模型
http://www.open-open.com/lib/view/open1426578842601.html大数据
数据挖掘有很多不同的实施方法,如果只是把数据拉到Excel表格中计算一下,那只是数据分析,不是数据挖掘。本文主要讲解数据挖掘的基本规范流程。CRISP-DM和SEMMA是两种常用的数据挖掘流程。http://www.36dsj.com/archives/15450
语料库
http://www.36dsj.com/archives/21118国内外著名大学研究所提供的免费语料库 用于标注翻译以及其他自然语言任务
以下语料库链接转载自http://blog.csdn.net/u010708470/article/details/52749535?locationNum=7
Penn Treebank http://www.cis.upenn.edu/~treebank/home.html
WSJ Corpus https://catalog.ldc.upenn.edu/LDC2000T43
NEGRA German corpus http://www.coli.uni-saarland.de/projects/sfb378/negra-corpus/
Tiger corpus http://www.ims.uni-stuttgart.de/projekte/TIGER/TIGERCorpus/
alpino Treebank http://odur.let.rug.nl/~vannoord/trees/
Bultreebank http://www.bultreebank.org/
Turin University Treebank http://www.di.unito.it/~tutreeb/
prague dependency Treebank http://ufal.mff.cuni.cz/pdt2.0/
大而全的NLTK所有语料
NLTK Corpora http://www.nltk.org/nltk_data/
NLP 代码
https://github.com/hankcs/HanLPHanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
中文分词:最短路分词 N-最短路分词 CRF分词 索引分词 极速词典分词 用户自定义词典
词性标注
命名实体识别:中国人名识别 音译人名识别 日本人名识别 地名识别 实体机构名识别
关键词提取:TextRank关键词提取 自动摘要 TextRank自动摘要 短语提取 基于互信息和左右信息熵的短语提取
拼音转换 多音字 声母 韵母 声调
简繁转换 繁体中文分词 简繁分歧词(简体、繁体、臺灣正體、香港繁體)
文本推荐
语义推荐
拼音推荐
字词推荐
依存句法分析:基于神经网络的高性能依存句法分析器 MaxEnt依存句法分析 CRF依存句法分析
语料库工具:分词语料预处理 词频词性词典制作 BiGram统计 词共现统计 CoNLL语料预处理 CoNLL UA/LA/DA评测工具
DL-NLP入门论文
http://blog.sciencenet.cn/home.php?mod=space&uid=656867Convolutional Neural Network Architectures for Matching NaturalLanguage Sentences
Deep Convolutional Neural Networks for Sentiment Analysis of ShortTexts
Named Entity Recognition with Bidirectional LSTM-CNNs
……
相关文章推荐
- 用Python从零实现贝叶斯分类器的机器学习的教程
- My Machine Learning
- 机器学习---学习首页 3ff0
- Spark机器学习(一) -- Machine Learning Library (MLlib)
- 基于语法树的语句识别算法
- 反向传播(Backpropagation)算法的数学原理
- 关于SVM的那点破事
- 也谈 机器学习到底有没有用 ?
- TensorFlow人工智能引擎入门教程之九 RNN/LSTM循环神经网络长短期记忆网络使用
- TensorFlow人工智能引擎入门教程之十 最强网络 RSNN深度残差网络 平均准确率96-99%
- TensorFlow人工智能引擎入门教程所有目录
- 如何用70行代码实现深度神经网络算法
- 量子计算机编程原理简介 和 机器学习
- 近200篇机器学习&深度学习资料分享(含各种文档,视频,源码等)
- 已经证实提高机器学习模型准确率的八大方法
- 初识机器学习算法有哪些?
- 机器学习相关的库和工具
- 10个关于人工智能和机器学习的有趣开源项目
- 机器学习实践中应避免的7种常见错误