专注文本处理,达观数据完成B轮融资,累计融资超2亿元
11月22日,达观数据宣布成功完成1.6亿元B轮融资,由宽带旗下基金晨山资本领投,元禾重元、联想之星、钟鼎资本及老股东等跟投。达观数据总部位于上海张江高科技园区,目前已在北京、成都、深圳、西安等地开设分支机构。2015年获真格基金领投,众麟资本和掌门科技跟投的1000万元天使轮融资,2017年获软银赛富和方广资本5000万元A轮融资。截至目前,达观数据累计融资额已超2亿元。
利用文字语义分析技术,达观数据为客户提供文本自动化处理软件系统,功能涵盖文本要素抽取、智能审核、舆情分析、知识搜索、推荐引擎、自动写作等,广泛用于金融,传媒,制造,政府,法律,军工等领域,成功服务了数百家客户,让计算机代替人工实现文本自动处理。
今年达观数据自主研发的文档智能审阅系统,是一款集文档关键信息抽取、文档比对、风险审核和智能纠错于一体的文字语义分析系统。该系统支持多种文档形式处理,利用机器学习及自然语言技术,自动从企业文档中抽取出关键信息,企业可借此将合同信息结构化,便于后期管理;信贷审阅则可借此一目了然净利润、主营业务收入等信息,以便进行后续评估。
文档智能审阅系统可将多种文档形式对同类文件信息进行比对,并提供可视化的比对结果展示;同时自动识别出合同中不规范的内容和缺失的必要条款,加强企业风险控制。
达观数据曾凭借语义分析技术获得中国智能科技最高奖——吴文俊人工智能科学技术奖;在近年来举办的各类算法竞赛中达观数据也多次获奖,包括最高人民法院的“法研杯”司法文书自动处理挑战赛的“刑期智能预测”系统,军委装备部的“军事智能-机器阅读”竞赛等。
大观数据CEO陈运文表示,中国企业的智能化应用还在初始阶段,大量书面文字工作目前还依赖人力来完成。不论是基础性的文档分析审阅,还是在知识搜索和信息推荐等应用层面,都还很薄弱。如何将文本语义理解技术,结合行业的知识图谱,形成自动化的处理系统,无缝嫁接到企业的业务场景中去,提高企业效率,是达观数据一直在探索和努力的方向。
“人工智能的落地应用不是一蹴而就的事情,从理论到应用有很多的困难要克服,而语义分析又是其中挑战特别大的方向,因为语义是人类智慧的高度抽象和浓缩,让计算机去理解文字语义需要日积月累、精益求精的不断升级优化”,陈运文表示:“新一轮的资金投入,一方面将用于公司加强技术研发和团队建设,积累超大规模语料数据库;另一方面也将资助业界优秀的科学家们进行基础技术研究,并肩攻克难题。”
阅读更多- 用MapReduce进行数据密集型文本处理 – 本地聚合(上)
- JDBC处理大文本数据-Clob
- Python数据分析之文本处理词频统计
- awk命令_Linux awk 命令用法详解:文本和数据进行处理的编程语言
- CNTK API文档翻译(17)——多对多神经网络处理文本数据(1)
- java处理数据文本时间小函数积累
- 探索Python数据分析(一):NLTK库和文本处理
- 阿里AI实验室新添两员大将,易鑫集团计划融资8亿美元即将完成IPO | 大数据24小时
- 【Scikit-Learn 中文文档】五十:处理文本数据 - scikit-learn 教程 | ApacheCN
- J2EE进阶之JDBC分页,大文本数据存储,批处理,事物处理 十八
- 用JAVA处理文本与二进制数据混合大文件
- Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- 处理文本数据(scikit-learn 教程3)
- caffe:create_txt.sh(数据预处理成txt文本文件)
- 非常全面到位的介绍与源代码地址 :Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
- Text Line Dereplication BigData Tool 文本行去重化 大数据工具 130Gb 20亿行数据 60分钟即可完成去重操作 最快的单机版软件
- Java中使用正则表达式处理文本数据
- MATLAB处理txt文本文件---数据格式要有规律性,否则要用编写特定方式进行读取
- 用MapReduce进行数据密集型文本处理 – 本地聚合(下)