您的位置:首页 > 大数据 > 人工智能

观点问题如何练就“火眼金睛”?百度人工智能开源大赛即将开启

2020-08-11 18:07 1156 查看

5G时代到来,我们获取信息的渠道越来越多,速度越来越快,而不可避免的数据量也就变得越加庞大。大量的信息喷涌而来,从中辨识真假的成本也在不断增加,更不用提由大量信息混杂而形成的一个事件了。

举一个简单的例子,立秋刚过,有人说秋后风冷空调不能开低温;有人则说秋老虎更热,空调不能停。再比如,有人说端午是为了纪念屈原所以必须要说安康;但有人却说端午节自古有之,并不只是为屈原,所以端午快乐完全无伤大雅……类似这样的观点型问题在生活中数不胜数,但能够给出准确答案的却寥寥无几。

因此,更多人想到的解决办法则是“遇事不决问AI”。人工智能在回答观点型问题方面,不仅更为高效,而且精准度极高。在日常生活中我们常遇到的一些疑难问题,只要能够充分发挥AI的力量,获取答案的速度必将更加迅速。不过AI的力量并非无源之水,数据就是AI获取力量的必要条件

想要发挥AI的力量,就必须要有大量的数据进行算法模型训练;

而想要让AI得出的结果更加真实,就必须要保障所用数据的真实性;

那么大量的真实数据哪里找?能够精准高效完成机器阅读理解任务模型如何打造?

百度人工智能开源大赛就会给大家提供所有的条件!此次比赛具备实用性、开放性和权威性。首先,比赛赛题是在生活中常用到的观点型问题的机器阅读理解任务,从开发到落地一气呵成;其次,百度将会为广大开发者提供大量的真实数据,帮助大家完成此次任务。本次比赛是由北京市政府、中关村管委会指导,中国人工智能产业发展联盟、百度等单位共同依托2020AIIA人工智能开发者大会举办,聚焦人工智能“基础研究”+“产融结合”,将集中各方力量力争把赛事打造成北京地区人工智能开源领域的顶级赛事,形成业界标杆。

聚焦真实场景,掌握真实数据

如此高规格的赛事,考验的也是在日常生活中市场广阔的实际性问题。

本次竞赛题目为面向观点型问题的机器阅读理解任务,这一任务主要源于真实的应用场景。举例来看,在智能搜索问答等产品中,针对用户输入的观点型问题,搜索引擎首先会优先检索相关候选文档,然后从候选文档中抽取出能够回答用户问题的答案段落摘要,最后给出答案段落摘要所包含的是非观点。

在这场比赛中,毫无疑问,数据就是此次比赛中至关重要的内容。

竞赛任务聚焦于预测答案段落摘要中所表述的是非观点极性,将基于DuReader的中文是非观点型问题阅读理解数据集为选手提供样例数据、训练数据集和全新的测试数据集。DuReader是一个面向真实应用的、开放域的、最大规模的中文问答阅读理解数据集,其优势便在于数据来源的真实性。

此次比赛中,所选问题是百度搜索中用户提出的真实问题,文档也是来自于百度搜索和百度知道,并且答案都是人工标注的。而本次竞赛的数据集均是来自DuReader中的观点型问题,包含上万问答对以及人工标注的答案段落摘要和相应的是非观点极性。

基于飞桨,赢取十万好礼

本次大赛将依托百度人工智能学习与实训社区AI Studio举办,并为每一支参赛队伍免费提供100小时的GPU算力资源。

百度飞桨是本次大赛的唯一指定深度学习框架。作为国内首个开源开放、技术领先、功能完备的产业级深度学习平台,飞桨一直以来有力推动着各企业、个人发展具有自主知识产权的AI技术。

飞桨和AI Studio将在本次大赛中,助力开发者快速实现算法创新和应用落地,引导人工智能产业健康发展。

对于优秀的开发者,大赛官方提供了重金奖励。本次竞赛总奖金池10万,其中一等奖1名,奖金5万,二等奖2名,奖金1.5万,三等奖3名,奖金5千,优胜奖5名,奖品1000元京东卡。

同时,主办方还将为获奖者颁发相应荣誉证书。获奖团队可推荐在北京市、中关村科技园区管理委员会、中国信息通信研究院、中国人工智能产业发展联盟等组织的相关会议上发表研究成果。优先推荐参与相关行业会议。

比赛即将开启,欢迎报名参与

这场令人瞩目的比赛将会在8月10日正式启动注册报名,所有参赛队伍通过资格审核后,便将发放比赛训练集,大量由百度提供的脱敏数据集将会送达每个参赛者手中。此次活动将会在在9月1日开放评测入口和排行榜,并在9月底举行颁奖典礼。如果你也想亲自参与到这次比赛之中,赢取好礼,那就点击下方阅读原文,赶快报名吧!

报名链接:

https://aistudio.baidu.com/aistudio/competition/detail/42

飞桨官网:

https://www.paddlepaddle.org.cn/

点击下方“阅读原文”,直达报名页面!

↓↓↓

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: