2019数据智能创新应用大赛启动报名
发布时间:2019-11-06 16:24来源: 网络整理【TechWeb】11月6日,由北京市科学技术委员会人才交流中心和北京百分点信息科技有限公司联合举办的“2019数据智能创新应用大赛”正式启动。10月6日开启参赛报名。大赛以“创新应用路数据赋能”为主题,致力于为全国高校、企业、团队和个人搭建一个公平开放的数据智能创新应用竞技平台。
据介绍,本次大赛赛题定为“基于AdversarialAttack的问题等价性判别”,要求参赛团体和个人通过研究智能对话的鲁棒性问题进行算法创新,创造出更多新的智能解决方案,解决法律知识问答当中存在的系统不稳健问题,提高对话系统的“思考能力”和“解决问题”的能力,实现从“听见”到“听懂”,最终提高AI律师助手的用户体验度。
众所周知,现在问题等价性模型的效果评测都是在“干净”的数据集上测试的,以最为著名的Quora问题等价性为例,该数据集中的问题均为符合语法规则且毫无拼写错误的句子构成的。然而,在实际的问答应用场景中,用户输入的问句常常是高度口语化的,这种情况下,输入的问题会有明显的噪音,这些噪音会严重影响深度学习模型的效果。比如,如用户拼写或者语音转文字的错误,例如用户将“寻衅滋事一般会怎么处理”输入为“寻衅兹事一般会怎么处理”,这种情况在语音转文字的过程中较为普遍;针对语音转文字的情况,用户可能会插入很多口语词,例如“嗯,我问一下啊,就是,法院,啊,管不管扰民啊”;用户输入高度口语化的句子,这些句子不符合语法规则,例如“法院该不该管管辖停车的事情啊”。
构造针对这些噪音稳定的模型,十分有助于提高智能问答系统的用户体验。因此,本任务在测试集中加入大量的对抗样例(AdversarialExample)来模拟以上场景,需要参赛选手在任务中提高问题语义等价模型的鲁棒性(注意,在发布的训练集和验证集中均没有加入对抗样例)。同时,本赛事面向参赛选手公开业内首批法律问答类数据集。
据介绍,大赛将邀请高校学科带头人、业界专家、企业技术负责人担任大赛评委,通过“赛事评选、人才培养、科研创新、产业转化”创新模式,目标是探索用数据智能来解决现实世界问题的可行性,为企业和社会挖掘并培养掌握新一代信息技术的数字人才。
大赛将于12月16日开始测试验证,12月17日任务提交,并在12月底进行颁奖典礼。大赛评选一等级1名,奖金3万元;二等奖2名,奖金1万元;三等奖3名,奖金5000元。