更新时间:2019-04-20 16:01点击:
4月17日,2019年亚太知识发现和数据挖掘会议(PAKDD)在澳门落下帷幕。作为数据挖掘和知识发现领域历史最悠久,领先的国际会议之一,PAKDD 2019也是一次全球范围内专注AutoML(机器自动化学习)的比赛。
据官方公布的资料显示,此次挑战赛共吸引了来自加拿大、美国、澳大利亚、印度、中国等46个国家(地区)的团队参与,经过3个多月的激烈角逐,最终来自中国的企业、高校组成的队伍包揽了比赛前三名:深兰科技(DeepBlueAI)斩获第一、微软亚洲研究院(MLintelligence)位列第二、清华大学(meta_learner)居第三。
巨头押注掀起AutoML风潮
AutoML(Automatic/Automated Machine Learning)的全称是自动机器学习,被称为深度学习领域的新一代王者。
通俗来讲,AutoML是要让机器自动完成建模、自动调参的工作。众所周知,很多 AI 应用的背后都有一支强大的顶尖机器学习专家团队,在人才有限的情况下,能够降低 AI 对专家人才依赖的 AutoML 技术开始成为趋势。
AutoML 就是为了使得整个机器学习过程更加自动化,减少人类专家在整个机器学习过程中的参与,让更多人可以在很少甚至几乎没有专业知识的情况下轻松使用。不管是对机器学习技术的进一步发展,还是机器学习产业应用的全面落地,AutoML 都是至关重要的技术。它像插件一样用起来又快又简单:只要有数据,就能自动创建出由复杂神经网络驱动的决策功能。
这种“快糙猛”地搞定机器学习任务的技术完美地解决了企业,尤其是传统企业、中小型企业和一般的科研机构机器学习专家稀缺的痛点,高度符合当代科技公司核心价值观。
有了AutoML,原先需要2-3年深度学习实现的数据集和精准度可能只需要半个月。目前AutoML已经广泛应用在精准营销、金融风控、自动驾驶、疾病预测等业务场景中,做出了接近甚至超过数据科学家的模型效果,决策精准度超过人类专家规则数倍。
因而各大科技公司巨头纷纷布局AutoML。2018年谷歌云首席科学家李飞飞发布了谷歌的Cloud AutoML,力图让AI民主化,只要你上传自己的数据,Google的NAS算法就会为你找到一个架构,用起来又快又简单。
在此之前,机器学习自动化的产品风潮已经吹起:2017年底,微软发布CustomVision.AI,涵盖图像、视频、文本和语音等各个领域。2018年1月又推出了完全自动化的平台 Microsoft Custom Vision Services(微软定制视觉服务)。
但AutoML的难点在于,第一,参数调节非常复杂,每个工序都需要调。第二,目标函数不可导带来的优化挑战。第三,评估代价特别大,技术运行的中间过程没有办法评估。
比赛结果将推动复杂场景下的落地应用
由于AutoML的种种技术难点,此次PAKDD比赛与以往相比的复杂程度也更大,比赛提供的数据集比之前组织的竞赛大 10 到 100 倍,并且比赛提供的数据集存在不同类别的训练样例数差别很大的任务,整体难度更高。
从此次比赛的公开数据可以看出,深兰科技DeepBlueAI团队最终是凭借5项测试任务中4项第一、1项第二的优异成绩夺冠。
“能在比赛中创新,并运用创新成果更好的解决问题,才是比赛真正吸引人的地方。”在比赛过程中DeepBlueAI团队设计的AutoML将自动化机器学习扩展到了多种数据类型,引入了不同类型的特征预处理、特征工程及特征组合,可在不需要专家的干预下将AutoML应用到更多的现实问题中,间接地推动了AutoML领域的发展。
据了解,这次比赛的结果将在推荐系统、欺诈检测、异常检测、工业制造、广告监测、信用评估等领域得到广泛应用。以AutoML在广告推荐方面的应用为例,通过大数据挖掘与深度学习,构建用户画像和知识图谱,AutoML可以让广告业务指标得到提升。
AutoML对于还不具备数据科学团队的公司来说可以是全自动化的模型构建工具来使用,即便对于具备一定数据科学能力的公司,AutoML仍然可以帮助他们更加专注在人工智能落地中最为重要的事情上。AutoML作为一个有效的工具可以帮助很多企业方便地实施和加速人工智能方面的应用落地和产品对环境的自适应能力,可以真正做到人工智能算法的自我学习功能。终生机器学习方法还可以依据定期收集的数据,做到算法的自我更新和自我适应,从而达到人工智能产品真正的智能化和个性化,而非单一场景的智能化。
未来将赋能中小企业,加速智能化升级
能够拿出这样研究成绩,是深兰科技较早关注日常人工智能场景落地化应用,并积累了大量具有稀疏特征列和大量可能特征值的数据集的结果。
自2014年归国博士团队创建以来,深兰科技一直以“人工智能 服务民生”为理念,致力于人工智能基础研究和应用开发,人工智能产业链智能软件输出及自主硬件设计和制造。据悉,作为一家快速成长的人工智能领先企业、平台型世界级AI Maker,深兰科技已经搭建了世界级的核心算法平台,对AutoML的研究成果也已在智能驾驶及整车制造、智能机器人、AI CITY、生物智能、零售升级、智能语音、芯片、安防、教育等九大领域的复杂应用场景中进行了广泛应用。
据透露,未来深兰科技还将利用AutoML为计算机视觉、生物识别、智能零售、自动驾驶提供更多的解决方案。深兰科技会不断加强对AutoML的技术投入,搭建有效的模型加速AI技术的落地,赋能没有人工智能专业人才的中小企业。
今年1月,深兰科技在上海“新一代人工智能未来发展峰会”上全新发布的人工智能新产品熊猫智能公交,集自动驾驶、手脉识别、语音交互、精准广告推送、车载监查机器人、智能无人零售系统、异常行为监控系统、智能逃生紧急处理系统等深兰科技八大核心技术于一身。熊猫公交车全车拥有六十多项新型的人工智能技术,是目前世界领先的公共交通车辆,并受到了到会的印尼、泰国、马来西亚、阿曼、卡塔尔、阿联酋、南非、希腊、意大利等国家的欢迎,成为对外展示中国企业形象的新名片。除了熊猫智能公交,深兰科技在国际大赛中也开始崭露头角。
据悉,目前深兰科技设有数据科学实验室、深度学习实验室,专注大数据、云计算、人工智能、算法分析 ,AutoML等领域的研究,并且依托自主知识产权的深度学习架构、机器视觉、生物智能识别等人工智能算法,与多家国内外知名企业、高等院校以及卢森堡国家实验室合作,建立联合实验室,并已获得及在申请中的人工智能自主研发专利百余项,斩获众多国内、国际大赛奖项,展现中国AI实力,最终实现在落地应用、基础研究的双开花。