广告
广告
广告
2018 CCF BDCI六大赛题解读:深度解析赛题背后的故事
通信产业网|2018-09-14 15:10:18
作者:通文来源:通信产业网

【通信产业网讯】近日,2018 CCF BDCI大数据与计算智能大赛正式开启,两大赛道并驾齐驱。现在,第一赛道已经揭开神秘面纱,六大赛题强势来袭。

1. 阿里巴巴集团《自动驾驶三维点云分割》

2. 中国联通研究院《面向电信行业存量用户的智能套餐个性化匹配模型》

3. 宜信大数据《基金间的相关性预测》

4. 中科天玑《互联网金融平台用户评价观点提取》

5. 艾普深瞳《汽车行业用户观点主题及情感识别》

6. 执御《供应链需求预测》

为何这六大赛题会从众多备选赛题中脱颖而出?赛题本身就是答案。

大数据作为当下最炙手可热的话题之一,本身就自带流量,但技术最终要与行业结合、落地,这六大赛题分别从不同行业的痛点出发,与汽车、金融、电商、运营商等领域的实际应用需求紧密结合,究竟能够带来哪些全新的创造和惊喜,看这些企业专家们如何点评赛题~

赛题1: 阿里巴巴集团《自动驾驶三维点云分割》

点云算法将成为自动驾驶发展的重要引擎

此次阿里巴巴推动的赛题《自动驾驶三维点云分割》中提到的“三维点云”,可谓正中自动驾驶中算法技术的靶心,是激光雷达技术如何形成三维感知的核心关键所在,三维点云如今也成为炙手可热的重要研究领域。

“《自动驾驶三维点云分割》赛题的关键词是三维点云,它是自动驾驶车感知周围世界非常重要的数据源。众所周知,像燃油和引擎两者推动火箭一样,图像大数据和针对图像的深度学习两者推动了图像感知技术的快速发展。相比于针对图像领域的深度学习,针对三维点云的深度学习还比较稚嫩。换句话说,要想三维感知取得飞跃,或许我们还缺少一个强有力的引擎。为此,我们贡献了针对三维感知的大规模三维点云数据出来,为三位感知提供了充足的燃油,希望聚合更多技术的力量来共同打造针对三维感知的深度学习引擎,共同推进自动驾驶技术的发展。”

——阿里巴巴集团的高级算法专家 李扬彦

赛题2:中国联通研究院《面向电信行业存量用户的智能套餐个性化匹配模型》

电信业务存量经营的关键是个性化匹配

中国联通研究院在保证数据安全可控的前提下,为参赛队伍提供了不少于100万的用户数据集(已脱敏),包括用户的基础属性、通话行为、互联网行为以及终端消费习惯等,希望广大的参赛队伍能够通过算法和模型,探寻这些海量、无规则用户数据背后的宝藏,挖掘出存量用户真正的使用需求和潜在机会。

“我们推出这个赛题的目的,就是为了解决用户在信息过载的情况下实现套餐的精准匹配,利用“众筹”的方式,在看似庞杂繁琐、没有明确指向的用户信息中,设计存量用户的精准运营新思路,这也将成为电信运营商在算法层面一次全新而有益的尝试。“

——中国联通研究院 大数据研究中心应用研发室主任 张第

赛题3: 宜信大数据《基金间的相关性预测》

用融合金融科技降低居民的投资风险

宜信大数据创新中心推送的赛题是基金间的相关性预测。公募基金是宜信大数据孵化的宜信指旺财富密切关注的投资品类之一。在数据方面,企业将提供预备基金的收益率数据和基金的业绩的比较基准数据,这是研究相关性重要的基准性数据源。与此同时,还需要关注的是市场指数收益率以及市场整体走势。

“《基金间的相关性预测》赛题本身已非常明确,就是预测和研究基金,准确说是公募基金的相关性。我们认为,金融业务的核心环节是风险控制,通过融合数据科学,风险可以得到更有效的控制。而且不止是投资理财领域,宜信大数据创新中心也在基于大数据、人工智能、机器学习的技术应用,为信贷类业务的风控环节提供支持。”

——宜信指旺首席量化科学家 杨博理

赛题4: 中科天玑《互联网金融平台用户评价观点提取》

利用海量用户评论,挖掘互金潜在风险

高回报必定会带来高风险,互联网金融平台良莠不齐,大批问题平台跑路倒闭,给投资者造成了不可挽回的损失,对监管者而言也是前所未有的挑战。作为大数据安全领域的佼佼者,中科天玑的赛题《互联网金融平台用户评价观点提取》正是针对这一痛点,面向互联网金融监管和风险分析,从实际场景中提炼场景,借助机器学习和自然语言理解的技术手段,从海量用户评论数据中找出潜在风险,对金融风险进行预警,达到规避风险的目的。

“本赛题的目标是要在互联网金融风险分析和监管领域里,除了来自于企业、行业本身的数据,希望能扩展发现风险、发现问题的渠道,即互联网数据渠道。进一步利用互联网的数据,从互联网网民对互联网金融平台、企业或产品的大量评论数据中,挖掘出可能存在的风险或潜在问题。聚焦如何通过机器学习和自然语言理解的技术手段,从海量的用户评论数据中能够找出潜在的风险,以及大家对互联网金融平台和企业,有什么样的评价,会有什么样的预测。”

——中科天玑总裁余智华

赛题5: 艾普深瞳《汽车行业用户观点主题及情感识别》

大数据助力汽车厂商了解消费者需求

本次艾普深瞳的赛题《汽车行业用户观点主题及情感识别》,想基于互联网中海量的用户对汽车的相关评论、用户所发表的观点内容,分析挖掘用户在讨论外观、价格、配置等汽车属性时的状态、满意程度等,以此来帮助汽车厂商了解他们的产品是否满足消费者的需求。

“我们准备了训练集和测试集两部分数据,训练包含了文本内容以及改内容所提及的主题和情感,其中主题和情感是由人工标注完成。参赛选手需要使用训练集数据进行建模,使用建好的模型对测试集中的文本内容进行处理,正确识别出文本中的主题和情感。我们在这里说的主题是指动力、价格、油耗等汽车相关属性,情感则是文本中对特定主题所表现出的满意、不满意或中立态度。“

——艾普深瞳 智能营销研发部副总裁冯一帆

赛题6 执御《供应链需求预测》

精准备货的背后,需要万千数据的支撑

此次执御给出的赛题是《供应链需求预测》,因为跨国电商必须要有极为敏锐的市场感知力,了解市场的消费趋势发展,提前准确将货物备好并运至海外,提升货物流转效率及用户粘性。

“执御选取了一年左右的数据,包括商品的信息、季节,品牌等,各个商品的时间序列,包括每个商品每天的点击架构、浏览收藏等于一系列的用户的行为,甚至还有整个的运营结构,是如何运行的,这些执御都做了标注,把它沉淀成了数据,所有这些提到的都会以数据字典、数据文件的方式提供给所有的参赛者。”

——执御数据智能部副总裁 吴岗


0

责任编辑:李轩龙

【欢迎关注通信产业网官方微信(微信号:通信产业网)】

版权声明:凡来源标注有“通信产业报”或“通信产业网”字样的文章,凡标注有“通信产业网”或者“www.ccidcom.com”字样的图片版权均属通信产业报社,未经书面授权,任何人不得复制、摘编等用于商业用途。如需转载,请注明出处“通信产业网”。

发表评论
合作伙伴
换一个
还不是通信产业报会员,立刻注册
×