中国人工智慧企业100强 -明略数据(38/100)

中国人工智慧企业100强 -明略数据(38/100)


明略数据是一家具有自主知识产权的大数据科技公司,是中国领先的大数据整体解决方案提供商。提供一系列数据分析平台和软件,帮助政府、金融机构等客户,整理、分析、利用不同来源的结构化和非结构化数据。核心理念在于,利用数据的连接性,激发大数据的真正价值,从而创造一种人脑智能和计算机智能“共生”的关系,发挥两者各自的特长,解决中国实际的、困难的、最重要的发展问题。

明略自主研发了明略大数据平台、明略数据洞察平台、明略魅力报表等产品,并在此基础上进一步开发了交管实时大数据追踪系统、公安刑侦实时大数据分析系统、金融反欺诈大数据实时分析系统,等国内前沿的行业大数据解决方案。

人工智能的核心是数据支持

今天看来,机器智能主要来自于统计机器学习的训练结果,尤其深度学习对感知智能及自然语言处理的精度提升贡献巨大,同时也对(标识)数据极为渴求。为解决一些缺乏数据的领域而生的迁移学习方法,前提也是存在一个相关领域的能够提供用于初始训练的数据。

人工智能专业出身的吴明辉很早就相信数据基础的作用,他甚至认为没有数据的场景不可能实现人工智能。所以,以实现人工智能的应用为目标,他在最初创业时却瞄准产生和处理高质量数据。吴明辉表示,明略数据专注于数据本身的挖掘,在公司成立早期就希望把大数据往人工智能方向去应用,不管是做大数据,还是做数据本身的挖掘,以及利用挖掘数据去做人工智能的训练样本,因为大数据和人工智能之间的关系非常紧密。

吴明辉在研究生时的专业方向是人工智能里比较特殊的行业生物特征识别,包括指纹掌纹识别和静脉识别等,同今天火爆的人脸识别一样,都属于图像处理领域。虽然计算机视觉和深度学习大热,明略数据没有改变技术策略的意思。吴明辉认为,数据准备的不足,是当前企业应用人工智能/机器学习的主要挑战。例如无人车也需要大量的试车数据不断地测试算法。在整个采访过程中,他也一直强调,“先要把数据处理,数据处理不好任何事都无从谈起。”他认为,当前应该花更多的时间从互联网/移动互联网找到合适的数据并清洗干净,用来实现人工智能。

当然,有了数据,还需要把好的算法应用在数据上,同时在业务场景上面形成反馈系统——如果没有一个很好的应用形式,只有原始的数据,最后不一定能形成自我改进的更新换代的能力,如AlphaGo在全世界每年公开的有限的9段棋手棋谱之外,还要自我PK无数轮形成大量的反馈,然后从中寻找输赢的原因改进。

目前人工智能/机器学习算法在工业界里应用比较好的领域,也是用户量很大,有大量的学习样本和训练数据,并且具有重复性,在应用的过程中能够给出算法的评价,能形成闭环,不断地改进优化。例如搜索排序算法、电子商务推荐算法,有自己数据的闭环;如科大讯飞的语音识别,也是由科大讯飞语音输入法收集识别错误的数据,形成一个闭环。

所以,一开始的核心是准备数据,后期的核心就是创造应用。吴明辉表示,未来的研发模式一定是协作的、开源的模式,人工智能算法将不是什么神奇的事。