(原标题:亚马逊云科技:传统行业上马机器学习,必须跨越“四道槛” | 中国数度笔记)
经济观察网记者 高若瀛 当瑞士面临阿尔卑斯高速公路上数以万计的货运卡车所带来的拥堵和污染时,他们修建了一条世界上最长的铁路隧道——戈特哈德隧道。瑞士媒体骄傲地称其为“世纪隧道”。
然而今天,如此巨大工程建设,将不再是运输物流得以改善的唯一途径。越来越多的传统行业,正向基于云的机器学习,寻求提高效率、提升客户体验的解决之道。
近日,在完全托管的机器学习服务Amazon SageMaker正式落地中国区域一周年的分享会上,亚马逊云科技大中华区云服务产品管理总经理顾凡表示,传统行业将是未来机器学习发力的关键点。
据悉,作为亚马逊云科技机器学习服务层面的核心产品,Amazon SageMaker是业界首个面向机器学习开发者的集成开发环境。去年12月,在亚马逊云科技全球大会re:Invent 2020上刚刚亮相的七项Amazon SageMaker新功能,近期已经在北京区域和宁夏区域落地。
当传统企业试水数字化转型,方向看得到,但通识上的起点有没有,逻辑上可借鉴的路线图又是否存在?顾凡以亚马逊服务客户的经验总结认为,“了解数据策略”“找到第一个应用机器学习的场景”“数据科学家业务化”“理解技能差距”,是他们必须率先迈过的四道门槛。
下沉传统行业
“机器学习”作为概念,早在1956年,IBM的Arthur Samuel提出AI概念三年后就被提出了出来。可能会有人混淆机器学习、人工智能和深度学习这三者之间的关系。
简单来说,机器学习研究和构建的是一种特殊算法,而非某一个特定的算法,能够让计算机自己在数据中学习从而进行预测。机器学习是目前实现人工智能最常采用的技术。
从起初的利基技术转变成最常用的技术,以前讲数据创新、人工智能,大家想到的往往是互联网公司。实际上,今天最深刻的人工智能运用是在传统公司中、快速向纵深发展。
“如今,一家种子企业可以很好地预测,每年要给农民多少种子,天气是什么样,农药要洒多少,无人机怎么用,可以准确预测每亩产量是多少。公司通过这些来定价,告诉农民买多少农药、买什么样价格的种子。为什么企业可以做到这种程度?因为完全是数据驱动。”亚马逊云科技合作伙伴、上海英智达信息技术有限公司CEO孙晓臻分享了一个接触过的案例。
IDC数据显示,到2023年,人工智能系统支出将达到979亿美元,相比2019年增长2.5倍。Gartner数据显示,75%的企业在2024年底会把机器学习从试点转向生产系统,需要经过反复迭代,才能真正改变客户体验或者提升效率。这样的生产系统正在整个行业加速。
在孙晓臻看来,数字化转型的核心就是数据。如今的人工智能需要进入下一个阶段,从试错或验证阶段往普及阶段发展。当客户价值开始主导市场需求,而不是以往由新技术、新产品驱动市场发展时,企业在数据上加大投入,也将不再是试错性质,而是期望能获得真正价值。
“学习”路径
但传统企业上马机器学习有没有路径和节奏问题,这估计是所有有意向、但还没有上马机器学习的传统企业最关心的问题。基于和传统行业客户进行业务配合的经验,顾凡大致总结出了四个方面的共通问题。
首先,企业要了解自己的数据策略。算力、模型、数据是公认机器学习必备的三个条件。但在很多传统行业,数据本身就是个不小的难题。“企业需要先想明白,什么数据可用,还要想明白哪些数据通过努力可以变得简单可用。进一步,当企业想明白要改变哪些客户体验、解决哪些业务难题时,通过逆向思维推出,前两个数据已经搞定后,可能还缺数据,内部的数据今天就要开始准备。当几个月或一年后再去推动业务问题时,才会有真实、准备充分的数据应对创新。”顾凡说。
此外,在最初阶段,传统企业还需要对机器学习有个清晰的预期:即机器学习模型并不一定能够预测得准,并不能够必然地解决行业问题,也不是那么容易就能成功。
想清楚这个问题,第二个方面就是要找到“第一个应用场景”。事实上,很多传统企业特别大型企业,在集团层面推进机器学习时,往往会遇到更多质疑声:它会比人准吗?能够带来多少效益?为什么要花那么多钱?
因此,顾凡给出的建议是,先不动企业的核心业务,而是用创新业务做实验,测试机器学习是否提升了客户体验和效率,信心建立的过程是不断通过小项目成功累积出来的,“机器学习的适用性相对高,有没有合适的算法、有没有相应的人员、有没有超出我的能力范畴,三者结合起来就能够较快地找到第一个机器学习的场景。”
而“数据科学家业务化”,这个问题在传统行业尤其突出。在机器学习无处不在的亚马逊,得到的经验是,不要将数据科学家单独放在一起,“亚马逊要求数据科学家,要和业务团队的产品经理、开发人员、运营人员在一起。懂业务的人不一定懂机器学习,懂机器学习算法的人不一定懂业务,这两组人必须有交集,否则他们只会按照自己的想法去工作。”
最后一点是“弥补技能差距”。对一个传统行业进行改造,很多问题需要算法的大量迭代,甚至需要破解行业难题的新算法诞生。这就不能不强调传统企业与云技术厂商合作的必要性。前者希望用最小的试错成本完成产品的原型开发和快速迭代,需要借助后者弥补技能差距。
此外,这个云平台是否足够开放,会不会对企业形成锁定,这些也都是传统企业上马机器学习将要考虑的的问题。