通向AI?先过了DI这关再说

2017-06-14 14:28:00 MORKETING 分享
参与

  微信图片_20170613143916.jpg

  柯洁也哭了。

  在确定0:3败给AlphaGo之后,这个骄傲的年轻人泪洒发布会现场。去年,他在李世乭告负之后曾说“就算AlphaGo战胜了李世乭,但它赢不了我”。而在一年后的乌镇,他哽咽着说:“我会继续改变自己,而AlphaGo将会继续改变世界。”

  AlphaGo已经被视为“围棋上帝”。虽然中国围棋协会已经授予它“职业围棋九段”的称号,但棋圣聂卫平觉得远远不够。“至少达到了二十段的水平”,他说。

  也许AlphaGo并不足以代表人工智能的全部,但它绝对是那个扣动“人工智能”概念普及的扳机。人们从它的所向披靡中,第一次直观感受到了AI的魔力,并开始对它抱有着比以往多得多的期待。现在,置身于每个互联网参与的场合,“人工智能”都是无法逃脱、必然要讨论的概念。

  如百度这样的巨头也已经将它提升到了战略的层面。“互联网只是前菜,人工智能才是主菜。”李彦宏在不同的地方反复重复着这样的观点。

  人们明确了方向,但谁都知道不可能一步登天。无论速度多快,人工智能在真正到来之前必然也得有一些循规蹈矩的过程。针对这个问题,【友盟+】广告营销数据业务总经理李春元告诉Morketing:“DI是通向AI的必经之路。”

    

  【友盟+】广告营销数据业务总经理李春元

  他认为在人工智能时代真正来临之前,数据量的累积及基于这些数据进行的算法模型迭代与更新将成为一段时间内竞争的焦点。只有走过了这个阶段,人类才能拿到通往AI的钥匙,否则只会“求门而不入”。

  当我们抬头仰望人工智能的星空时,也得脚踏实地地走好路上的每一步。

从BI到AI,先过DI这关

    

  DI,Data Intelligence,翻译成中文就是“数据智能”,它是指以数据为基础,不局限于对数据本身的统计和分析,而是运用先进的研究模型对其潜在价值进行深入挖掘。简而言之,它的核心就是“数据”。

  到今天,数据的重要性已经无人否认。

  早在2012年3月,美国政府发布的《大数据研究和发展倡议》中就提到大数据是“未来社会发展的新石油”。这一说法随后流传开来,经过马云以及英特尔等商业领袖与企业的“布道”,逐渐成为业界的共识。

  这是一种以工业时代为节点出发产生的联想,所以,那个时候的产业逻辑可以帮助我们更好地理解当下的现状:人们首先得学会如何驾驭石油——从它的开采、存储、传输直至使用,他们架起了油田、建立了输油管道、制造出发动机,最终才有了汽车、飞机和工厂,进而支撑起了整个工业社会。

  所以,当我们迈入美国学者尼葛洛·庞帝所说的“数字化生存”时代时,需要学会的首个技能就是如何驾驭数据。这也是李春元口中“DI是通向AI的必经之路”的逻辑原点,所有从业者不可能指望一蹴而就,只有当对“数据”本身研究得足够透彻之后,“人工智能”才可能发挥出它理想当中的作用。

  为了说明“数据”仍然是目前最重要的竞争焦点,李春元讲了一个故事:同样是做翻译,IBM基于自有的样本和数据进行训练,虽然拥有最好的科学家和最好的算法,但准确率只有80%左右;谷歌在做这件事的时候,即使用很普通的算法工程师,最终得出的算法准确率也能达到97%。

  背后的差异就来源于两家公司掌控的数据量。一方面,庞大的数据量能够让算法拥有更多的分析素材,这会让产出的结果更接近于真实状态;另一方面,更多的数据能使算法接受到更多的训练,这本身也会让模型在不断迭代中更加完善。

    

  李春元认为商业世界对数据的利用可以划分成三个阶段:

  早期是BI(商业智能)阶段,人们通过数据来驱动业务,商业模式以B2B为主,需要大量的人力主导分析过程,这不仅会带来大量的人工成本,还会受到分析人员水平与能力不一的局限;

  随后是DI(数据智能)阶段,商业模式以B2B2C和B2B为主,重视探究“因果分析”,通过大数据的分析与挖掘取代人肉分析,完成策略、业务与数据的高效循环;

  最终演进到AI(人工智能)阶段,商业模式以B2C、C2C为主,技术的使用门槛大幅降低,机器学习使其实现智能的自我进化,从而释放出巨大的商业潜力。

  不难发现,从BI、DI再到AI是一个循序渐进的过程。伴随着模式的不断进化,人力在其中的参与程度逐步降低,机器的智能化程度不断提高,商业效率也持续提升。但无论如何,这个过程的核心仍然是对数据的理解,尤其当我们正处于DI这样的过渡阶段时,数据的重要性是任何元素都无法替代的。

能建起数据工厂吗?

  “天气预报为什么能做到精准?因为它积累了很长时间内的历史数据,通过它来预测会不会下雨。”李春元告诉Morketing。

  所以,当迎接DI时代到来前,互联网以及广告营销业内的公司都需要问自己这样一个问题:我攒够“新石油”了吗?

  “回归到【友盟+】来说,它的核心是什么?数据工程师和科学家;但建模是我们的根本吗?不是,我们的根本是已经采集到的数据。”李春元认为数据保有量将成为【友盟+】在这个强敌环伺的战场上获得优势的保证。

  目前,【友盟+】每天收集的应用场景数据280亿,覆盖的设备数量达到14亿,如果折算到人,这个数值也将达到7亿之多,这样的数据规模在国内位居前列。以阿里作为对比,目前在阿里生态内活跃的品牌大号数也只是刚刚跨过四亿大关。

  从成立之初就意识到数据量的重要性,让【友盟+】在发展过程中始终注意数据量的累积。虽然自身并不产生数据,但通过对大量网站和APP等数据的采集,它同样能够搭建起数据池,并且这种更为多元的数据来源能够更好地对冲经营过程中的风险。显然,它的举措为那些尝试在数字化环境中生存下去的中小企业提供了一种新的思维路径。

  “我们原来是做统计的,像今日头条、墨迹天气这些头部App也同样在使用。这个采集的方式延续下来,使我们成为了细分市场中最大的企业,目前在移动端中已经占据了七成的市场规模。”李春元说。

    

  所以对于【友盟+】而言,构建起的“数据工厂”成为了目前最具优势的竞争力来源。通过全域数据的采集,目前已经能覆盖到680万网站和125万APP。获得的数据类型也非常多元,包括网站统计、App统计、线下以及广告监测等多维度的数据,并且通过打通这些数据解决“数据孤岛”的问题。

  不过在目前的互联网生态下,绕开BAT这些巨头会非常危险,已经成为无需赘言的事实。公众号“老道消息”此前的一篇《卖给BAT要趁早》,在互联网及创投圈引发的波澜足以证明这一点。

  刚好,【友盟+】本身也背靠着阿里巴巴这座大山。2016年初友盟、缔元信、CNZZ三家公司进行合并成立新品牌——【友盟+】,这使得【友盟+】在算法迭代上有了更多的优势。虽然无法直接对外输出结果,但【友盟+】能够获得阿里数据的授权。当庞大且最具价值的电商数据被授权使用,对模型训练的帮助显而易见。

  当然,所有的结果都需要用数据来验证。

  “我们进行过试验,通过比较多个媒体上的实际游戏,金融广告精准投放与通投数据,可以发现经过算法模型处理之后,点击率至少提升了144%。”李春元的话中带着些骄傲,而底气来自于收获的效果。

百雀羚广告的启示

  此前百雀羚长图广告的火爆,意外引爆了广告营销圈一次大范围的讨论:当广告迈入数字化时代时,它到底需不需要为转化率负责。

  虽然这场争论的引爆纯属偶然,但从更长的时间维度看,它带有着必然的意味。在传统媒体环境下,人们很难对广告效果进行归因分析;但当数字媒体打通了广告和销售间的链路,所有的数据都可监测、可寻址后,企业对ROI的追求也就变成了必然。

  毕竟,找回浪费的那一半广告费,是广告主们一直以来的追求。就在不久前,戛纳国际创意节主席Terry Savage在一次公开演讲中,就曾提到“戛纳攸关创意,创意攸关投资回报率。”

  虽然对百雀羚广告转化率的抨击过于苛责,但却无法掩盖效果已经成为广告主最优先考虑事项这一事实。“只在效果广告上讲品是没有意义的,落到品牌广告上也要讲品效。”李春元说。

  【友盟+】相对独立的第三方身份使得它有机会将媒体监测数据与调研问卷数据打通,全面评估品牌力的提升,同时能将媒体监测数据与广告主的数据打通做归因,将消费者的兴趣行为转化与广告触达挂钩,实现品牌效果的统一。这将避免品牌广告只走效果广告这一条狭窄的路径,当企业有的放矢、并能判断出品牌广告的实际效果时,品牌广告也能在数字环境中重新焕发生机。

  但真正完成这一步仍然任重而道远。虽然广告行业已经成为了一个相对成熟的行业,但这里的氛围也相对浮躁,大家总希望引入新的概念让广告主买单。

  但李春元对此有清晰的认识,有些技术能够马上落地实施,有些还只是美好的乌托邦。

  就像他们所提的DI一样。与其在巨头的带领下想象美好的AI未来,不如用数据累积起自己的城墙,用更切实的态度换取激烈竞争下的生存空间。

责编:王楠