清华大学李勇:大数据推动电商实现“真正的智能”

创业最前线
103个月前

9月25日,在贝贝集团主办的“贝贝?2017中国母婴峰会”上,“清华大学数据科学和智能实验室负责人、博士生导师李勇发表了主题为《大数据智能对产业及消费升级》精彩演讲。


李勇在演讲中表示,新消费一代时代到来,消费升级成趋势,逐渐趋向于个性化、品牌化和品质化。大数据能够对用户的常驻地、职业、兴趣爱好等形成对用户特征和需求的深刻、准确理解,把大数据和人工智能融合,能够使电子商务做到真正的智能。实现动态定价、精准推送,智能供应链,对用户形成更好的服务。


以下是李勇讲话全文:


尊敬的谢市长、高总、张总,尊敬的各位来宾,大家好!特别高兴今天有这样一个机会在2017中国母婴峰会来分享我们作为技术派,来看待消费行业产业的升级。

每一次跟母婴行业人士交流,对我来说都是巨大的挑战。今天跟大家分享的主题,是站在技术的角度来看数据和人工智能技术会给整个消费行业,特别是母婴行业带来怎样的变革。


首先从数据开始说起。对于消费行业来说,数据就是跟用户相关的数据。由于移动网络的飞速发展,从3G、4G,现在在发展5G,我们手机上其实记录了很多数据。


它主要有两种来源,一个是可以从手机端采集这个数据,另外一方面,我们可以从网络角度采集这个数据。无论从手机上采集的数据还是网络上采集的数据,从数据的形式、价值来看,都能很全面描述一个人在不同纬度的行为。


轨迹挖掘可以进行常驻地识别,从数据里面,通过空间聚类和地点评估的方法,能够知道这个用户住在什么地方,住在什么地方,经常会去什么地方消费,以及他日常经常短暂停留的地方,精确理解一个用户提供了很好的帮助。


这其实只是第一步。除了常驻地之外,还能够对用户的职业和行业去识别。


在知道了用户的常驻地、行业和职业侯,进一步的问题是能不能了解用户的经济情况。通过用户移动的数据,也就是时空的数据,我们做了模型,精确预测个体社会经济地位的准确性和群体社会地位的准确性。


此外,还有一个更深刻的概念叫社会资本,是社会结构中你所处的位置以及所能带来的资源。这块我们也在做相关的模型,就是做社会资本概念量化。通过时空位置需求可以知道用户太多的信息。但是到目前很多行业,包括母婴行业里面所掌握的用户数据远远不止时空数据,还有更多纬度的用户数据。


从最简单的时空数据来看需要建立的模型工作量非常大,我们把用户多维数据放在一起来全面认识整个用户和社会的话,遇到的挑战将更大。从学术来讲可能存在这么几个方面的挑战:



  • 首先是数据获取和融合的问题。在整个数据生态里面会有不同域的数据,也就是跨网络的数据,比如用户在物理空间的数据,或者在赛博空间或者社会运营的数据,多维数据可能属于不同的实体、属于不同的公司,跨纬度数据的融合就属于不但是体制上的问题,更重要的是技术上的问题。


  • 第二个重要的科学挑战是用户的数据过多,数据所描述的用户行为也是很复杂的,我们经常说会有用户线上行为和线下行为,这个线上和线下行为更重要是相互关联、相互作用和相互制约的,我们怎么能够从丰富多彩数据里面学到用户的行为,然后进行建模,成为我们第二个重大的挑战。


  • 最后一个挑战是关于隐私问题,很多企业在收集用户数据,那用户的隐私是不是受到很大的侵害?其实这也是在学术方向上存在的一个很大问题,一方面我们要挖掘数据的价值,另一方面要怎么保护用户的隐私,使得用户的隐私和数据安全得到一个全面的保证。这是我们面临的第三个重要的科学挑战,这方面可能要从社会角度去制定更完善的法规,比如我们国家刚刚出台了《个人隐私保护法》,这就是一个具体的解决的措施;另外一方面是从技术方面研究用户隐私保护的方法。


其实要把数据用好还是面临很多的科学挑战,清华大学数据科学和智能实验室作为贝贝网的技术合作方,我们在母婴和电商这个行业,为贝贝网提供全球最领先的人工智能和大数据相关的技术。


人工智能第三次浪潮到来,它得益于几个主要的事情,一个是快速增长的计算的基础设施打造的人工智能的舞台。第二方面是我们有了大规模的数据,并且是可用的数据,为人工智能实现它的智能提供了很重要的数据基础。第三个方面人工智能再度兴起的原因是深度学习,是使得人工智能能够翩翩起舞。


我们有了这么多数据,我们要把这个数据用好,要实现真正的数据智能,我们要依赖于人工智能相关的技术,随着AR技术的进步、人工智能技术的进步,来助力大数据智能。目前人工智能像深度学习、像表征学习、迁移学习以及强化等等新的技术手段,为我们用好这个数据带来技术的基本的支撑。

清华大学数据科学和智能实验室和贝贝网在大数据和人工智能方向,作为技术研究的主题主要是在几方面进行努力:首先我们把大数据和人工智能融合,能够使电子商务做到真正的智能。在实时的客户服务、实时的定价,以及对用户形成更好的服务。


第一步是更好的理解用户,借助贝贝大量的用户多维度的数据,实现用户基础属性、消费偏好、消费能力等方面的研究。我们可以做用户关联度的分析,我们可以给用户制定不同的销售策略,来实现精准推送。


有了对用户全面理解以后,接下来就是思考如何将数据变现。通过大规模数据的输入,构建表征用户学习行为,通过深层网络,分析用户真正的兴趣和他的真正需求,进而为用户实现更好的推荐以及个性化的服务。


另外很重要的是动态定价和智能供应链。在母婴行业里面,通过变动价格来影响工序关系也成为一个很重要的技术手段。通过我们的研究发现,其实用户对价格的敏感度,品牌对用户的影响相对来说比较大。


因此,可以通过研究用户对价格敏感度的反映建立相关的模型,实现动态的定价,增加电商的效率。另外一方面是企图构建一个智能的供应链,因为定价影响后期的销量,而销量又取决于我们前期的整个供应链的能力。


另外一方面,利用在母婴行业的大数据,实现从经验到知识图谱的飞跃。传统的母婴育儿主要还是靠经验的方式在传授,在有了丰富的大数据之后,我们可以建立母婴行业的知识图谱,通过这个知识图谱,可以用数据方面来告诉用户如何科学的育儿。实现从大数据到知识图谱来实现价值服务的提升。我们还可以把知识图谱运用到智能客服系统里面去,提高整个客服的效率。


现在,大数据这个概念其实已经不新了,但是从大数据到人工智能,实现大数据的智能还有很多工作需要做,很长的路需要走。   



新消费一代时代到来,消费升级必须具备的三个因素,就是个性化、品牌化和品质化。


无论是对于用户轨迹的数据认识,还是多维数据的融合分析,精确理解用户的需求,为用户推送或者推荐最需要的产品,对整个行业的征信和风控的把控都有着巨大的帮助。


因此大数据和人工智能加在一起,能够使得我们在个性化、品牌化和品质化方面做的更好,推动整个母婴产业,促进消费升级。


以上就是我分享的内容,谢谢。