石现升
石现升:今天非常荣幸借着蓝汛十五年的机会来跟大家分享我对整个大数据时代的理解。关于大数据行业研究了很多,有各种各样的观点,我们是从行业的角度来看看大数据到底有哪些价值,以及大数据的信息来源,和我们这个行业会员单位在大数据时代主要的例子和大家一起分享。我的分享内容有几个部分:大数据时代到来、大数据的数据价值、合理使用和围绕大数据时代行业组织在接下来在推动的几项工作。
从目前整个互联网行业发展来看,前一段时间我们做了一个预测,关于到2020年国际互联网环境和整个发展规模的预测。到2020全球网民预计达到52亿人,每秒钟增长7.9人,未来七年互联网网民增长主要来自于亚洲和非洲地区,人口预计到2020年到80亿,所以网民普及率达到65%。从目前增长的趋势来看是比较平缓,很难再有互联网初期爆炸式增长的时代。全球网站数量预计2020年将到17亿,目前网站数量是6.4亿,预计到2020年,平均3个网民将拥有一个网站,这些将是大数据时代数据的主要来源。
大数据时代到来的特点是群体和个体交互方式发生了改变,我们从下面的图表可以看出,从社交网站、电子商务平均、视频、游戏、旅游、人力资源、彩票等各方面对整个大数据的利用平均非常的明显。第二个特点是移动设备的数据交换分享增长迅猛,从固定互联网到移动互联网,到物联网的时代可以看出,在终端层是90年代开始固定互联网时代,到2007年以后的移动互联网,到物联网时代都经历了迅猛的增长。
信息成为新的商务核心,从量上来看,未来十年内将增加44倍的数据和内容,其中80%的数据为非结构化的数据,传统是以结构化数据为主。同时信息处于新一轮数据发展的核心,交互数据是移动通讯记录、社交网络、社交媒体等。传感数据包括环境监控、位置数据、视频监控,从交易数据包括企业ERP、POS系统、网上支付系统等。大数据时代的数据特征分析,包括海量化、多样化、快速化和价值化。
下面是大数据时代简单的例子,也是我们从调查报告里找到的,关于农夫山泉大数据的情况,它是一个传统企业,做的也非常简单,他们每天有一万个业务员,其中每天每个人要到十五个销售点拍十张照片,每人每天拍的照片是10兆,一万个业务员每天的数据量就是100G,每个月就是30T,这些靠最简单的方式获取了海量数据,这是农夫山泉大数据量获取的来源。同时这些照片主要观察的是各个销售点怎么摆放,位置发生什么变化,以及这些变化的原因是什么,怎样摆放水有助于销售,不同年龄短购买量有多大,气温的变化对购买行为的影响,竞争对手的新包装如何,采购、仓促、配送有什么问题,新陪送中心成本、选址如何,对于大数据对经营带来直接的指导作用。
通过与SAP公司合作,采用大数据分析技术对产品和销售做出快速反应,由24小时缩短至0.67秒,同时提供精准物流服务,物流配送效率得到极大提升,另外业务拓展。效益提升是市场占有率是34.8%,年增长率是30%到40%。数据分析影响物流和资金流,数据分析影响业务可延伸的范围。
下面选用的是360数据,精准的广告投放。传统网络投放是比较粗放式的网络投放,但是现在通过搜索广告营销的方式,使得广告投放和用户渗透更加的精准,同时用户看到的是他愿意看到的投放,投放主投放的广告包括联盟商投放的广告通过搜索的方式把这些广告内容直接推送到用户手上,所有一切完成通过海量数据分析来完成的。同时360的云查杀,通过海量样本的行为特征分析和比对来提升整个查杀的精准性和快速高效。
下面还有腾讯对大数据的合理使用情况,目前以视频行业为例,主要了解消费者的使用习惯、网络广告、视频广告的形式,哪种投放形式是用户最容易接受,包括多媒体内容产生的模式。通过大数据的形式可以建立智能化的平台,实行个性化的营销行为,对消费者进行具体的精准的分析。通过大数据的价值提升腾讯视频的用户体验。目前的效果是月度覆盖用户2.755亿,年增长率高达250%—300%。
我们从大数据业务特征来看,数据爆炸增长,结构类型复杂,用户行为丰富,Web社群关系复杂。需求分析方面利用大数据分析提升用户体验,增加用户黏性。具体应用方面是社交网络广告精准投放。
在电信行业大数据分析来看,业务特征上数据量激增,保存时间长。受众群体大,市场饱和度高。需求分析是数据流量爆增,向智能化方向转型。在具体应用上,以英国电信BT的案例来介绍,包括了信息收集、多样化的信息分析和实时数据分析、极端数据分析、数据分析和管控评估整个企业的数据资产。
下面是大数据的价值如何提升企业信息管理能力,包括可以优化归档成本,以前是海量的信息,经过大数据时代用户行为模式的分析,可以做到最有价值的信息进行归档保存,精简合并任务、信息即服务、丰富数据内容、信息追踪机制、公司治理过程,还有面向大数据的企业管理方面,可以提升公司的治理效果。
同时大数据的价值可以改进企业商业决策,传统做法是结构化、可分析,逻辑性。新的路径是提高了创造性和整体思维能力,以及提高用户的知觉。
传统做法是数据仓库来自于事物数据、内部应用数据、主机数据和ERP数据,到大数据时代做到非结构化数据和迭代新的数据来源。
关于合理使用,目前随着互联网的普及度提高,用户越来越关注个人信息安全和使用网络的安全,包括交易行为的安全等。社会行业应该形成严谨的处理,利用个人信息的氛围形成行业规范,使得公众敢于放心提供个人真实信息,形成公众对大数据的社会信任感。企业、社会组织的力量从规范制度到规范贯彻实行,从宣传层面到从技术层面共同努力。
下面是整个协会自己对大数据时代做出的展望或者是探索。定位是在大数据时代做下一代互联网产业政策的宣传者,做下一代互联网行业标准建设的组织者和下一代互联网技术和应用的协调者,服务于行业的发展,服务于政府决策,服务于会员的需要。
接下来是一项工作是我们正在密集进行的,对互联网流量进行排行,根据整个PV访问情况,我们根据互联网平台提供一些数资源,对目前领先的互联网企业进行业务类型进行细分,同时对互联网的流量排行情况结合应收情况发布报告。详细的发布会将在月底举行,在这里做一个广告,互联网行业发展的百强榜的情况,到时候会通过媒体向业界公布出来。
谢谢大家!