大数据——不过时的话题

摸之左手 《电脑爱好者》2017年第22期 2018-05-07 10:55专题 标签:双十一 电商 大数据

01

我们常见的所谓“大数据”,并非是简单的各种数据获取与积累,这一能力在“大数据”这一概念出现前就已经有了。不过早期获取与积累的各种数据最多只能做到存储,数量越多反而越是麻烦,比如我们看一些比较“传统”的警匪剧或者法制纪实节目时,常常会看到警察要耗费大量精力回看各种监控录像,周围的监控越多、涉及到的时间段越长,破案过程越是艰辛。

现代的“大数据”则更加智能,可对积累的数据进行快速分析,甚至可能在积累时就已经进行相关的分析、归类,而最重要的则是可以将各种数据进行关联,例如同样是上述的安全监控,现在已经能做到智能识别车牌、识别行人的体貌特征,甚至直接识别出行人或车辆,并从数据库调取相应信息这种比较“科幻”的功能,都已经在一些地方实现了,由于可能涉及到个人隐私,我们这里就不放图片了,有兴趣的朋友可以扫描(图2)二维码去观看相关视频。

02

在网购过程中,我们其实也为电商提供了各种个人数据,例如买衣服鞋帽时选择的尺码与喜好、购买孕妇用品和婴儿用品时的时间、购买礼物的种类和时间、车辆用品的品牌与类型、出行方式和酒店的订购喜好……,当然在某些页面停留并大量搜索相关信息,但并未下手购买的商品,也是很重要的信息。在电商将顾客的各种信息通过姓名、手机号码、地址等个人特征信息联系起来后,其实消费者在电商的数据库中已经拥有了一个非常丰满的形象,各项特征可能比在公安数据库中更为全面,例如警察叔叔虽然知道大家的长相年龄等,但肯定不会知道大家的裤长、腰围、喜欢的衣服颜色、化妆品品牌等(笑)。

在综合了这些特征后,我们会发现在打开电商的首页时,搜索栏中会默认填入一些很“奇怪”的内容,并且会提供不少推荐商品(图3),它们虽然是我们近期搜索或购买的(图4),但常常会直击我们的需求。图3实际上是笔者随便抓取的一次京东首页截图,其中搜索栏里的电饭锅,应该就是因为笔者最近浏览过相关产品页面,而9.9元两件和京东超市的推荐链接,大概是因为笔者比较喜欢看打折商品和食品吧,这些其实都是笔者在京东留下的信息经过大数据的处理后,给出的最能吸引购买的推荐商品。

03

04

在新的大数据时代,电商的计算需求急剧增长,因此全面转向使用大型数据中心,例如阿里巴巴就在2013年将最后一台所谓的小机下线了,京东则在宿迁建设了巨大的华东数据中心。从某种程度上说,目前的大型电商实际上已经主动或被迫地成为了大数据应用和硬件的技术型公司。正是这些强大的数据中心,让电商可以稳定快速地处理大量地购物请求,特别是双十一这种爆炸式的数据。

05

图5:位于江苏宿迁的京东华东云数据中心设计方案