获取更多信息请下载APP

百度迁徙:背后就是大数据

来源:    发布日期:2014-07-09 13:32:33   阅读量:0
  大数据的真正价值是我们能在数据里发现知识,发现信息。
  
  在CCTV曝光东莞性交易内幕之后,“东莞”也成了互联网讨论的最热词汇之一,一时间人们纷纷从社会、伦理、经济乃至政治角度解读讨论该事件。在科技界,“百度迁徙”成为东莞事件中最活跃的科技名词,也再次让“大数据”这个词汇出现在了人们的视线。


  
  利用LBS大数据定位
  
  “百度迁徙”技术功能包括几方面,第一个是全国迁徙的区域带,第二是热门线路分析,包括迁入迁出和热省分析、选定城市分析、时间维度分析。移动地图的价值是通过知道每个人的位置,提供差异化服务。
  
  而“百度迁徙”就是大数据时代的一个产物,利用大数据技术,对其拥有的LBS(基于地理位置的服务)大数据进行计算分析,最终以可视化的方式直观地表现出了被网友误解的“嫖客跑路示意图”。
  
  据百度官方介绍,去年8月使用百度LBS定位服务应用达10万多个,每天产生35亿次定位请求,基本每秒接近4万次定位请求,而百度将这些请求和用户收集在自己的数据库中,这便是“百度迁徙”数据基础的来源。而通过云计算平台数据处理,加上精准定位,“百度迁徙”能够实现全面、准确、即时反映人口迁徙状况,这便是大数据时代所产生的价值。
  
  此外,“百度迁徙”地图的产生并不意味着泄露了个人隐私,百度这款基于大数据的迁徙图产品所使用的数据是批量化、去中心化的数据,呈现的是群体性运动趋势而不是个体行为。
  
  百度能做出“百度迁徙”产品,很重要的原因是,百度过去几年大规模对云计算的投入,拥有很大的数据中心、有自主设计服务器,能把数以亿级,数以千亿级的数据实时、安全存储下来,在这些基础上建立云计算,有海量数据处理大规模的调度软件。
  
  大数据的真正价值是我们能在数据里发现知识,发现信息。百度定位服务部门会在百度大数据分析基础上,挖掘定位服务产生的特有数据和特有知识,如挖掘兴趣知识库,挖掘路网信息,挖掘路况预测、智能导航,交通变动只是大数据的一个开始。
  
  我为大数据贡献了啥?
  
  大数据主要是指大量、高速、复杂、变化不定的数据,需要用先进的方法和技术实现信息的收集、存储、分配、管理和分析,而体量大、类型多和速度快是大数据的显著特征。
  
  随着计算机和互联网技术的迅速崛起与普及,我们已经离不开手机、电脑、智能电视等智能终端设备,日常生活基本上都可以数字化地表示。
  
  总之,在互联网无孔不入的时代,我们的一举一动都产生了大量的数据。而我们的智能手机正在成为贡献大数据的工具,无论是谁,每发一次微博和打一次电话,包括经纬度在内的精确地理位置信息都被记录在案,而通话记录在许多年之后仍可以被调阅查询。“要想不和大数据沾上边,除非你把自己完全绝缘起来。比如,不上网、不使用手机、不看电视等,总之不和任何信息设备发生关联,这样大数据使用者在进行数据挖掘时就找不到你的个人信息了。”北京集奥聚合公司首席技术官刘国清说。由此可见,在这个信息化的社会,我们离不开电脑、离不开智能手机,这些都将基于互联网为大数据库提供着我们的行为规律。
  
  我们通过信息设备透露行为规律都会成为原始数据,这些原始数据就会成为大数据分析的材料。“百度迁徙”也正是运用的原始积累的用户定位信息,我们的手机可能只要开着定位功能,就随时“暴露”了我们的行踪,根据我们的行踪分析而呈现出的各个地区的迁徙地图,就形成了如今火爆的迁徙地图。看吧,迁徙的轨迹正是由我们自己提供的信息,除非你杜绝一切信息设备。
  
  大数据是一种服务
  
  换一个角度讲,大数据积累的出现并不仅仅是“跟踪”人们的生活习惯,它更是一种现代化的服务。拿网购作为一个例子,北京邮电大学信息与通信工程学院副教授郝建军介绍,在电脑上,你什么时间在某个网站购买了什么样的东西,花了多少钱,你中间点击了哪些、什么样、什么价格的产品,最后做出了什么样的选择都有迹可循。大型电商网站会基于这些数据,分析顾客习惯并优化自己的产品结构,变更网页,以达到促进、方便消费的目的。而对于消费者,在购买产品的时候会发现网站结构更加合理化甚至倾向于私人定制化的方向。
  
  另外,大数据分析已经被用在刑事侦破领域,这为破获一些疑难杂案、保障老百姓的人身和财产安全提供了一种新的技术支持。在公安部“GA计算机人像组合系统”研究项目中,这套人像组合系统的基本要件就是利用计算机进行画像,只要在计算机中建立储存有各种眼睛、鼻子、嘴巴、眉毛、脸型等信息的信息库,在受害人凭记忆描述犯罪嫌疑人的各种相貌特征时,操作人员在信息库调取与之相应的眼睛、鼻子、嘴巴……直到组合成一个与犯罪嫌疑人特征相像的人像。
  
  因此,利用好大数据,绝对是一种人性化的服务,“百度迁徙”地图不是也直观地展现了一个春节后的人口行动动态吗?既对官方提供了参考信息,又满足了群众对社会动态的了解,“如果从海量数据中不能开发出大数据价值,这些海量数据中有很多就只能是一大堆垃圾。” 郝建军表示。
  
  不少专家认为,在未来的大数据时代,我国逾14亿的庞大的人口规模已经成为一种巨大的信息优势。比如,在医疗行业中,我们国家是一个人口基数庞大国家,因此病患也非常多,从医疗卫生的角度考虑,医疗、养老都是巨大的负担。但是,如果我们从医药、治疗的角度来讲,这些病患则是一笔巨大的财富,患者生病、治疗及用药产生的大量数据为我们进行医疗研究、药品研发提供了大量鲜活的样本。同理,大数据也为我国社会科学领域的迅速崛起提供了前所未有的机遇。