大数据与互联网的关系

大数据与互联网的关系

 
大数据平台 大数据中心 网络大数据http://www.raincent.com

大数据的专家维克托·迈尔-舍恩伯互联网移动通信、物联网的发展,数据不断爆炸式的增长,人类进入了大数据时代。作为继云计算,IT产业的又一次新技术、颠覆性革命,无论是芝麻开门般的财富奇迹,还是对人们生活的影响。大数据不断地被提及,更是成为了影响当今世界创新的重要知识点。

什么是大数据?

    曾在《大数据时代》一书中提到,以前人们使用的大多是抽样数据,而大数据则包含了所有数据。另外,大数据关注效率,而不是精准度,关注关联性,而不是因果关系。以前的大多数数据被称为结构化数据,比如“你几岁?我15岁”,而“我今天说了什么话?我今天吃了什么东西?”这些数据则被称为非结构化数据,主要指一些描述性的数据。随着互联网的发展,这些非结构化数据被收集并存放起来,对于这些数据加以分析利用,便构成了大数据的应用,这也是大数据不同于之前数据的最为重要的一点。

大数据到底有多大?

    大数据所涉及的数据量非常大,而且正变得越来越大。自人类有文字记载到2012年为止,古今中外所有人类出版的资料,共计数据200PB。而在互联网发展的短短十几年里,数据量就已经步入了EB、ZB时代。以1号店为例,1号店一年产生的数据约为20个PB。这20个PB只是有过数据储存的这部分,不是1号店产生的全部数据。这些数据相当于有人类文字记载到2012年止所有数据的十分之一,而且,这只是1号店一家公司所产生的数据量。数据量正以惊人的速度爆炸并发展,是随着互联网的应用而产生的爆发式增长。

备注:单位从小到大排序:Byte、KB、MB、GB、TB、PB、EB、ZB、YB、DB、NB 进率1024

1Byte = 8 Bit

1KB = 1,024 Bytes

1MB = 1,024 B = 1,048,576 Bytes

1GB = 1,024 MB = 1,048,576 KB = 1,073,741,824 Bytes

1TB=2的40次方Byte=1099511627776 Byte

1PB=2的50次方Byte=1125899906842624Byte

1EB=2的60次方Byte= 1152921504606846976 Byte

1ZB=2的70次方Byte= 1180591620717411303424 Byte

1YB=2的80次方Byte= 1208925819614629174706176 Byte

1DB=2的90次方Byte= 1237940039285380274899124224 Byte

1NB=2的100次方Byte= 1267650600228229401496703205376 Byte

这么多数据从哪儿来?

    以一位浏览了1号店网页的顾客为例,他从哪里来?在1号店网站浏览了哪些页面?看过哪些商品?涉及的品类有多少?是否使用了搜索功能?还是只是随便浏览?这些看似不经意的数据都会储存在1号店的大数据平台。为什么数据越来越多?就是因为人们无时无刻不产生数据。比如上海科普大讲坛邀请1号店CTO韩军在1点45分进行了关于大数据的演讲,这个时间点便产生了一些数据。还有大家无时无刻不使用的移动设备,也会不断产生数据。每个人都在不断地产生各式各样的数据,这就使得数据越来越多,无所不在。

大数据是如何应用的?

    以一个怀孕的女性为例,她的消费行为可能会在怀孕的前四周或者前五周突然发生变化,比如在她网购时,原来喜欢买甜食,现在则偏好酸的食物,这些信息就会被 纳入企业数据库,并被记录下来。随后,公司会为这位孕妇推送与怀孕相关的产品优惠券,这就是典型的大数据应用。亚马逊有一个非常神奇的大数据应用,叫做 “未购买先发货”。亚马逊作为全球最大的电子商务网站,对于大数据有着许多应用。比如,亚马逊会根据消费者在网站上的消费行为,预测顾客下个礼拜的需求, 如牙膏、薯片、大米、酱油等。亚马逊会自动生成订单,将这些商品送到顾客家中。顾客作为消费者主体,在根本没有意识到自己需要这些东西的时候,商品就已经 送到手中。以实际应用效果来看,绝大多数消费者认为“未购买先发货”的预测较为准确,会愉快地签收订单。

大数据下的个人隐私?

    现代人使用智能手机时,商家会将信息存在云端备份,这些数据的存在,不可避免地会引发隐私问题。美国曾有预测学家说过,在未来十年或二十年,现在人们认为 非常重要的隐私,会慢慢转变为每个人都乐于将数据共享,这也将成为社会发展的一个过程。大数据下的信息处理,可以将人们在图书馆借书的信息和网上购物的信 息产生交集,比如在人们在图书馆借阅了健康类书籍后,在网上买披萨时,会为顾客推荐更健康的披萨。当数据产生关联后,也就产生了价值。在大数据下,隐私与 便利永远存在矛盾,可谓没有绝对的隐私。在这个数据化生存的时代,数据跟隐私是相对的。隐私和便利之间,也在慢慢寻求平衡。

电商对于大数据有着怎样的应用?

    对电商来说卖什么产品?以什么价格销售?如何防止价格设置出错?应该卖什么商品?什么商品好卖?什么商品不好卖?都需要运用大数据。定价对于电商领域的竞争而言非常重要。比如,在大数据的应用下,1号店设计了名为“智能价格”的应用。每天会自动在网站上搜索大量的产品价格,然后根据搜取的价格信息,对价格进行自动调整,以保证1号店的产品价格处于可竞争性的地位。在各大电商齐打价格战的“双十一”,1号 店的价格系统对于部分热销商品,每隔一两分钟就会对其他电商的商品价格进行扫描比对,实时推动价格变动。在电商的运营中,销量、价格和库存有着密不可分的 关系,库存又和备货有着重要关系,这些都需要非常强大的销售预测系统进行支撑。还有许多诸如此类的大数据应用不胜枚举,大数据的应用对于电商打价格战,提 高毛利,更好地服务消费者都有着巨大帮助。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/109515.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 安装并使用EVE模拟器

    安装并使用EVE模拟器本文提供的软件及相关镜像有:VMWareEVECommunityVMversion2.0.3-95Wireshark-win64-2.6.4CiscoIOL镜像(路由器、交换机)CRTWindowsXP镜像安装步骤如下:1.进行VMWare的安装a.在安装包文件夹内选择“VMware-workstation-full-15.0.0-10134415”的应用程…

  • js,jquery,css,html5特效

    包含js,jquery,css,html5特效,源代码本文地址:http://www.cnblogs.com/roucheng/p/texiao.html2017新年快乐特效jQuery最新最全

    2021年12月28日
  • 如何设置eclipse代码自动补全「建议收藏」

    如何设置eclipse代码自动补全「建议收藏」打开Eclipse->Window->Perferences找到Java下的 Editor下的 ContentAssist, 右边出现的选项中,有一个AutoactivationtriggersforJava:可以看到在默认情况下只有一个".“存在。表示:只有输入”."之后才会有代码提示在AutoactivationtriggersforJ…

  • jquery 正则表达式验证_前端正则校验

    jquery 正则表达式验证_前端正则校验在实际的开发中,我们经常遇到的校验莫非于非空校验、数字校验、电话校验、邮箱校验,在这里我就以以上校验作例子,其他的校验网上一搜一大把。其实使用正则表达式校验是比较灵活的一种方式,首先介绍正则表达式校验。下面我直接贴代码了,有一点要注意的,就是非空校验,很多时候我们需要校验非空,是连带空格都要校验的,所以例子中的非空校验是会校验空格的。 非空:不能为空 电话号码:请输入正确的电

  • c语言实现香农编码和译码_香农编码码长

    c语言实现香农编码和译码_香农编码码长1、设计思想     为了设计的方便,我们需要在这个程序里设计一个结构体,以用来存储信源符号、信源符号概率等参数,将每一组参数看成一个结构体来看待,这样我们就可以随时地调用。2、设计流程     主函数部分,我们先接收要输入的信源符号个数,再接收每个信源符号的名称以及他的概率。    主函数设计好后,我们将各功能的函数分成几个模块来写,第一个是排序函数,如果你坚持从大到小输入则可以不用写;第二个…

  • Spring官网下载各版本jar包

    Spring官网下载各版本jar包source: http://blog.csdn.net/yuexianchang/article/details/535833271:浏览器输入官网地址:http://spring.io/projects2:点击如图树叶页面按钮。 3:点击如图小猫图片按钮。 4:查找downloading spring artifacts链接点击。 5:

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号