大家好,又见面了,我是你们的朋友全栈君。
1)大数据是什么
指数据集的大小超过了现有典型数据库软件和工具的处理能力的数据
2)大数据特点
①海量化(Volume):数据量从TB到PB
②多样化(Variety):数据类型复杂,超过80%的数据是非结构化的
③快速化(Velocity):数据量在持续增加(两位数的年增长率)
数据的处理速度要求高
④高价值(Value):在海量多样数据的快速分析下能够发挥出更高的数据价值
3)大数据能做什么(海量数据背景下)
①快速查询 全量查询
② 数据存储 量大 文件大
③ 快速计算 对边传统方式 【属于离线计算】
④ 实时计算 最新数据
⑤数据挖掘 新价值
4)大数据项目流程
①数据生产
②数据采集
③数据存储
④需求分析
⑤数据预处理
⑥数据计算
⑦结果数据存储
⑧结果数据展现
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/142163.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...