大家好,又见面了,我是你们的朋友全栈君。
DWD层:4步建模
作用:
1)对用户行为数据进行解析
2)对核心数据进行判空过滤
3)对业务数据采用维度模型重新建模。
一、DWD层数据分析
首先DWD层数据都来源于ODS层。具体数据可分为两类
1)用户行为数据(多为json)
2) 业务数据
1、 用户行为数据
业务行为数据一般都是来源于前端页面的埋点日志信息
分为 启动日志 和普通日志
启动日志表中每行数据对应一个启动记录,一个启动记录应该包含日志中的公共信息和启动信息。先将所有包含start字段的日志过滤出来,然后使用get_json_object函数解析每个字段。
2、分析用户行为数据
主要通过 hive提供的 get_json_object(“json主题”,”$[i]”)进行提取分析;将获得的数据进行提取,存入表数据中
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/153206.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...