拉链表的实现过程[通俗易懂]

拉链表的实现过程[通俗易懂]拉链表的优势我就不说了,具体请参考百度百科:拉链表-百度百科推荐一个比较详细的参考文章:拉链表示例主要总结一下实现过程:分析:拉链表就是用来存储变化的数据的,每一份数据都有对应的有效期,我们需要进行的操作就是将变动的数据进行新增,同时将变动对应的前一条数据的有效期进行变更。说明:一般都是今天处理昨天的数据,本文所说的当天为所处理的数据的产生的当天。在这之前需要熟悉一下需要用到的表:表1:订单表(记录原始的数据)表2:增量数据表(记录每日变更的数据)表3:历史拉链表(我们要得到的就是这张表

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

拉链表的优势我就不说了,具体请参考百度百科:
拉链表-百度百科
推荐一个比较详细的参考文章:
拉链表示例

主要总结一下实现过程:

分析:拉链表就是用来存储变化的数据的,每一份数据都有对应的有效期,我们需要进行的操作就是将变动的数据进行新增,同时将变动对应的前一条数据的有效期进行变更。
说明:一般都是今天处理昨天的数据,本文所说的当天为所处理的数据的产生的当天。
在这之前需要熟悉一下需要用到的表:
表1:订单表(记录原始的数据)
表2:增量数据表(记录每日变更的数据)
表3:历史拉链表(我们要得到的就是这张表)
表4:临时历史拉链表(临时表,处理好之后将数据覆盖到历史拉链表中)

总结过程:

初始化:
-1、从订单表中完整获取第一批数据,因为没有历史数据,可以直接初始化到增量数据表中
-2、将增量数据表中的数据直接放入历史拉链表中,有效期为 当前 -> 永久。
增量:
1、将当天变动的数据集A放到增量数据表中(使用createdate & modifydate 进行筛选)
2、将历史拉链表跟数据集A进行左连接,关联上的数据说明已经出现变动,将这部分数据的截止时间进行更新,最为数据集H,这部分相当于历史数据了
3、将增量数据表中的数据添加有效期,有效期为 当前 -> 永久,作为数据集T,这部分相当于当天变动的数据。
4、将数据集H 和 数据集T 进行合并,放入临时历史拉链表
5、最后将临时历史拉链表覆盖历史拉链表
以上就是一个增量的过程,需要注意的是如果一份数据当天多次,我能想到有两种解决方案:
方案1:在取增量数据的时候取最新的一次,这种方案比较广泛吧。
方案2:需要在第三步整理数据集T的时候进行处理,也就是筛选出并不是最新数据的集合,将这部分数据的有效期进行填充,不过我觉得这种方法对于输出快照不太友好。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/184028.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(1)


相关推荐

  • Vue基础知识总结 11:前端路由vue-router

    Vue基础知识总结 11:前端路由vue-router一、前端路由vue-router1、维基百科路由就是通过互联的网络把信息从源地址传输到目的地址的活动。2、路由的机制路由包括路由和转发。路由器->公网IP->映射表->内网IP映射表:[内网ip1:电脑标识1,内网ip2:电脑标识2]3、后端渲染JSP:javaserverpage后端渲染==html+css+javajava代码的作用是从数据库中读取数据,然后将他们动态的放在页面中。后端渲染的意思就是,前端请求后端,

  • Git客户端下载及安装

    Git客户端下载及安装Git客户端的下载及安装过程

  • Python深拷贝与浅拷贝_python 赋值

    Python深拷贝与浅拷贝_python 赋值深拷贝和浅拷贝不管对于浅拷贝、还是深拷贝,针对不可变对象str、int、tuple(有点特殊)、boolean,它的内存地址是不变的,拷贝的仅仅是值importcopya=1b=co

  • Mac OS 如何卸载干净Pycharm

    Mac OS 如何卸载干净Pycharm由于Pycharm新版本的某些原因想更换低版本的朋友,可以按照以下步骤清除干净pycharm残留数据(本人卸载过程记录,如有错误请指正):1、打开访达,找到PyCharm应用,右键移到废纸篓;2、清理缓存,参数,日志相关配置文件:(注意:使用lsPyCharm关键字进行搜索,PyCharm2020.1是我的文件名称)a、cd~/Library/Preferences/rm-rfPyCharm2020.1/…

  • pycharm编制索引_网页制作作品源代码

    pycharm编制索引_网页制作作品源代码tree/f/a>codeTree.txt

  • pycharm安装2021_idea环境配置

    pycharm安装2021_idea环境配置环境配置这一篇是给新手朋友准备的,如果你本地已经安装配置,请自行跳过Python代码运行,需要解释器,Python解释器下载地址:https://www.python.org/鼠标悬停在Downloads上,然后选择对应的操作系统,点击版本号即可。我这里以Python3.9.2为例官网下载较慢,可以在公众号:Python极客专栏,后台回复【python392】获取安装包。下载完毕,双击打开(建议以管理员身份运行)。不建议按照默认的方式安装,参考下图点击之后出现如下界面Docu

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号