一个简单的ETL开发的过程(informatica)

一个简单的ETL开发的过程(informatica)大致的了解过程,中间不涉及组件部分。 正文PowerCenter的开发过程大致可以分为几步:1.在客户端PowerCenterDesigner中导入源表和目标表的结构定义。(只是表结构)2.在PowerCenterDesigner中执行的事件为:   1>.创建Mapping。   2>.拖动源和目标进入Mapping。(类似于定义变量)   …

大家好,又见面了,我是你们的朋友全栈君。

大致的了解过程,中间不涉及组件部分。

 

正文

PowerCenter的开发过程大致可以分为几步:

1.在客户端PowerCenter Designer中导入源表和目标表的结构定义。(只是表结构)

2.在PowerCenter Designer中执行的事件为:

    1>.创建Mapping。

    2>.拖动源和目标进入Mapping。(类似于定义变量)

    3>.建立源和目标的映射。(对变量进行赋值)

3.运行Workflow,提供相对应的配置信息以及参数。在PowerCenter中的载体是Workflow和Session。

4.通过Workflow Monitor客户端进行监控。

 

前提

在进行开发PowerCenter之前,一般需要完成两件事。(后续不再需要,第一次新环境才需要)

1.使用PowerCenter客户端连接域(Domain)和Repository Service。

2.建立一个Folder文件夹。(用于开发学习)

前提过程:

1.1.打开Repository Manager客户端,选择菜单Repository -> Configure Domains。Add a new domain,填写信息。

这里有几点需要注意:

    1).Domain Name:打开Admin Console。Admin Console是一个基于Web的管理控制台,一般通过类似于URL”http://host1:6005″进行访问。host1就是安装了PowerCenter服务器的机器名,6005是端口号。在Domain Navigator树的最顶层就是Domain Name。

    2).Gateway Host,这里填写服务器的主机名。在安装了PowerCenter的Windows客户端,还需要配置hosts文件,目录位于C:\WINDOWS\System32\drivers\etc,在hosts文件中增加类似条目:192.168.75.129host1.

    3).Gateway Port,默认端口6005,这是在安装过程中确定的,如果在安装的过程中有更改,这边也需要更改,保持一致性。

1.2.信息输入完之后,确认。下一界面,勾选Repository Service名字,这个也可以在Admin Console中找到相对应的信息。再确认之后双击你的Repository Service,输入用户名以及密码。默认用户名是Administrator,密码是在安装的时候确认的。点击Connect可以确认是否客户端连接服务器成功。

2.在Repository Manager,选择菜单Folder -> Create,弹出Create Folder菜单,输入Folder Name信息确认即可。

 

 

定义源表

打开客户端PowerCenter Designer,点击Source Analyzer图标。源表来源多样,这边只举一例子。So 选择菜单Sources,选择Import From Database命令,在弹出的Improt Tables对话框输入信息。

如果是第一次使用,需要创建一个ODBC DSN。单击”…”图标,选择”系统DSN”,单击”添加”,选择驱动程序,以Oracle数据库为例子,选择”DataDirect 7.1 Oracle Wire Protocol”。填写数据库信息,这时候就新建完了。到ODBC Oracle Wire Protocol Driver Setup中,输入Data Source Name,用户名,密码,可以测试连接,没有问题的话回到Import Tables,选择要的表做完源表的结构。

 

定义目标表

打开客户端PowerCenter Designer,点击Target Designer图标,剩下的步骤类似于定义源表,都是Import From Database等等。

 

好了,这时候我们已经把源表,目标表的结构定义好了。

下面需要进行一个关键的步骤,Mapping。(类似于C Main程序)

 

Mapping

点击Mapping Designer图标,选择菜单Mappings -> Create,在弹出的菜单中输入Mapping的名称,相关的命名规则参照PowerCenter内部建议的命名规范,这对大规模的Mapping开发的时候很有帮助。

在之前创建的Folder文件夹下面选择到所创建的源表,按住鼠标,拖动到Mapping Designer工作区。

同样的把Target表拖动到Mapping Designer工作区。这时候在Mapping Designer中会出现三个框,一个Source,一个SQ,一个Target。这时候需要为变量赋值,选择SQ表中的内容,拖动到Target上面,至此,一个简单的Mapping完成了。

这时候,需要保存(ctrl+s)

如果在Folder中的mappings中看到我们的Mapping是带有感叹号的,是无效的,需要更正。

 

Workflow

打开PowerCenter Workflow Manager,选择Workflow Designer,菜单栏中选择Workflows ->Wizard,在弹出来的对话框中输入Workflow的名字,命名规则参考Velocity Methodology。选择PowerCenter Integration Service,点击下一步进入Create Sessions界面。在左边可以看到Mapping,点击 Add session for the selected mapping。可以看到右边出现了一个session。然后下一步,完成即可。

在Workflow Designer中可以看到生成的过程。然后点击我们的session,选择Mapping Tab,选择Source,这里为源表创建一个数据库连接。方法:选择菜单,选择Connections -> Relational。单击NEW,输入连接的name,数据库的用户名,密码,连接串。

完成后ctrl + s保存。

同理:选择Target,设置WRITERS,在output type中设置信息可以设置为目标表导出。

 

监控运行

启动Workflow之后,打开Workflow Monitor,双击Session,可以查看Session运行的详细信息,包括运行状态,开始,结束时间,读取,写入行数,吞吐量以及运行的时候的错误等信息。

 

至此,一个简单的过程结束。

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/139569.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • shell循环读取文件拼接字符串

    shell循环读取文件拼接字符串1注意通道和重定向的区别通道会开启子shell,于是通道语句块内的变量修改是无法影响到其外的变量的,故使用重定向;2windows文件末尾是/r/n拼接来自windows系统的文件务必首先注意:[nash5camFiles]#cat-AcamFiles.ori0.863631-0.269646-0.425949^M$

  • 如何Ping特定端口号

    如何Ping特定端口号ping端口是最有效的故障排除技术之一,以便查看服务是否正常运行。系统管理员每天都使用ping命令,它依靠ICMP协议来检索有关远程主机的操作信息。但是,仅对主机进行ping操作并不总是足够的:您可能需要对服务器上的特定端口执行ping操作。此特定端口可能与数据库,ApacheWeb服务器甚至网络上的代理服务器相关。在本教程中,我们将看到如何使用各种不同的命令来ping特定端口。使用telnetping特定端口ping特定端口的最简单方法是使用telnet命令,后跟要pin.

  • SHFileOperation函数使用的介绍

    SHFileOperation函数使用的介绍今天看到一个关于SHFileOperation函数使用的介绍,发现下面一些有用的资料,都是些之前未仔细了解的方面,这里把他们记录下来,留待以后查阅参考。fFlags成员标志间的关系标志抑制的对话框相关性与优先级FOF_MULTIDESTFILES无无FOF_FILESONLY

  • html中添加背景音乐的标签,添加背景音乐的html标签是什么

    html中添加背景音乐的标签,添加背景音乐的html标签是什么添加背景音乐的html标签是,bgsound是用以插入背景音乐,但只适用于IE,在netscape和firefox中并不适用,其参数设定很少,语法如“”。添加背景音乐的html标签是。bgsound是用以插入背景音乐,但只适用于IE,在netscape和firefox中并不适用,其参数设定很少。如下src=”bjyy.mp3″设定背景音乐文件及路径,可以是相对路径或绝对路径。(不…

  • Tomcat 的类加载机制

    Tomcat 的类加载机制Tomcat实际上只有WebAppClassLoader加载器中打破了双亲委派,其他类加载器还是遵循双亲委派的。这样做最主要原因是保证同个Web容器中的不同Web应用程序所使用的类库相互独立,避免相互影响

  • 融合计费账务系统架构与核心功能的研究与实现

    融合计费账务系统架构与核心功能的研究与实现2006年初,融合计费账务系统的发展趋势及其重要性已得到业界的广泛关注,各电信运营商及开发商也开始了相应的讨论、研究和规划,北京联通(原北京网通)在业务和网络的发展驱动下,率先开始了融合计费账务系统的规划与建设,真正建设一个统一支撑大客户、商务客户和公众客户所有客户群,统一支撑北京联通电话、宽带、小灵通、互联网、专线及CP/SP业务等全业务及其灵活捆绑与组合营销,统一支撑在线…

    2022年10月31日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号