王朝百科
分享
 
 
 

Informatica

王朝百科·作者佚名  2010-05-28  
宽屏版  字体: |||超大  

Informatica公司介绍创立于 1993 年,总部位于 Redwood City, California of USA 的 Informatica ( Nasdaq:INFA )公司,作为电子商务分析型软件市场的领先者,一直致力于通过自身的产品和服务提升企业的竞争性优势。其拳头产品 Informatica Insight Network(Infrastructure and Analytics) 已被全球 1 , 800 多家企业用来集成、分析和个性化企业的关键商务信息,优化整个商务价值链的表现和响应速度。拥有包括 Citigroup, Deutsche Bank, AT&T, British Telecom, Motorola, Cisco, HP, Boeing, National Semiconductor, Timer Warner, News Group 在内的广泛的客户群。

Agent Logic 拥有商业和公共领域的客户,包括美国国家安全局。在公共领域,Agent Logic 可以促进海域感知、地理空间跟踪以及战场命令和控制。在商业领域,Agent Logic 能够通过符合相关差旅和开支政策的规则,帮助控制与公司信用卡计划有关的成本。

Agent Logic 将进一步加强 Informatica 在公共领域的业务,特别是美国联邦政府。

Informatica在全球Informatica,1993年创立于美国加利福尼亚州,并于1999年4月在纳斯达克上市。 作为全球领先的企业数据集成解决方案提供商,Informatica提供专业数据集成软件和服务,以解决系统间的数据碎片问题,从而帮助企业获得了数据的更大商业价值。

Informatica开放、独立于平台的软件降低了企业IT的运营成本、加快了产出速度,可伸缩处理不同规模或不同复杂程度的数据集成项目。Informatica拥有遍布全球的客户关系网络,其出色的成功案例显示,Informatica将帮助更多的企业和政府机构实现其企业数据的商业价值。

Informatica在中国全球信息化的步伐已日趋加快,数据和信息将最大化地提高企业IT投资回报率。高速发展中的中国也在积极推进各项信息整合工程及企业大量信息化的投资建设,Informatica把中国列为其全球投资的最重要国家之一。

Informatica于2005年正式进军中国,凭借其先进的技术和完善的服务,在短短的几年时间中,很快就发展了包括金融、电信、制造、政府、保险、公众服务等多个领域的众多客户,帮助更多企业架构随时随地呈现正确而重要信息的数据整合平台。 在积极发展自身业务的同时,Informatica还积极致力于推动中国信息化产业的发展,把全球领先的理念、技术和经验分享给国内的企业和合作伙伴,帮助其加强信息化管理,最终共同推进中国的信息化建设,把中国的信息化产业推向国际市场。

Informatica产品简介Informatica PowerCenter:

各种规模的企业和政府组织都可以访问、发现并集成任何业务系统中各种格式的数据,并可以以任意的速度在企业范围内传递数据。PowerCenter是一个统一的企业数据集成平台,解决了数据高复杂化的各种挑战。例如,可以帮助用户从原有系统中移植数据、整合各种应用程序实例或同步多个业务系统中的数据。PowerCenter可帮助企业从其数据中获取商业价值,从而降低IT成本和复杂度、简化业务运营和流程并且增加收入。

Informatica PowerExchange:

可以简化数据集成,甚至是最复杂的数据整合要求的数据集成,可以使企业能按需访问所有的关键企业数据系统(包括大型机、AS400)中的数据,实现变化数据的捕获、实时的集成。使用 PowerExchange,企业就可以实现数据的最大商业价值。

Informatica Data Explorer:

是一整套数据探查、发现和映射工具。数据分析人员使用该工具设计复杂的数据移植和数据集成项目。Informatica Data Explorer通过称作数据摘要的自动化流程提供完整和非常精确的企业数据。该产品提醒用户注意来源和目标之间的不兼容性,并识别会导致下游集成故障的问题。Informatica Data Explorer有助于确保避免突发事件,所以有价值的IT活动可以按照预算按时进行,风险也很小。

Informatica Data Quality:

是全球唯一的聚焦于业务数据质量的软件。是实现数据拥有人员设计、管理、部署和控制企业范围的数据质量解决方案。该企业级产品解决Informatica Data Explorer识别出来的问题,在各个系统的多个点上提供处理数据质量问题的解决方案,同时集中维持数据质量标准的控制和管理。可以真正使业务信息拥有者控制企业范围的数据质量,使企业中的合适个体能够实施持久有效的数据质量流程。

Informatica ETL工具介绍一、总体概述

ETL 包括 Extract 、 Transform 、 Cleaning 和 Load ,它是用于从生产库中提取数据到数据仓库中,再由具体的报表、统计、分析工具对数据仓库的内容进行分析,分析出自己所需要的数据。

其中 ETL 培训的内容是如何利用 Informatic PowerCenter 把源数据库的内容提取存放到目标数据库中。主要

Informatic 主要包括四个部分: Client , Reposity Server , Reposity Database 和 Informatic Server 每个部分实现自己的功能。

二、系统体系结构

此部分介绍了 Informatic ETL 工具包括的主要内容。

1.Client

Informatic Client 主要有五个部分。 Client 可以和 Reposity 分离,通过 TCP/IP 连接,连接到远程的 Reposity Server 。

2. Reposity Manager

主要用于进行一个 Reposity 库的管理,当用户使用 Client 工具登录一个 Reposity 服务器之后,进行文件夹权限的创建,用户权限、密码的管理等。

3. Designer

主要是进行数据抽取的转换工具的设计,主要是 mapping 的设计、设计源数据库的结构,目标数据库的结构,然后设计把源数据导入到目标数据库中,所需要进行的转换操作( Transformation )。

同一个 Reposity 的 folder 之间可以建立 shortcut 方式,多个 reposity 的 folder 之间只能做拷贝。

4. Workflow Manager

主要用于流程任务( workflow Task )的设计。

进行任务流程的设计、每一个 Tast 针对一个 Session ,一个 session 针对一个 mapping ,其中 workflow 中的 Folder 和 Designer 中的 folder 相对应的关系。一版来说,用户都是建立自己的 Folder 。

5. Workflow Monitor

主要进行流程运行、及任务运行时的流程运行情况跟踪。可以跟踪日志。包括 Session 日志和 Workflow 日志,可以设置生成日志的循环个数。分析 session 运行是对源数据库的数据抽出信息和对目标数据库的更新信息。

6. Reposity Server Application Console

主要进行 Reposity 的管理,包括 Reposity Server 的 start , shutdown 操作。进行 Reposity 库的 backup 、 restore 等操作,进行 Reposity 库级别的管理,级别较高。

7. Reposity Server

Reposity server 是为客户端服务的,客户端可以和各种 client 不在一台服务器上。关于数据抽取的设计成果转换成为 XML 格式的源数据,都是通过 Reposity Server 存放到 Reposity Database Server 上的。

8. Reposity Database Server

用于存放的是进行 ETL 设计的元数据。可以支持各类的数据库。方式为数据库中用户的一个表目录和用户关系即可。

Reposity Database 可以和 Reposity server 不安装在一台服务器。如果在一台机器上, server 通过 native 方式连接到 database ,如果不在一台及其上,需要在 database 上安装一个 reposity agent ,用户通过 agent ,以 native 方式连接到 reposity 数据库,然后 reposity agent 再以 tcp/ip 方式连接到 reposity server 。

9.Informatic Server

Informatic server 是实际执行数据抽取任务的运行环境。即 workflows 、 task 、 sessions 等。它是根据定义的 workflow 元数据库,然后在自己的实际环境中,执行数据抽取操作。

三、系统组件功能

Informatic 的功能主要体现在 Designer 和 Workflow Manager 上,其中 Designer 实现的是对数据抽取的数据转换方式设计,以及效率设计目标等。而在 Workflow Manager 中再把具体的数据转换方式应用到一个具体的工作任务中,包括目标库、源库的选择,以及一条具体的执行任务的属性设置等等。包括任务的 insert 、 truncate 、 delete 、 increment insert 等。

1.Designer 组件

( 1 )工作区

在 Designer 中,涉及到的工作区主要包括有 Source Analyzer 、 Warehouse Designer 、 Transformation Designer 、 Mapplet Designer 和 Mapping Designer 。

其中每个工作区的功能分别介绍:

Source Analyzer :

Source Analyzer 的功能是实现对源数据库表的设计,可以手工的进行源数据库的设计,一般都是通过从 Flat File 或者 Relation DBMS 中导入数据库的表结构。 XLS 文件结构。

Warehouse Designer

用于设计目标数据库库的结构,可以利用手工设计,也可以利用 import 工具导入导一个 warehouse 的结构。

Transformation Designer

用户设计可重用的 transformation 组件,这里的组件,在一个 folder 里面都是可以重用的,而且以 shortcut 的方式使用。 Transformation 组件的修改,会直接反映到使用此 transformation 的 mapping 中。

Mpplet

设计可以重用的多个组件,只要有 output 组件,可以有 input 组件,也可以没有 input 组件,实现的功能就和一个 expression 的功能类似,实现功能。

Mapping Designer

实现的功能是设计具体进行抽取数据的 mapping ,这些 mapping 应用到一个 workflow 中,形成了 workflow 的一个 session ( task )。

( 2 ) 组件功能

ETL 支持的组件主要包括两类: Active 组件和 Passive 组件,其中 Active 组件是对输入记录集在输出时个数有变化的组件, Passive 组件,输入的记录集,输出时记录集的个数不发生改变。

Informatic 提供的组件包括:

(1) Source Qualifier: reads data from flat file & relational sources

(2) Expression: performs row-level calculations

(3) Filter: drops rows conditionally

(4) Sorter: sorts data

(5) Aggregator: performs aggregate calculations

(6) Joiner: joins heterogeneous sources

(7) Lookup: looks up values and passes them to other objects

(8) Update Strategy: tags rows for insert, update, delete, reject

(9) Router: splits rows conditionally

(10) Sequence Generator: generates unique ID values

(11) Normalizer:izes records from relational or VSAM sources

(12) Rank: filters the top or bottom range of records

(13) Union : merges data from multiple pipelines into one pipeline

(14) Transaction Control: allows user-defined commits

(15) Stored Procedure: calls a database stored procedure

(16) External Procedure : calls compiled code for each row

(17) Custom: calls compiled code for multiple rows

(18) Midstream XML Parser: reads XML from database table or message queue

(19) Midstream XML Generator: writes XML to database table or message queue

每一类组件都有自己独特的功能和特点,这里介绍主要的组件包括上述红色的内容。每一种组件的详细功能这里不详细介绍。

2.Workflow 组件

Workflow 是对执行任务的执行进行控制,可以在执行时对执行的任务进行传参数进行传入,这样就能在执行的时候把数据库表进行动态的设置。

可以在执行的时候选择参数文件,对 mapping 、 workflow 中的 Session 的参数进行传入。达到动态执行的目的。

Workflow 中定义 workflow 、 session 等任务,对这些任务的执行进行管理控制。

四、补充说明

Source Qualifier 支持同构数据源的连接,异构数据源的连接通过 N-1 个 jointer 组件实现。

Lookup 为 passive 组件,查出的多条记录集,要么取 first ,或者 last ,或者报错。

Lookup 可以时动态 / 静态 ,可以 connected/unconnect 。

 
 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如何用java替换看不见的字符比如零宽空格​十六进制U+200B
 干货   2023-09-10
网页字号不能单数吗,网页字体大小为什么一般都是偶数
 干货   2023-09-06
java.lang.ArrayIndexOutOfBoundsException: 4096
 干货   2023-09-06
Noto Sans CJK SC字体下载地址
 干货   2023-08-30
window.navigator和navigator的区别是什么?
 干货   2023-08-23
js获取referer、useragent、浏览器语言
 干货   2023-08-23
oscache遇到404时会不会缓存?
 干货   2023-08-23
linux下用rm -rf *删除大量文件太慢怎么解决?
 干货   2023-08-08
刀郎新歌破世界纪录!
 娱乐   2023-08-01
js实现放大缩小页面
 干货   2023-07-31
生成式人工智能服务管理暂行办法
 百态   2023-07-31
英语学习:过去完成时The Past Perfect Tense举例说明
 干货   2023-07-31
Mysql常用sql命令语句整理
 干货   2023-07-30
科学家复活了46000年前的虫子
 探索   2023-07-29
英语学习:过去进行时The Past Continuous Tense举例说明
 干货   2023-07-28
meta name="applicable-device"告知页面适合哪种终端设备:PC端、移动端还是自适应
 干货   2023-07-28
只用css如何实现打字机特效?
 百态   2023-07-15
css怎么实现上下滚动
 干货   2023-06-28
canvas怎么画一个三角形?
 干货   2023-06-28
canvas怎么画一个椭圆形?
 干货   2023-06-28
canvas怎么画一个圆形?
 干货   2023-06-28
canvas怎么画一个正方形?
 干货   2023-06-28
中国河南省郑州市金水区蜘蛛爬虫ip大全
 干货   2023-06-22
javascript简易动态时间代码
 干货   2023-06-20
感谢员工的付出和激励的话怎么说?
 干货   2023-06-18
 
>>返回首页<<
 
 
 
静静地坐在废墟上,四周的荒凉一望无际,忽然觉得,凄凉也很美
© 2005- 王朝网络 版权所有