[ETL学习]PowerCenter (转)

2012-06-27  金鑫 

1.1 Informatica Powercenter 的概念 
Informatica PowerCenter 是Informatica公司开发的世界级的企业数据集成平台,也是业界领先的ETL工具。Informatica PowerCenter使用户能够方便地从异构的已有系统和数据源中抽取数据,用来建立、部署、管理企业的数据仓库,从而帮助企业做出快速、正确的决策。此产品为满足企业级要求而设计,可以提供企业部门的数据和电子商务数据源之间的集成,如XML,网站日志,关系型数据,主机和遗留系统等数据源。此平台性能可以满足企业分析最严格的要求。

1.2 Informatica公司简介 
Informatica公司创立于1993年,总部位于Palo Alto, California of USA,作为电子商务分析型软件市场的领先者,一直致力于通过自身的产品和服务提升企业的竞争性优势。其拳头产品Informatica PowerCenter已被全球多家著名企业用来建设BI/DW系统,它可集成和分析企业的关键商务信息,优化整个商务价值链的表现和响应速度。Informatica公司于1999年四月首次公开上市发行(Nasdaq:INFA ,$16/每股),拥有包括Citigroup, Deutsche Bank, AT&T, British Telecom, Motorola, Cisco, HP, Boeing, National Semiconductor, Timer Warner, News Group在内的广泛的客户群。 
Informatica公司作为业界领先的BI/DW系统方案提供商,拥有包括分析型应用软件、广泛的支持服务和强大的数据集成平台在内的综合性产品家族。其产品系列有:Informatica PowerCenter(企业级数据集成平台)、Informatica PowerCenterRT(实时数据集成平台)、Informatica PoweMart(部门级数据集成平台)、Informatica PowerChannel(远程数据集成平台)、Informatica Metadata Exchange(元数据交换平台)等。Informatica的基础设施产品以可伸缩的、可扩展的企业级数据集成平台为特点,并广泛支持来自Informatica和其他的领先商务智能提供商的数据仓库基础设施和分析型应用软件的开发和管理。


1.3 Informatica PowerCenter 的作用 
     Informatica PowerCenter 是建立可伸缩和可扩展的Informatica数据集成平台的核心和基础。与Informatica PowerConnect产品一起使用,Informatica PowerCenter 可以提供对广泛的应用和数据源的支持,包括对ERP系统的支持(Oracle, PeopleSoft, SAP),对CRM系统的支持(Siebel),对电子商务数据的支持(XML, MQ Series),遗留系统,及主机数据。Informatica PowerCenter 是最突出的分析性数据集成平台。 
Informatica PowerCenter 是一个可以使大的企业或组织能够按其复杂的业务信息需求,读取、转换、集成遗留系统、关系型ERP,CRM,消息信息和电子商务数据的数据集成平台。

1.4 Informatica PowerCenter 的主要特点 
 数据整合引擎 
Informatica PowerCenter拥有一个功能强大的数据整合引擎,所有的数据抽取转换、整合、装载的功能都是在内存中执行的,不需要开发者手工编写这些过程的代码。Informatica PowerCenter 数据整合引擎是元数据驱动的,通过知识库和引擎的配对管理,可以保证数据整合过程能够最优化执行,并且使数据仓库管理员比较容易对系统进行分析管理,从而适应日益增加的数据装载和用户群。 
 积极的元数据管理 
Informatica PowerCenter充分利用元数据来驱动数据整合过程。它提供了一个单一的元数据驱动的知识库,和数据整合引擎协同运作,并且可使关键的整合过程能被简单定义、修改、重用,从而提高了开发生产力并缩短了部署周期。活动元数据合并严格的文件,提供维护体系,允许冲突性分析,可以广泛跟其他企业应用程序以及系统整合。 
 支持多数据源 
通过辅助产品Informatica PowerConnect, Informatica PowerCenter提供了对特殊数据源和格式的支持,包括SAP、Siebel、PeopleSoft、AS400等。对于e-business格式的数据,可以直接通过分析DTD或XML格式数据文件来实现。 
 高性能的运行功能 
将设计和运行环境的性能特性分离,提供了较好的灵活性,不需要重新编码,吞吐量可以通过服务器、并行引擎管理、最优化CPU资源等方式,尽快处理任务。数据高效并行功能(Data smart parallelism)使用户具有自定义分区功能,提供了最优化的数据并行处理。Informatica PowerCenter提供了一个非编码的图形化设计工具方便用户的调试使用。 
 分布式体系结构 
作为企业级核心数据整合引擎,Informatica PowerCenter 可以单独部署,也可以在分布式体系结构中部署。如果在分布式体系结构中部署,Informatica PowerCenter 要协调和管理多个基于主题的数据集市,而这些数据集市是在局域网或广域网内由Informatica PowerMart 或Informatica PowerCenter引擎执行的。 
  安全的数据整合 
PowerCenter for Remote Data 是Informatica PowerCenter 一个分布式数据整合选项,提供了高性能、安全的、投资回报率高的方法,使用户可以跨广域网与合作伙伴、供应商以及其他远程数据源交换信息。

465°/4654 人阅读/0 条评论 发表评论

登录 后发表评论