- ETL工具:Kettle(官网,Pentaho公司开源)、 Informatica、Datastage、OWB、微软DTS、Beeload、久其ETL,Oracle GoldenGate等等……开源的工具(16款开源工具,OSchina ETL工具列表),有eclipse的ETL插件: cloveretl
- 工作流引擎:jBPM,Activiti,H3 BPM, osworkflow,Shark(没官方网站吗?), JaWE(没有官方网站?), 参考1
- 数据仓库DW:Hadoop,Spark
- 可视化报表分析:
- 管理工具:Apache Storm
- BI集成平台:Pentaho (官网)
- 相关概念:FSM(Finite State Machine)状态机,PetriNet,WfMC工作流管理联盟,BPM业务流程管理,对业务数据本身及其运行环境的描述与定义的数据,称之为元数据(metadata)元数据是描述数据的数据。元数据的典型表现为对象的描述,即对数据库、表、列、列属性(类型、格式、约束等)以及主键/外部键关联等等的描述。
- 参考:
- 大数据核心ETL
- ETL-Tool,BI的核心是ETL
- ETL概念介绍(有Informatica广告之嫌)
ETL工具选型:
oracle下可选odi,GoldenGate;sqldeveloper亦可作为加载数据的工具;
oracle warehouse则使用owb;
ibm下可选vw(visual warehouse);
mysql下可选kettle,GoldenGate;
mssql下则使用独门的dts;



所有评论(0)