目录
1,etl是什么
ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。 数据仓库是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。 ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节。 扩展资料: ETL与ELT: ETL所描述的过程,一般常见的作法包含ETL或是ELT(Extract-Load-Transform),并且混合使用。通常愈大量的数据、复杂的转换逻辑、目的端为较强运算能力的数据库,愈偏向使用ELT,以便运用目的端数据库的平行处理能力。 ETL(orELT)的流程可以用任何的编程语言去开发完成,由于ETL是极为复杂的过程,而手写程序不易管理,有愈来愈多的企业采用工具协助ETL的开发,并运用其内置的metadata功能来存储来源与目的的对应(mapping)以及转换规则。 工具可以提供较强大的连接功能(connectivity)来连接来源端及目的端,开发人员不用去熟悉各种相异的平台及数据的结构,亦能进行开发。当然,为了这些好处,付出的代价便是金钱。
2,ET是什么意思?
1、Et 英文缩写:Et 英文全称:Ethyl 中文解释:乙基 缩写分类:化学化工 2、ET 英文缩写:ET 英文全称:extra-terrestrial 中文解释:外星人 缩写分类:常用词汇 3、ET 英文缩写:ET 英文全称:endothelin 中文解释:内皮素 缩写分类:生物科学、医药卫生 4、ET 英文缩写:ET 英文全称:Ethiopia 中文解释:埃塞俄比亚 缩写分类:机构组织 5、ET 英文缩写:ET 英文全称:elapsed time 中文解释:逝去的光阴 缩写分类:常用词汇
3,ETL学习笔记之一:ETL是什么?
对于数据仓库以及ETL的知识,我基本上是个门外汉。一切都得从头开始,记个笔记,方便自已了解学习进度。 首先,我们来了解最基本的定义: 嗯,也有人将ETL简单称为数据抽取。至少在未学习之前,领导告诉我的是,你需要做一个数据抽取的工具。 其实呢,抽取是ETL中的关键环节,顾名思义,也就将数据从不同的数据源中抓取(复制)出来。 太简单了!上面的解释无首无尾,有点象能让你吃饱的第七个烧饼, 仔细一想,抽取是不可能单独存在,我们需要将与之关联的一些其它环节拿出来。 于是,得到ETL的定义: 将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。 好的,既然到了这一个层次,我们完全会进一步展开联想,引出上面这个抽象事件的前因后果, 抽取源:大多数情况下,可以认为是关系数据库,专业一点,就是事务处理系统(OLTP)。当然,广义一点,可能会是其它数据库或者是文件系统。 目的地:OK,我们希望是数据仓库。数据仓库是啥?在学习之前,它对我来说是个抽象的怪物,看过一些简单的资料之后,才了解这个怪物一点都不怪。堆积用来分析的数据的仓库。是了,是用来分析的,于是,它区别于OLTP中的数据存储。 在我看来,有两个原因。 一:性能 将需要分析的数据从OLTP中抽离出来,使分析和事务处理不冲突。咦?这不是数据仓库的效果吗?是了, 数据仓库,大多数情况下,也就是通过ETL工具来生成地。 二:控制 用户可以完全控制从OLTP中抽离出来的数据,拥有了数据,也就拥有了一切。 嗯,OLAP分析,数据挖掘等等等……。 最后,总结一下, 嗯,时不我待,我没有办法一切从头开始, 鸭子要变成一盘菜,并不是举手将之置于油锅之劳。
4,ETL学习笔记之一:ETL是什么?
一切都得从头开始,记个笔记,方便自已了解学习进度。 首先,我们来了解最基本的定义: 嗯,也有人将ETL简单称为数据抽取。至少在未学习之前,领导告诉我的是,你需要做一个数据抽取的工具。 其实呢,抽取是ETL中的关键环节,顾名思义,也就将数据从不同的数据源中抓取(复制)出来。 太简单了!上面的解释无首无尾,有点象能让你吃饱的第七个烧饼, 仔细一想,抽取是不可能单独存在,我们需要将与之关联的一些其它环节拿出来。 于是,得到ETL的定义: 将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。 好的,既然到了这一个层次,我们完全会进一步展开联想,引出上面这个抽象事件的前因后果, 抽取源:大多数情况下,可以认为是关系数据库,专业一点,就是事务处理系统(OLTP)。当然,广义一点,可能会是其它数据库或者是文件系统。 目的地:OK,我们希望是数据仓库。数据仓库是啥?在学习之前,它对我来说是个抽象的怪物,看过一些简单的资料之后,才了解这个怪物一点都不怪。堆积用来分析的数据的仓库。是了,是用来分析的,于是,它区别于OLTP中的数据存储。 在我看来,有两个原因。 一:性能 将需要分析的数据从OLTP中抽离出来,使分析和事务处理不冲突。咦?这不是数据仓库的效果吗?是了, 数据仓库,大多数情况下,也就是通过ETL工具来生成地。 二:控制 用户可以完全控制从OLTP中抽离出来的数据,拥有了数据,也就拥有了一切。 嗯,OLAP分析,数据挖掘等等等。 最后,总结一下, 嗯,时不我待,我没有办法一切从头开始, 鸭子要变成一盘菜,并不是举手将之置于油锅之劳。