大数据etl是干嘛的,

数据 6

【转载or抄袭】数据库:什么是BI,ETL和OLAP?

【转载or抄袭】数据库:什么是BI,ETL和OLAP?

展开全部


ETLETL即数据抽取(Extract)、转换(Transform)、装载(Load)的过程。它是构建数据仓库的重要环节。数据仓库是面向主题 的、集成的、稳定的且随时间不断变化的数据集合,用以支持经营管理中的决策制定过程。数据仓库系统中有可能存在着大量的噪声数据,引起的主要原因有:滥用 缩写词、惯用语、数据输入错误、重复记录、丢失值、拼写变化等。即便是一个设计和规划良好的数据库系统,如果其中存在着大量的噪声数据,那么这个系统也是 没有任何意义的,因为“垃圾进,垃圾出”(garbage in, garbage out),系统根本就不可能为决策分析系统提供任何支持。为了清除噪声数据,必须在数据库系统中进行数据清洗。目前有不少数据清洗研究和ETL研究,但是 如何在ETL过程中进行有效的数据清洗并使这个过程可视化,此方面研究不多。
联机事务处理OLTP
联机分析处理 (OLAP) 的概念最早是由关系数据库之父
E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。
当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-Line Analytical Processing)。OLTP是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。OLAP是数据仓库系统的主要应用,支 持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
OLAP是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。

etl是什么

etl是什么

ETL,Extraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载

ETL属于数据仓库的基本功能层,还是属于数据仓库的管理层?

ETL是从数据仓库里面去数据,进行处理用户BI设计用的,好像补数据数据仓库的范畴,我现在做的项目就是用的informatica进行数据抽取的,真正算的ETL是独立的部分

大数据ETL开发是做什么的

也是科研人员的锥心之痛,实事求是

标签: #数据 #数据 #数据 #融云 #采集器 #贵阳 #云计算是干嘛的 #烂了