溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

數據倉庫和Olap的區別是什么

發布時間：2021-06-26 14:38:27 來源：億速云閱讀：1203 作者：chen 欄目：大數據

這篇文章主要介紹“數據倉庫和Olap的區別是什么”，在日常操作中，相信很多人在數據倉庫和Olap的區別是什么問題上存在疑惑，小編查閱了各式資料，整理出簡單好用的操作方法，希望對大家解答”數據倉庫和Olap的區別是什么”的疑惑有所幫助！接下來，請跟著小編一起來學習吧！

大數據領域體系非常龐大，最近自己在了解數倉部分，做些記錄。

首先解釋OLTP和OLAP的概念，作為開發對OLTP比較了解，操作對象是數據庫，也稱為OLTP數據庫(比如Mysql)，主要用于CRUD操作，講求高并發、低延時，一般作為業務數據使用。

而OLAP則是聯機分析處理，做數據分析用的，比如進行數據聚合操作，它操作的數據源比較大，對性能要求相對較低。操作對象是數倉。有的時候OLAP也等同數倉。

數倉一般是多維模型模型，數據分層，ETL處理。它的數據源來源很多，格式也很多，比如結構化的數據，非結構化的數據。

對于ETL處理，需要對業務的理解非常透，比如MySQL是作為業務使用的，比如商品業務可能有很多類型的表，而到數倉后，可能會重新建模，比如分為維度表和事實表。

現在我們面臨兩個問題，第一就是ETL機制非常弱，基本上是原樣將MySQL庫導入到數倉;第二業務庫變更后，需要重新構建，對于業務數據庫的理解總是落后的。

那數倉有什么用呢，可以進行交互式查詢，數據分析，數據挖掘，BI報表。

根據不同的理解，數倉也有很多的分類，比如：

1：根據建模分為MOLAP，ROLAP，HOLAP

MOLAP需要進行預計算，將可能的查詢結果存儲起來，適合分析比較穩定的場景，Kylin是這個領域的解決方案。

ROLAP是目前的主流，基于關系模型，構建在多維數據模型上，一般通過SQL就能查詢。

2：對于ROLAP:有兩種解決方案，一種是寬表模型，比如現在比較流行的clockhouse;另外就是多表組合模型，比如Presto。

3：從實時性分:分為實時數倉和離線數倉，本文主要理解離線數倉，也叫批處理，就是數據是提前準備好的，比如Hadoop就是解決這類問題的。

4：對于OLAP來說，處理的數據是非常大的，為了加快處理，有兩種解決方案：并行處理(比如 Hadoop 的Mapreduce，Spark，或者MPP架構的Presto)，另外就是預計算(比如Kylin)。

那具體如何選型呢?

1：我們用的是比較常規的Hadoop，HDFS作為分布式存儲，Mapreduce作為并行計算框架，但HDFS只是存儲，沒有結構化的概念，那怎么做數倉呢?

使用Hive解決了兩個問題，首先它存儲表結構元數據，其次Hive查詢中的sql自動變為MR并行任務，MR從元數據中讀取信息，然后去HDFS中讀取數據，最后進行運算。

一般情況下這屬于離線數倉，HDFS存儲的是T-1的全量數據(不支持數據增刪改查，只能整個文件覆蓋)，使用sqoop工具將MySQL導入到HDFS中。

2：MPP on Hadoop 的解決方案

由于MR操作HDFS的中間結果還是在磁盤，所以運算還是很慢的。

Presto是基于MPP架構，充分利用各個節點的cpu能力，中間結果放入內存，減少磁盤消耗。

比如Presto作為SQL執行引擎，本身不存儲數據，它可以直接調用MySQL進行運算。

也可以調用Hive，讀取元數據，然后操作HDFS的數據，進行并行運算。

有了Hive，有了Presto，結合可視化的BI工具，就能產生數據報表，進行數據分析和挖掘。

最后簡單說下BI，有個公式：

BI平臺=數據倉庫+OLAP服務/報表。

到此，關于“數據倉庫和Olap的區別是什么”的學習就結束了，希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習，快去試試吧！若想繼續學習更多相關知識，請繼續關注億速云網站，小編會繼續努力為大家帶來更多實用的文章！

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
Python中變量作用域是什么意思
下一篇新聞：
Android中怎么實現Https

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女