Greenplum
用於管理和分析任何雲端上、任何資料類型的單一數據平台
大規模平行處理資料倉儲,面對巨量資料的互動式工具
開放式架構
可根據應用需求配置規格
具橫向擴充能力,隨需求延伸叢集能量
分散式儲存&分散式運算
Massive Parallel Processing(MPP) 建構分散式運算,可隨叢集大小擴充運算能量
在任何模式下使用數據
線上擴增叢集節點毋須停止服務
細膩的資源管控能力,系統資源分配更有效
可視化管理工具,讓 DBA 維運更輕鬆
Massively Parallel Processing(MPP)建構分散式運算
可隨叢集大小擴充運算能量
Greenplum 勝出的三大特點
01
以標準x86硬體為基礎的大數據平台,不會被專屬硬體綁架
02
Greenplum 可以水平擴充,以便因應資料不斷成長。且硬體擴展時,資料可以自動重新分配,不必做資料轉移
03
Greenplum 提供即時串流 Kafka 及 Hadoop Spark 等連結器,可以不藉著資料交換平台,就能與本案資料湖泊互通。
VMware Tanzu Greenplum
用於管理和分析任何雲端上、任何資料類型的單一數據平台
使用Greenplum四大的好處
便民
部署在任何基礎設施類型-基於OSS技術的私有雲,公共雲
唯一基於開源技術可運行在任何地方的的數據倉庫
- 部署在任一處
- 基於開源科技的應用
在客戶數據中心或公共雲中運行
虛擬或 Bare-mental
基於開放標準(Commodity Hardware)的硬體運行,無需專有硬體設備
透過大型Greenplum Community社群取得更快的功能添加
獨立供應商
基於 Postgresql 的核心技術, 擁有強大的社群支援
速度和可擴展性
由於 In Database Analytics + Query 和數據攝入,對 Petabyte 大小數據集的查詢洞察時間更快
由獨特的能力來處理OLTP和OLAP 來取得高速和性能
- 高速擴展性
- 高同步管理
- 數據壓縮和儲存
Parallel Query Optimizer 運行數百萬種不同的 SQL 查詢語法
業界領先的 OLAP 查詢性能
批量數據下載,串流數據流和行業標準 ETL 工具兼容性
能夠定義資源組,以確保每個重要工作負載的資源分配數千個併發連接, Row level locking以每秒數千次的速度支援快速 OLTP,可以平行運行數以百計的平行複雜查詢
行和列導向的存儲配置在表級中確定數據壓縮以減少空間使用,支持S3 和 HDFS 中的外部資料存取,具有開放的檔案格式,如Parquet, AVRO和ORC
方便性
單一平臺上的支援不同數據類型
文本、地理空間、圖形、圖像、視頻、語音、結構化
針對所有儲存在任何地方、任何數據類型的
數據處理需求的一站式平台
- 擴展用戶定義數據類型自行定義處理功能
- 能夠查詢任何地方的任何數據
- 資料庫內數據分析&多種 AI/ML演算法
JSON & XML - 在查詢處理過程中,存儲具有靈活計劃和內省文檔結構的檔
Text, Image, Video - 將豐富的「非結構化」數據儲存在表中,對這些類型進行搜索和深度學習識別
Network Traffic, IoT, Logs – Ip 位址、位址範圍、數據包擷取、系統日誌和物聯網絡感測器存儲和分析
Geo & Graph - 位置和關係可以儲存和進行本地分析
聯合查詢處理 – 平台擴展框架(PXF)可以多種格式和位置查詢位於跨雲端儲存物件、數據湖、SQL/No SQL, Streaming data與Kfaka、Spark外部數據
大規模平行外部資料存取 – 每個細分段並行掃描外部資料來源,以取得 TB 和 PB 規模的外部資料表
嵌入式機器學習、神經網路、Python、R、地理空間、圖形和文本分析,建立於可擴展基礎的分析
生產力
通過 Tanzu Datamanagement 和 vSphere HA
功能實施數據倉庫生命週期管理
透過 Tanzu Data Management 的全 DW 生命週期自動化
- 數據倉庫生命週期管理
- 高可用性和工作負載可移植性
透過 Greenplum 作為服務達成 Greenplum-as-a-service
先進的數據解決方案,可管理手動和嚴格的 DW 生命週期任務,提高數據團隊的生產力
Tanzu Data Management 自動化數據生命週期管理任務包括安全修補、撥備、備份和縮放
Greenplum + vSphere + vSAN 組合將裸機解決方案(bare metal solution)轉變為「Always On」解決方案,減少了維護停機和提高 HA 功能的需求
對關鍵任務工作量至關重要
Greenplum + vMotion 組合支援將查詢運行到不同機器的移動行程
減少處理任務的關鍵系統維護停機時間和提高工作負載便攜性
VMware Tanzu Greenplum
用於管理和分析任何雲端上、任何資料類型的單一數據平台
Vertical Partitioning
Large fact tables分為有效數據訪問和保留策略的時間範圍
Polymorphic Partitioning
Partitioned table中的不同範圍,可以使用不同的儲存參數和介質
Optimizer Partition Elimination
查詢處理將僅自動掃描包含查詢條件所需的數據的儲存介質
Greenplum應用場景
- 企業圖形數據的TB和PB等級分析
- 利用GPU加速訓練複雜神經網路
- 存儲、搜索和分析地理座標
- 對非結構化數據進行索引、搜索和分析
- 在流行的程式設計語言中使用自定義的邏輯進行擴展分析
訓練神經網路
使用圖像和文本等非結構化數據,並讓 Greenplum訓練模型去辨識物體
MPP 比例性能
使用Greenplum的計算網格訓練和比較數千種型號
Tensor Flow, Keras, GPUs
使用AI的常用套件,而模型的複雜性則由Greenplum 使用者自行管理
將大數據資料庫轉換為 Geo 資料庫,以便根據位置存儲、搜索和分析數據
將二進位數據或常人可讀的格式數據提取成機器能夠理解或操作的數據。
Index the text data,以便我們可以快速搜索特定的文本和文檔。
搜尋在文字中的關鍵字或規律。
分析文本的真正含義。
Server 端功能
逐行處理數據
大規模並行模型執行
使用程序語言轉換每一行
在需要時通過容器化執行提供安全性
導入OSS庫以獲取高級功能(例如NLTK)
導入企業庫以訪問您的專有邏輯代碼
用戶定義的匯總分組
調用OSS機器學習算法
Greenplum指揮中心
Greenplum Database Administrators 畫面瀏覽
Alerts and Table瀏覽
台北總公司 886 2 7701-5899
105409 台北市松山區南京東路五段161號3樓
偉康科技股份有限公司 版權所有 © 2024 WebComm Technology Co., Ltd. All Rights Reserved.
隱私權政策