Greenplum快速部署安裝教學

圖/文:Jeffery Su

Greenplum簡介

Greenplum 是一個大規模平行處理資料倉儲,能為企業提供資料儲存與資料分析等功能。

Greenplum介紹

Greenplum 定位為數據倉儲,有別於數據庫儲存資料,數據倉儲是面向主題設計的,儲存的是一般歷史資料,為了分析資料而設計。與單純 OLTP ( Online Transactional Processing,線上交易處理 ) 、 OLAP(On-Line Analytical Processing,線上分析處理)形成對比,Greenplum 是 HTAP混合 OLTP 與 OLAP 的架構,可以進行較複雜的資料查詢,適合 BI 系統以及報告工具。

Greenplum 資料倉儲也簡稱 GPDB,是一個開源的 MPP 數據庫,底層為可彈性擴展的 PostgreSQL 資料庫實體,是能夠進行大規模並行數據查詢及分析的資料倉儲系統。除了能夠提供 Petabyte 級的資料高效儲存、處理與分析,也支援 ANSI SQL  2008 標準和 SQL OLAP 2003 擴充套件,並具有ACID﹐Atomicity(原子性)、Consistency(一致性)、Isolation(隔離性)、Durability(持久性),保證數據資料的強一致性。

Greenplum快速部署方式與驗證測試

部署方式:docker

版本:Greenplum 6.19.2 (版本會依據 image 的更新而有所不同)

前置條件:docker 工具已安裝完成,並確認可使用

本章節會說明如何快速部署 Greenplum (步驟1)、如何驗證安裝是否成功 (步驟2至5)、psql 入門語法 (步驟6至8) 以及連線資訊 (步驟9),並在下章節中說明 Greenplum 連線方式。

1.使用 docker 快速部署 Greenplum

如下方指令:

docker run -itd -p 5432:5432 --name greenplum_test projectairws/greenplum:latest

下圖為執行結果:

2.確認 greenplum_test container 是否正常執行中。

如下方指令:

docker ps

下圖為執行結果:

3.確認無誤後,透過 docker 指令,進入 greenplum_test container 當中。

如下方指令:

docker exec -it greenplum_test bash

下圖為執行結果:

4.進入 container 後,切換使用者至 gpadmin,即可使用 Greenplum 的基本內建功能,如查看叢集狀態與使用 psql。

如下方指令:

su - gpadmin

下圖為執行結果:

5.可透過下列指令查看 Greenplum 叢集的資訊與狀況

如下方指令:

gpstate -s

下圖為執行結果:

可確認目前叢集為一個 Master node、兩個 Segment node,無 Master standby node,以及當前 Greenplum 6.19.2、PostgreSQL 9.4.26 版本。(版本會依據 image 的更新而有所不同)

6.確認完叢集當前狀態後,可透過 psql 與資料庫進行互動。

如下方指令:

psql

下圖為執行結果:

成功進入 psql 介面。

7.進入 psql 介面後,可以輸入以下語法,查看版本號。

如下方指令:

select version();

8.psql語法說明

如下方指令:

a.  help 可查看 psql 的提示指令

b.  \du 可查看目前的角色,以及其使用者權限

c.  \h 可查看在 psql 中可使用的 sql 語法

help
\du
\h

如下圖所示:

d.  \x 可改變 psql 查詢結果的呈現方式,開啟狀態為每列僅顯示單個 column 及其內容

e.  \dt+ 查看所有的Schema、Table name 等關聯

\x
\dt+

下圖為執行結果:此時的 \x 為關閉狀態。

f.  可使用先前 \dt+ 結果的內容進行以下語法測試

select * from spatial_ref_sys;

下圖為執行結果:此時的 \x 為開啟狀態,閱讀 table 內資料時較方便。

g.  \q 則是離開 psql 介面

h.  exit 為離開 gpadmin 使用者

\q
exit

下圖為執行結果:

9.連線資訊

  • Host: 主機 IP
  • Port:5432
  • 資料庫名稱(預設):gpadmin
  • Username:gpadmin
  • Password:gpadmin

Greenplum連線方式

本章節會介紹 Greenplum 可用的連線方式,本文提供以下兩種作法:

1.PSQL (PostgreSQL interactive terminal)

依據所建立的 Greenplum 環境調整主機 IP、Port、Username、Password及資料庫名稱。

指令如下:

# -h :  IP
# -p : Port
# -d : 資料庫名稱
# -U : Username
# Password 則為輸入下行指令後需要輸入
psql -h 0.0.0.0 -p 5432 -d gpadmin -U gpadmin

下圖為執行結果:

2.pgAdmin4

pgAdmin4 為 PostgreSQL 管理工具,可提供用戶透過瀏覽器 WebUI 連線 PostgreSQL、Greenplum 資料庫,並進行資料庫操作。

以下將介紹 pgAdmin4 安裝方式:

指令如下:

docker run -p 5050:80 --name pgadmin4 -e "PGADMIN_DEFAULT_EMAIL=user@domain.com" -e "PGADMIN_DEFAULT_PASSWORD=123" -d dpage/pgadmin4:6.8

下圖為執行結果:

a. 透過瀏覽器開啟介面

macOS : 0.0.0.0:5050
windows : http://localhost:5050
Email Address / Username:user@domain.com
Password:123

下圖為示意圖:

下圖為登入後畫面:

b. 進入頁面後,點選 Add New Server,會跳出下圖之視窗畫面:

  • 填入 Name 內容,內容可自行設定
  • 點選至 connection
  • Host name/address:Greenplum 主機的 IP address
  • Port:5432
  • Maintenance database:gpadmin
  • Username:gpadmin
  • Password:gpadmin
  • 以上皆填寫完畢後,點選 Save 即可

下圖為示意圖:

c. 成功登入後,可以從左側 Servers 中找到剛剛連線的資料庫

  • 點選Databases 再選擇 gpadmin

下圖為示意圖:

d. 執行 sql 語法

  • 點選下圖紅框處,即會切換至 Query Editor 畫面
  • 輸入 sql 語法與資料庫進行互動
  • 點選下圖綠框處,即可執行 sql 語法

    測試語法可使用下列指令
select * from spatial_ref_sys;

相關文章

Greenplum是什麼?Greenplum資料倉儲數據分析平台介紹與架構的分享

Greenplum主要特色概要

訂閱偉康科技洞察室部落格,掌握最新科技趨勢!

專人協助

由偉康業務人員為您詳細說明偉康的解決方案,以及相關產業經驗。


聯絡我們

立即訂閱電子報

掌握最新科技趨勢!