如何透過 Elasticsearch 結合 Generative AI 政府與公部門數據治理應用升級

如何透過 Elasticsearch 結合 Generative AI 政府與公部門數據治理應用升級-1200

過去幾個月來,我們看到大家對生成式人工智慧(GAI)產生了極大的興趣。大家紛紛嘗試使用如 ChatGPT 等 GAI 應用程式,而企業也在思考這對客戶體驗、會計、行銷等領域的影響,有鑑於技術發展迅速,有時很難分辨哪些是推測性的,哪些是現今真正變成實作且有價值的。

我們現在正處於一個關鍵時刻:政府領導人應認真考慮如何準備內部資料,以從 GAI 中獲取最大價值,並探討如何利用 GAI 來促進更好的公民與員工體驗。

GAI 本身的效能取決於其訓練所使用的資料

以目前的狀態來看,GAI 能夠產出令人驚豔的內容、對話、圖像等。但這些結果的關聯性,完全取決於該工具所使用的訓練資料。

當提供大型語言模型(LLM)知識表象的訓練資料集,是基於網際網路上公開可用的資料時,它們生成的答案範圍就會受到限制。

基於公開資料的 GAI 經常容易出現「幻覺」即將錯誤的資訊以看似準確的方式呈現出來。

另一方面,當 GAI 與機構的內部資料結合使用時,它可以顯著加速任務成果、改善公民服務,並能更可以讓分析師和網路安全專業人員等政府知識工作者在正確的時間連結到正確的資料。目的是因為這些機構,做到了資料增加了必要的背景脈絡。

GAI 與私有、機構資料的結合具有倍增效應。最簡單直接的解決方案是將私有資料融入模型本身;然而,訓練或微調 AI 模型的複雜性與成本再乘上政府中涉及的領域和互動節點數量會變得難以承受。

取而代之的是,您可以先將向 LLM 提出的相同問題,交由 Elastic 具備 AI 支援的搜尋功能處理,從中找出基於您內部資料且最相關的事實解答。

您的資料為 GAI 帶來的這些特定領域脈絡,能讓輸出結果對您的任務更加準確、相關且具備可操作性。

「自備資料(bring your own data)」的一個先決條件是,您的資料必須儲存在一個統一的資料中台,讓所有的資料都能在同一個地方被存取和搜尋。

隱私與安全問題呢?

特別是對公部門而言,您絕不會希望將高度機敏的資料與公開存取的 GAI 混合或放入任何您無法掌握資料控制權的系統中。

任何傳送給公開 GAI 產品(如 ChatGPT)的搜尋查詢都會被模型吸收,這代表您的內部資料將不再是內部的。

即使您的組織尚未正式將 GAI 納入技術堆疊,您的員工也很可能已經在使用了。

為了確保內部資料掌握在正確的人手中,您應策略性地將 GAI 與專有資料整合,並採用 IT 團隊可控制且具備可見度的方式。

否則,您的員工可能會無意間將機敏資料輸入到像 ChatGPT 這樣的公開 GAI 服務中,導致您無法確保其安全性。

理想情況下,您應該將專有資料整合到一個專為處理機敏資訊而設計的平台中,在該平台上您可以保留對自有資料的完全控制權,並啟用基於角色的存取控制(RBAC)。

透過 GAI 加速任務影響力

資料是當今公部門組織擁有最具有價值的資產之一,當您的資料被統一並儲存在單一平台中在此平台可以充分利用 GAI 和搜尋技術時其在現實世界中的影響將非常深遠,並帶來以下好處:

1.提供個人化的公共服務存取

想像一位民眾正準備申請公共住宅服務,申請流程涉及多個步驟和表單,且會根據需求和地點而有所不同。

如果只是在網頁上列出一般資訊會顯得非常複雜,且可能無法解決民眾的特殊情況,另一方面,當機構將自有資料導入 GAI 時,民眾就能找到針對其個人情況量身打造的資訊與指示。

這些高度相關的資訊有潛力減少複雜性,而這些複雜性往往是阻礙人們獲取基本服務的首要原因。

2.簡化民眾體驗

另一個例子:您被傳喚擔任陪審員,需要知道接下來該做什麼事情
像是以下
1.您需要去哪裡?
2.需要多長時間?
3.您被選中為陪審員了嗎?
4.法官允許在法庭上使用手機嗎?
利用您的資料,GAI 可以簡化並個人化這些複雜的資訊,從而改善公民體驗,並建立對政府服務和領導者的信任。

3.準確的調查與情報

對於執法部門和情報界而言,能夠即時、普及地存取正確資料至關重要,當多個組織合作進行專案,且擁有不同格式的異質資料庫時更是如此,若能透過單一 GAI 查詢跨資料類型和來源尋找解答,將有潛力提高結果的速度和準確性,減少耗時的手動作業,並確保所有需要的人都能基於相同且準確的資料集進行工作。

4.提升員工生產力

當您將 GAI 與特定領域脈絡整合時,能協助內部團隊快速找到有助於他們完成工作的所需資訊,跨多個資料集和格式的快速查詢,能夠即時提供極度相關連的資訊省去辛苦地梳理文件或孤立資料庫的需求。
在多數情況下,團隊正在尋找的資訊並不會存在於公開的網際網路或 AI 模型訓練集中,因此提供一個由 GAI 驅動的工具來快速尋找專有資訊是非常重要的,這能避免員工轉向可能危及資料安全的公開工具,當員工將較少的時間花費在徒勞的搜尋和手動資料關聯上時,便能提升工作滿意度與參與度。

GAI + Elasticsearch + 您的內部資料

當您在考慮如何將機構資料與 GAI 整合時,Elasticsearch 平台可以成為一個強大的工具。它允許您擷取所有類型的資料、以符合成本效益的方式儲存、無論資料身在何處都能進行存取,並將其與 GAI Transformer 模型整合。

Elastic 十多年來一直致力於普及搜尋功能,且在此期間很大一部分投入於 AI 和機器學習 (ML)。因此,我們最近推出了 Elasticsearch Relevance Engine (ESRE),在協助客戶透過 Elasticsearch 平台上的 AI 和 ML,為他們的問題找到相關的解答。

什麼是 Elasticsearch Relevance Engine (ESRE)?

ESRE 結合了 AI 的優勢與 Elastic 的文字搜尋功能,提供了與大型語言模型 (LLM) 整合的能力。它可以透過 Elastic 社群已信賴的簡單、統一的 API 進行存取,因此開發人員可以立即開始使用它來提升搜尋的相關性。

換句話說,您現在可以將自有的 GAI 模型或第三方 GAI 模型,直接連到儲存在Elasticsearch平台中的資料。這讓您可以利用 GAI 的強大功能與特定領域資料,產出準確、相關、可操作且安全的解答。

為什麼選擇 Elasticsearch 來處理 GAI 與私有資料?

換句話說,您現在可以將自有的 GAI 模型或第三方 GAI 模型,直接連到儲存在Elasticsearch平台中的資料。這讓您可以利用 GAI 的強大功能與特定領域資料,產出準確、相關、可操作且安全的解答。

1.統一的資料儲存與普及的存取

您可以將所有資料儲存在 Elasticsearch 平台中,以存取、可搜尋性與洞察力。一旦您的資料進入平台,您就可以將其用於其他使用案例,例如:受到危險的告警與基礎架構監控。

2.具備尋找關鍵任務解答的能力,這些解答是:

  • 準確性: GAI 和您自有資料中獲得的解答,與任務相關的事實,而非幻覺。

  • 相關性:透過 Elasticsearch 中使用的專有資料,可以避免在內部資料上重複重新訓練 LLM,節省時間與訓練成本,並確保資訊始終保持最新。

  • 具體可行性:Elasticsearch 平台普及了對資料與洞察的存取,讓企業團隊能從任何地方進行協作並即時做出決策。

  • 安全性:並非每位員工都能存取所有文件,且為了資料主權的目的,某些資料必須存放在特定位置。Elasticsearch 允許您將資料存取權限限制在組織內的特定角色,同時仍保留跨整個資料儲存庫進行搜尋的能力。

3.具成本效益高的實現方式

憑藉數十年來在資訊檢索方面的最佳化,Elasticsearch 在提供知識給 GAI 互動時,其 CPU 效率比從經過訓練或微調的大型語言模型中提取相同知識要高出幾個數量級。據估計,語義檢索的效率比單獨使用 ChatGPT 3.5 高出五倍,或者比 GPT-4 的 CPU 成本高出 250 倍。

解決方案產品:

Elasticsearch

Logstash

Kibana

訂閱偉康科技洞察室部落格,掌握最新科技趨勢!

專人協助

由偉康業務人員為您詳細說明偉康的解決方案,以及相關產業經驗。

立即訂閱電子報

掌握最新科技趨勢!