Greenplum是全(quan)球優秀的大數據分析(xi)引擎,專(zhuan)為分析(xi)、機器學習(xi)和AI而打(da)造。
Greenplum創建和部署復雜模型(xing),大量數百(bai)節點(dian)集群為全球(qiu)優(you)秀(xiu)企業(ye)生產系統提供(gong)服務,被(bei)廣泛(fan)應用于(yu)網絡安全,預測性維護,風險管理,欺詐檢測等領(ling)域。
Greenplum大數據平臺基于MPP(大規模并行處理)架構,具有強大(da)的內核技術,包括數(shu)據水平分布、并行查詢執行、優化器(qi)、線(xian)性擴展能力、多態存儲、資源管理、高可用、高速數(shu)據加載(zai)等。
Greenplum支(zhi)(zhi)持多(duo)種數(shu)(shu)(shu)(shu)據(ju)源和(he)數(shu)(shu)(shu)(shu)據(ju)格(ge)式(shi),支(zhi)(zhi)持各種數(shu)(shu)(shu)(shu)據(ju)源,包(bao)括(kuo)Hadoop、HIVE、HBase、S3、Gemfire、各種數(shu)(shu)(shu)(shu)據(ju)庫和(he)文件等,不需要(yao)移動數(shu)(shu)(shu)(shu)據(ju),避免(mian)了數(shu)(shu)(shu)(shu)據(ju)加載的(de)(de)復雜性(xing),和(he)其(qi)帶來的(de)(de)數(shu)(shu)(shu)(shu)據(ju)不一(yi)致的(de)(de)問(wen)題。不管是結構化(hua)、半(ban)結構化(hua)(XML、JSON、KV)還是非結構化(hua),譬如(ru)文本(ben)數(shu)(shu)(shu)(shu)據(ju)、GIS數(shu)(shu)(shu)(shu)據(ju)、圖數(shu)(shu)(shu)(shu)據(ju)等。
Greenplum的(de)(de)存儲(chu)支持堆表(biao),以及面(mian)向行存或列存的(de)(de)追(zhui)加表(biao)。用戶可以創建基于任意存儲(chu)類(lei)型的(de)(de)分區表(biao),同時(shi)可以靈活配置表(biao)和分區的(de)(de)壓縮類(lei)型、壓縮級別和存儲(chu)塊(kuai)大小等(deng)參(can)數。