極速執(zhí)行器: 高效的執(zhí)行器,比傳統(tǒng)數(shù)倉/MPP快5-10倍,比Hadoop SQL引擎要快5-30倍。
私有云和公有云部署:反對亞馬遜和阿里云等私有云平臺,同時能夠反對支流PaaS云平臺(比方Kubernetes等)和Docker部署。
對規(guī)范的欠缺反對:ANSI SQL規(guī)范,OLAP擴大,規(guī)范JDBC/ODBC,比Hadoop SQL引擎都要欠缺。
反對ACID事務(wù)個性:這是很多現(xiàn)有基于Hadoop的SQL引擎做不到的,對保證數(shù)據(jù)一致性很重要。能夠無效縮小開發(fā)及運維人員的累贅。
動靜數(shù)據(jù)流引擎:基于UDP的高速互聯(lián)網(wǎng)絡(luò)。
彈性調(diào)度執(zhí)行:能夠依據(jù)查問大小來決定執(zhí)行查問應(yīng)用的節(jié)點及Segment個數(shù)。
反對多種分區(qū)辦法及多級分區(qū):反對List分區(qū)和Range分區(qū)。分區(qū)表對性能有很大晉升作用,如果用戶只想拜訪最近一個月的熱數(shù)據(jù),查問只須要掃描最近一個月數(shù)據(jù)所在分區(qū)。
反對多種壓縮辦法:snappy,gzip,zlib, zstd, lz4, RLE等。
多種存儲過程語言反對:python, c/c++, perl等。
動靜擴容:動靜按需擴容,依照存儲大小或者計算需要,秒級增加節(jié)點。
多級資源和負載治理:和內(nèi)部資源管理器YARN集成;能夠治理CPU,Memory資源等;反對多級資源隊列;具備不便的DDL治理接口。
反對拜訪任何HDFS及其他零碎的數(shù)據(jù):各種HDFS格局(文本,ORC等等)以及其余內(nèi)部零碎(Hive等),并且用戶本人能夠開發(fā)插件來拜訪新的數(shù)據(jù)源。
原生的機器學習數(shù)據(jù)挖掘庫MADLib反對:易于應(yīng)用及高性能。
與Hadoop零碎無縫集成:存儲、資源、裝置部署、數(shù)據(jù)格式和拜訪等。
欠缺的平安及權(quán)限治理:kerberos;數(shù)據(jù)庫,表等各個級別的受權(quán)治理。
反對多種第三方工具:比方Tableau,SAS,較新的Apache Zeppelin等。