極速執行器: 高效的執行器,比傳統數倉/MPP快5-10倍,比Hadoop SQL引擎要快5-30倍。
私有云和公有云部署:反對亞馬遜和阿里云等私有云平臺,同時能夠反對支流PaaS云平臺(比方Kubernetes等)和Docker部署。
對規范的欠缺反對:ANSI SQL規范,OLAP擴大,規范JDBC/ODBC,比Hadoop SQL引擎都要欠缺。
反對ACID事務個性:這是很多現有基于Hadoop的SQL引擎做不到的,對保證數據一致性很重要。能夠無效縮小開發及運維人員的累贅。
動靜數據流引擎:基于UDP的高速互聯網絡。
彈性調度執行:能夠依據查問大小來決定執行查問應用的節點及Segment個數。
反對多種分區辦法及多級分區:反對List分區和Range分區。分區表對性能有很大晉升作用,如果用戶只想拜訪最近一個月的熱數據,查問只須要掃描最近一個月數據所在分區。
反對多種壓縮辦法:snappy,gzip,zlib, zstd, lz4, RLE等。
多種存儲過程語言反對:python, c/c++, perl等。
動靜擴容:動靜按需擴容,依照存儲大小或者計算需要,秒級增加節點。
多級資源和負載治理:和內部資源管理器YARN集成;能夠治理CPU,Memory資源等;反對多級資源隊列;具備不便的DDL治理接口。
反對拜訪任何HDFS及其他零碎的數據:各種HDFS格局(文本,ORC等等)以及其余內部零碎(Hive等),并且用戶本人能夠開發插件來拜訪新的數據源。
原生的機器學習數據挖掘庫MADLib反對:易于應用及高性能。
與Hadoop零碎無縫集成:存儲、資源、裝置部署、數據格式和拜訪等。
欠缺的平安及權限治理:kerberos;數據庫,表等各個級別的受權治理。
反對多種第三方工具:比方Tableau,SAS,較新的Apache Zeppelin等。