| 企服解答
hive是Facebook開發(fā)的。
hive是哪個公司開發(fā)的
hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,用來進行數(shù)據(jù)提取、轉化、加載,這是一種可以存儲、查詢和分析存儲在Hadoop中的大規(guī)模數(shù)據(jù)的機制。
hive數(shù)據(jù)倉庫工具能將結構化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供SQL查詢功能,能將SQL語句轉變成MapReduce任務來執(zhí)行。
| 擴展閱讀
Hive的優(yōu)點是學習成本低,可以通過類似SQL語句實現(xiàn)快速MapReduce統(tǒng)計,使MapReduce變得更加簡單,而不必開發(fā)專門的MapReduce應用程序。hive是十分適合數(shù)據(jù)倉庫的統(tǒng)計分析和Windows注冊表文件。
hive 的設計特點:
1、支持創(chuàng)建索引,優(yōu)化數(shù)據(jù)查詢。
2、不同的存儲類型,例如,純文本文件、HBase 中的文件。
3、將元數(shù)據(jù)保存在關系數(shù)據(jù)庫中,大大減少了在查詢過程中執(zhí)行語義檢查的時間。
4、可以直接使用存儲在Hadoop 文件系統(tǒng)中的數(shù)據(jù)。
5、內(nèi)置大量用戶函數(shù)UDF 來操作時間、字符串和其他的數(shù)據(jù)挖掘工具,支持用戶擴展UDF 函數(shù)來完成內(nèi)置函數(shù)無法實現(xiàn)的操作。
6、類SQL 的查詢方式,將SQL 查詢轉換為MapReduce 的job 在Hadoop集群上執(zhí)行。
[免責聲明]
文章標題: hive是哪個公司開發(fā)的
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學習與參考,不代表本網(wǎng)站贊同其觀點和對其真實性負責。如涉及作品內(nèi)容、版權和其它問題,請及時溝通。發(fā)送郵件至36dianping@36kr.com,我們會在3個工作日內(nèi)處理。