【編者按】一直以來,大數(shù)據(jù)的使用遠(yuǎn)遠(yuǎn)不及大數(shù)據(jù)收集能力,就起原因主要是目前企業(yè)的數(shù)據(jù)主要分散在不同的系統(tǒng)或組織,大數(shù)據(jù)戰(zhàn)略的殺手锏就是能夠更深度的,更豐富的挖掘所有數(shù)據(jù)系統(tǒng)中的有價值的信息,從而更準(zhǔn)確的預(yù)測客戶行為,發(fā)現(xiàn)商業(yè)價值,但是目前很難將這些數(shù)據(jù)移到一個單獨(dú)的數(shù)據(jù)存儲中,另外,安全和監(jiān)管問題也得不到保障,Oracle Big Data SQL的推出解決了現(xiàn)在面臨的難題。
以下為譯文:
發(fā)現(xiàn)企業(yè)或組織對數(shù)據(jù)管理架構(gòu)的需求,Oracle推出Big Data SQL軟件來整合包括Hadoop、NoSQL和Oracle數(shù)據(jù)庫等在內(nèi)的各種各樣的數(shù)據(jù)源。
一套完整的解決方案是使Oracle的大數(shù)據(jù)設(shè)備和Big Data SQL結(jié)合起來,Cloudera的 Hadoop 分布式和Oracle自己的 NoSQL 數(shù)據(jù)庫。開始時Oracle Big Data SQL只支持Apache Hive和Hadoop File System,其他供應(yīng)商需要移植SQL關(guān)系數(shù)據(jù)庫到Hadoop上運(yùn)行。
Oracle提供大數(shù)據(jù)設(shè)備和Big Data SQL的一套完整解決方案
Oracle Big Data SQL產(chǎn)品意味著管理員在處理非關(guān)系型數(shù)據(jù)庫或Hadoop中的信息時,不用再學(xué)習(xí)其他查詢語言,Oracle的大數(shù)據(jù)分析主管Neil Mendelson說。
我們可以使用我們已經(jīng)習(xí)慣使用的Oracle SQL語言――完整的SQL語言,我們現(xiàn)在可以直接訪問這三個中的任何一個數(shù)據(jù)源或其中任意組合,他解釋道。
類似的工具都可以在開源社區(qū)如Stinger中獲得,這使得你可以使用SQL命令來查詢Hadoop中數(shù)據(jù),或使用旨在NoSQL系統(tǒng)上實(shí)現(xiàn)SQL命令的CQL語言(Cassandra查詢語言)。
創(chuàng)建這個大數(shù)據(jù)管理系統(tǒng)的目標(biāo)是希望SQL查詢能夠運(yùn)行在不同的數(shù)據(jù)源上,并且使企業(yè)或組織能夠利用現(xiàn)有的技術(shù)維護(hù)企業(yè)級數(shù)據(jù)安全,以及管理敏感的信息。Oracle表示這項(xiàng)技術(shù)其獨(dú)特的架構(gòu)和Smart Scan繼承于Oracle Exadata,同時能夠允許Oracle Big Data SQL查詢所有形式的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并且最小化數(shù)據(jù)移動。
這也促進(jìn)了Oracle數(shù)據(jù)庫的安全功能,包括組織現(xiàn)有的安全策略,擴(kuò)展到Hadoop和NoSQL數(shù)據(jù)。
Oracle的Dan McClary說,產(chǎn)品的開發(fā)已經(jīng)有一段時間了,而且它超越了現(xiàn)有的技術(shù)。他同時表示Big Data SQL與HDFS DataNodes和YARN NodeManagers能夠co-resident,另外,從新的外部表的查詢被發(fā)送到這些服務(wù)能夠保證直接路徑讀取和數(shù)據(jù)本地化。
Cloudera創(chuàng)始人、董事長兼首席戰(zhàn)略官M(fèi)ike Olson說:“在oracle的大數(shù)據(jù)設(shè)備上運(yùn)行Cloudera的軟件集比DIY集群部署更具成本效益并且速度更快。在Hadoop查詢數(shù)據(jù)時,我們已經(jīng)看到客戶對SQL強(qiáng)烈的需求。”
參考譯文:
Oracle Enables SQL Queries Across Hadoop, NoSQL and Oracle Database
Oracle: You wanted SQL on Hadoop? How about SQL on Hadoop and SQL ON NOSQL? (責(zé)編/魏偉)