【編者按】僅僅依賴大型合作知識庫Freebase的知識圖譜,限制了Google的發(fā)展速度,為了解決這一困境,Google創(chuàng)建了新的知識庫 Knowledge Vault。該知識庫在擴充知識上是快速和自動的,將有望超過知識圖譜,同時它能夠建立歷史和社會的模型,帶來量子級的飛躍。但它帶來的隱私問題同樣令人擔(dān)憂。
以下為原文
隨著知識圖譜的出現(xiàn),Google 搜索不再是簡單的網(wǎng)頁鏈接,而是直接回答問題的知識引擎。不過,現(xiàn)有的知識圖譜仍然依賴大型合作知識庫 Freebase,信息的擴展是眾包形式。這限制了它的發(fā)展速度。現(xiàn)在,Google 決定將這個過程自動化。
據(jù) newscientist 網(wǎng)站報道,Google 創(chuàng)建了名為 Knowledge Vault 的知識庫。它通過算法自動搜集網(wǎng)上信息,通過機器學(xué)習(xí)把數(shù)據(jù)變成可用知識。目前,Knowledge Vault 已經(jīng)收集了 16 億件事實,其中,2.71 億件是“可信的事實”。這里的可信是說,Google 把新事實與已掌握知識對照后,認(rèn)為其準(zhǔn)確的可能性是 90%。
“他們完成的是一件非常驚人的事情”,法國 Telecom ParisTech 的數(shù)據(jù)科學(xué)家 Fabian Suchanek 說。
Knowledge Vault 仍然沒有知識圖譜龐大,但是,它在擴充知識上是快速和自動的,超過知識圖譜只是時間問題。Garntner 的技術(shù)分析師 Tom Austin 說,大型科技公司都在構(gòu)建類似的知識庫。當(dāng)機器系統(tǒng)掌握了全人類的知識,它的智力將遠遠超過現(xiàn)有的智能助手。“在這個十年結(jié)束的時候,我們將會看到智能的優(yōu)先收件箱。它能夠給我們找到最重要的 10 封郵件,然后在無需我們打擾的情況下,處理完剩下的郵件,” 他說。
除了改善人機交互之外,知識庫也會推動現(xiàn)實增強技術(shù)的發(fā)展。未來,Knowledge Vault 可以驅(qū)動一個現(xiàn)實增強系統(tǒng),讓我們從頭戴顯示屏上了解現(xiàn)實世界中的地標(biāo)、建筑、商業(yè)網(wǎng)點等信息。
知識庫還能夠改變我們研究人類社會的方法。“這是最有遠見的事情”,F(xiàn)abian Suchanek 說,“Knowledge Vault 能夠建立歷史和社會的模型。”
Suchaneck 已經(jīng)做了一次以數(shù)據(jù)驅(qū)動的歷史研究。他把 YAGO 數(shù)據(jù)庫與法國報紙 Le Monde 的數(shù)據(jù)結(jié)合,展示了性別差距在政治界的歷史變化。
由于 Google 的知識庫是詳細(xì)和龐大的,我們甚至可以對未來做出一些精準(zhǔn)的預(yù)測。“這是全新一代的技術(shù),可以帶來巨大的改變,改善人們生活和娛樂,甚至改變他們戰(zhàn)爭的方式,” Austin 說,“這是一個量子級的飛躍。”
Knowledge Vault 帶來的也有隱私問題。它貪婪地收集任何可以找到的信息。“在幕后,Google 不僅僅有公開數(shù)據(jù),” Suchanek 說,“它也從 Gmail、Google+ 和 Youtube 上收集信息。你我存儲在 Knowledge Vault 的方式,與 Elvis Presley(貓王)相同。”
原文鏈接: Knowledge Vault:Google 將建全球最大知識庫(責(zé)編/仲浩)