NLP(Natural Language Processing)是一門融語言學(xué)、計算機科學(xué)、數(shù)學(xué)于一體的科學(xué),是研究人與計算機之間如何用自然語言進(jìn)行有效人機對話的理論和方法。NLP的時髦應(yīng)用包括:內(nèi)容分類,情感分析,和自動匯總。例如,媒介機構(gòu)利用NLP平臺來把媒體內(nèi)容進(jìn)行分類,標(biāo)識和匯總;社交類應(yīng)用公司利用NLP工具來判別社交活動中的積極或消極因素。
優(yōu)秀的NLP服務(wù)商一般會提供三個方面:1)提供的NLP API能夠涵蓋日常的NLP功能;2)有公共文檔和費用信息提供;3)提供自主登記或訂閱服務(wù)?;谝陨先齻€條件,我們甄選了五個表現(xiàn)較突出的NLP服務(wù)商,一起來看下:
一、AlchemyAPI
成立于2005年的AlchemyAPI是NLP-aaS元老級的服務(wù)商。其簡介中說到目前大概有超過4萬名開發(fā)用戶、每月共計產(chǎn)生多于35億次的API調(diào)用。
功能綜述
AlchemyAPI目前共提供了12個文本分析功能:事物抽取,情感分析,關(guān)鍵字抓取,概念標(biāo)識,關(guān)系提取,分類識別,作者提取,語言識別,文本提取,微格式分析,訂閱內(nèi)容識別,數(shù)據(jù)連接等。
AlchemyAPI的REST API支援多種數(shù)據(jù)格式,包括:XML,JSON,RDF以及microformats。提供的SDKs也支援多種主流語言,例如:Java, Perl, Ruby, Python, PHP, C/C++, C#, Node.js 以及 Android。其開發(fā)入口還附有教程和一些常用NLP項目示例資料。
費用
AlchemyAPI有一個免費的基礎(chǔ)服務(wù)包,每天的事務(wù)處理上限為1000次。而每月9萬次,30萬次,3百萬次處理各自對應(yīng)的價格分別為250美元,750美元,1,750美元。對于有更高需求的企業(yè),他們可以得到“私人定制”的貼心服務(wù)。
特色功能
在年初,AlchemyAPI發(fā)布了新的圖像處理API―AlchemyVision,主要功能是實現(xiàn)圖像的自動抽取和為圖像自動附上標(biāo)簽。例如,能自動識別出相片中的商品名稱而無需額外的文字提示信息。又或者是自動為成百上千張圖片(本地或網(wǎng)絡(luò))附上合適的標(biāo)簽,例如:運動,鮮花,人等,從而減少了大量的人工操作。這對于圖像盛行的今天來說,無疑是相關(guān)企業(yè)的一大福音。
二、Aylien
Aylien是更為年輕的NLP平臺服務(wù)商,其主打應(yīng)用是幫助媒介機構(gòu)和客戶在泱泱網(wǎng)絡(luò)信息流中獲取智能感知信息。
功能綜述
Aylien文本分析API包含三個常用功能:分類,情感分析和狀態(tài)提取。其API是RESTful的,由Mashape提供服務(wù),里面還含有一個匯總端點,用于長文本匯總;另還有一個標(biāo)簽建議端點,能為某內(nèi)容給予合適的標(biāo)簽建議信息。
費用
Aylien提供了1000次以內(nèi)的免費請求服務(wù),之后每多一次收1美分。對于6000萬次,8萬次,18萬次的請求,分別作價199美元,649美元,1399美元。各個級別的付費業(yè)務(wù)都提供郵件技術(shù)支援。對于需要電話支援和不限次數(shù)的企業(yè)級服務(wù),也是可以選擇的。
特色功能
目前Aylien正準(zhǔn)備推出一新聞API來讓用戶從50個流行新聞源中獲取更多資訊。分析重點包括:關(guān)鍵字分析,話題分析,分類討論以及社交熱點分析。該API結(jié)合在用的標(biāo)簽建議功能,對有社交應(yīng)用分析需求的企業(yè)來說無疑是一套利器。
三、Fluxifi
今年剛成立的Fluxifi,定位于幫助企業(yè)分析和最大程度地利用社交媒體中的信息。其API能夠讓用戶進(jìn)行NLP處理。
功能綜述
Fluxifi的API功能包括:標(biāo)記化,情感分析,語言探測以及詞性標(biāo)簽。該RESTful API支持XML和JSON格式。
費用
Fluxifi提供了兩個方案:
250英鎊/月的專業(yè)版,每日支持最高4萬次API調(diào)用;
250英鎊/月的企業(yè)版,每日支持最高15萬次API調(diào)用。
如果還需更高級別的服務(wù),則需特別定制。企業(yè)版和定制版都提供已簽署服務(wù)級別協(xié)議的電話支援服務(wù)。
特色功能
除了常見的NLP功能,公司還把重心放在社交活動監(jiān)控和分析平臺,對接Twitter,YouTube及Instagram等熱門社交應(yīng)用。是對社交數(shù)據(jù)分析敏感企業(yè)的一主打特色。
四、Textalytics
Textalytics提供的是MaaS服務(wù)(meaning as a service,意思即服務(wù)),對外宣傳是最友好的產(chǎn)品。
功能綜述
Textalytics的功能包括:話題提取,文本分類,情感分析和語言識別。
此外,還有兩款高階APIs:
Textalytics的APIs符合RESTful準(zhǔn)則,支持的格式包括JSON和XML。提供SDKs套件可用于PHP、Java、Python以及VB。
費用
Textalytics提供了一個類似會員制的積分扣除系統(tǒng)來處理相關(guān)費用事項。例如,一次語言識別API調(diào)用需花費1個積分,在話題提取API中每分析兩個詞元需花費2個積分,而在對話識別API中每運行1分鐘則需要花費1萬個積分。
免費服務(wù)提供每月消費積分為50萬個。價值149歐元/月專業(yè)版的每月消費積分是2百萬個,499歐元/月的商業(yè)版是1千萬個。所有版本均支援每秒5個請求發(fā)生。此外,還有更多積分需求的企業(yè)定制版可供選擇。
特色功能
如果用戶不愿意在試用期前就把Textalytics整合到實際環(huán)境中,Textalytics還提供了一個插件供客戶直接在微軟Excel中進(jìn)行數(shù)據(jù)分析。
五、TextRazor
Bloomberg的一位前雇員創(chuàng)立的TextRazor目的是幫助客戶提取和讀懂信息,清楚知道誰,做了什么,為什么以及怎么做。公司創(chuàng)立伊始便擁有自身的NLP及機器學(xué)習(xí)技術(shù),提供基于云和自承載技術(shù)的服務(wù)包。
功能綜述
TextRazorAPI核心NLP功能包括:內(nèi)容識別和增進(jìn),話題標(biāo)簽,關(guān)系提取以及衍推。透過提供來自Freebase的索引信息,TextRazor能夠為數(shù)據(jù)對象添加位置信息和生日信息。
該平臺能探測142種不同的國家語言,能對其中10種使用廣泛的語言進(jìn)行內(nèi)容識別和話題探測,包括英語,西班牙語,德語,法語等。支持JSON數(shù)據(jù)格式,能通過HTTP或HTTPS進(jìn)行訪問,提供可選的GZIP壓縮支援。官方SDKs套件能在Python,PHP和Java上使用。
費用
免費服務(wù)包提供每天500次的調(diào)用和2次同步請求,1,200美元/月的專業(yè)版提供每天12萬次調(diào)用和總共15次的同步請求服務(wù)。對于有過百萬次調(diào)用或上百次同步請求的需求來說,則需進(jìn)行企業(yè)版定制。
特色功能
TextRazor有一個基于Prolog的規(guī)則引擎能夠讓開發(fā)者盡情享用其自定的NLP算法。例如,在話題分類和內(nèi)容提取的應(yīng)用場合添加本體模型定制和話題列表處理。
寫在最后 -- 哪款才是你的菜?
實踐出真知,相信不同級別的需求會帶來不同的選擇。因此,需要進(jìn)行盡可能多的測試才能為自己帶來最心儀產(chǎn)品,得到最滿意的結(jié)果。
英文出自:Programmableweb