CSDN移動頻道推出移動開發系列訪談《近匠》。新一年起,我們將走近更多移動開發者與移動開發服務商,從深植于軟件及硬件領域的“工匠”們的口述中,窺探移動互聯網趨勢與走向。本期CSDN移動對話移動閱讀平臺――多看科技。
自2010年多看閱讀成立以來,已經經歷了3個年頭。它從最初人們口中的“Kindle必刷的系統”,逐漸蛻變為現在跨Kindle、iOS、Android多系統的數字閱讀平臺。目前,多看的圖書已達12000本,但每本從獲得版權到最終上架并非全都一帆風順。做數字化出版不得不面對哪些問題?自從2012年小米并購多看后,多看與小米的技術團隊又有怎樣的協作?多看作為中小團隊的技術經驗有哪些?在多看眼中,實體書數字化在國內正遭遇哪些難題?不妨讓多看科技副總裁兼CTO王毅與我們聊一聊。
多看科技副總裁王毅
CSDN:請您介紹一下個人的經歷,以及多看閱讀團隊。
王毅:我的工作經歷比較簡單。我從北大畢業后,就一直在北大方正,當時王選老師還在任。我在方正主要負責的是排版軟件的相關工作,然后從2000年起轉向了數字出版領域。自從那時起,就在數字出版領域,工作了很多年,主要是做與數字相關的基礎的技術研究工作,在方正最開始從方正電子,到最后方正技術研究院從事數字出版相關的工作。大概在2011年8月,我加入了多看,當時多看成立的時間也比較短,算起來,到現在為止,在多看工作也有兩年多的時間了。
整個多看閱讀團隊大概有160人左右,分為內容、產品研發和運營等幾個團隊。現在多看閱讀的技術團隊大約有30多人,很多技術骨干都是以前與我一同工作至今的,其中也不少曾在方正研究院共事過的同事。
CSDN:多看閱讀的技術團隊都采用哪些技術服務?
王毅:技術主要是自主研發,實際上多看整個平臺,不管是云端,還是客戶端都是自己搭建的,這是一套比較完整的包含數字出版發行、銷售等環節的一個平臺。我們的客戶端也已經覆蓋了從Kindle到iOS、Android,再到Web等幾個主流的平臺。
實際上,多看在2010年創立之初是從開發Kindle的中文系統出發的。因為當時Kindle沒有中文系統,而且Kindle也還未入華,在國內能買到的都是水貨,我們基于它做了一套完整的中文系統。這也使得Kindle可為大多數中國人所使用,方便更多用戶操作和閱讀。當然,Kindle入華則是后來的事情了。
CSDN:從多看閱讀發布第一個版本至今,技術團隊做過哪些改進,遇到并解決了哪些問題?
王毅:我們發布過很多版本,以Kindle版為例,從發布第一個版本開始,我們每周都更新一個新版本,一直堅持至今。同時,其他平臺版本的更新頻率也非常高。在2010年到2011年的起步階段,我們主要是以開發Kindle的中文系統為主。
隨后,在2011年下半年,我們開始嘗試向Android和iOS平臺拓展。當時,我們發布至兩個平臺的產品形式有所不同,在Android上我們開發了一個閱讀器,而在iOS平臺,我們所遵循的是“精品閱讀”的理念,所以最開始從單行本入手。在此期間,我們也在多個平臺發布了客戶端。
從2012年起,我們開始準備發布“多看書城”,這是一個正版電子書的銷售平臺。它在2012年的5月31日率先在iOS版本上正式發布,隨后Kindle、Android和Web版客戶端也逐一接入了這個平臺,逐漸形成現在大家所看到一個全平臺的正版電子書發布和銷售渠道。
還記得,在最開始時我們的電子圖書加工、制作進度很慢,資源也比較匱乏,所以上線時書城中只有100本書,其中免費書籍和付費書籍各占50%。但是現在,書城已經擁有超過12000本正版圖書,而且每一本都是經過我們精心加工制作的。除此之外,與去年發布第一版本時相較,各個平臺的終端數和用戶數也得到了很大的提升。
CSDN:就像每一家實體書店都有自己的特色一樣,作為一個移動閱讀應用,多看的特色是什么?
王毅:我們認為多看最大的特色其實就是極致的閱讀體驗。所有用戶在我們的平臺上都能夠享受到最好的數字版圖書,以及最好的數據閱讀服務,這就是我們最大的特色。我們應該是在國內唯一一個跨越了從Kindle到Web、iOS,再到Android,幾乎所有的移動系統的電子書平臺。我們在每本書上付出了很大成本去進行制作。我們的客戶端具備跨平臺特性,閱讀體驗保持著一致性,比如閱讀進度、閱讀筆記,甚至將來書架里所有的內容,都會云同步。
我們在最近推出了一些社交化服務,比如說書友圈,它能夠有效地拉近讀者和讀者之間的距離,甚至作者與讀者之間也能進行互動。我們平臺上有些書的作者會直接在書友圈中和讀者去互動交流,這在實體書店中是很難做到的,但借助移動互聯網,我們可以輕松拉近他們之間的距離,方便他們相互交流,這是完全不同的體驗。
CSDN:電子圖書與紙質圖書的制作流程是不同的,多看閱讀在這方面是怎么做的?
王毅:我曾在知乎寫過一篇貼子,簡單介紹了多看對每本電子書的制作流程。我們的每一本書都和其他平臺完全不同,多看書城中的書籍很多都是圖文混排的,我們深諳此道。而且我們對排版的字體,以及許多排版細節要求都很高。我們制作每本書之前,首先需要出版社提供數據源,然后我們再根據數據源進行加工制作。從排版設計的角度講,我們的理念是“千書千面”,希望每一本書都有它獨特的風格和閱讀體驗,包括封面設計、版面設計,甚至文案編輯都會有所不同,有些書會加入視頻(如,柴靜的《看見》試讀版),有些會加入交互。我們不完全是追求與實體書的一致,我們希望電子書的體驗完全超越實體書。
在多看中,不同類型的書,會被賦予完全不一樣的閱讀體驗。以計算機類圖書為例,這也是多看最具特色的圖書之一。與其他平臺不同,書中所有代碼不是用圖片形式顯示,而是以真正的代碼塊形式顯示的,我們為此專門擴展了交互代碼塊的定義,所有計算機類的圖書都不能直接使用代碼圖片,而必須全部是等寬字體排的代碼文本,代碼是可以交互的。
技術類圖書
手機屏幕對文字的縮進、排版存在很大的限制,但代碼往往比較長,如果它不符合手機屏幕對縮進、排版的要求,代碼段看起來會非常亂,不利于閱讀。但通過一些交互的操作,用戶可以閱讀到原版的格式規范的代碼。
完成排版后,我們的開發工程師會利用業余時間對所有的代碼進行審校,這也讓圖書中的代碼比實際紙質圖書更準確、更規范。不過,加工成本很高,而且周期都很長。
CSDN:制作一本書的周期是多久?
王毅:現在計算機類圖書的制作周期一般在兩周以上,因為它的流程很長,其中包括審核、校對、制作等,而且計算機類圖書的加工成本是最高的。
CSDN:就像之前所提到的,一些圖書會加入視頻,我們發現也有一些圖書會加入“輪播圖”形式的插圖(如,《轉一轉希臘》)。
王毅:這是專門使用了我們的“畫廊”技術。在很多攝影類圖書中,我們大量地使用“畫廊”,因為攝影類的圖書,經常會拿不同曝光、不同光圈下的圖像進行對比,但你會發現其實圖片大小是一樣的,所以采用“畫廊”的交互形式,能讓用戶滑動瀏覽圖片,非常便于對比在相同環境下使用不同參數的照片,它閱讀體驗比紙質書籍會更好。
CSDN:在電子書制作方面,多看有哪些獨特之處呢?
王毅:交互式代碼是多看獨有的,其他平臺都不具備這樣的特性。當然還有很多細節也非常與眾不同,比如說多看的圖文混排、多字體排版、獨特的樣式和字體,這在別的應用中是沒有的。
另一個獨特之處就是多看的糾錯和更新系統。每本書就像一個應用一樣,它會有自己的版本號,會根據用戶反饋進行定期更新。如果讀者在讀書時發現了錯別字,他可以點擊選中它,并發送糾錯報告。多看的后臺有一個數據整理系統,每天定時收集這些用戶的反饋報告,系統會自動生成相應的錯誤報告,然后發送到我們的工作流系統里。我們的編輯團隊會根據這些反饋做出相應處理,然后更新圖書版本。這時用戶就會在客戶端就會看到一個溫馨提示,告訴用戶圖書更新了,用戶甚至可以查看更新記錄,在圖書的詳細信息頁里面也可以瀏覽它的更新歷史。用戶只需點擊下載更新,就可以繼續閱讀了。
我認為這種更新機制完全顛覆了傳統紙質圖書的出版流程,因為實體書的出版無法做到快速更新,再版最短也需要6個月。但是我們基本上在一個月之內,就可以把用戶提交的Bug全部修改完,然后更新上線。用戶也能很快的得到反饋效果,他看到的電子書的內容精準程度,通常比實體書更高。同時,我們與出版社保持溝通,獲取刊物的最新信息,這使電子書臻于完美。頻繁的更新使得數據越來越準確,電子書的質量會變得越來越高。
CSDN:在電子書中加入視頻、圖片等多媒體元素,無疑會讓文件體積增大。你們會如何處理?
王毅:我們會做一些處理,會對其體積進行控制,因為數據量太大也會影響用戶的下載體驗。但是文件體積變大是不可避免的,尤其對圖文混排的書,多媒體圖書體積相對較大。不過現在的網絡帶寬在不斷提升,下載速度也在不斷的加快,我們認為這已經不再是什么太大的問題了。
CSDN:PDF智能重排和切邊功能是如何實現的?
王毅:這個功能也是一個特色,因為多看閱讀除了是多看書城的終端之外,在各個平臺也是很好的一個閱讀工具,它支持主流格式,比如TXT、ePub、PDF等。同時,每一種格式在多看中都會有自己的特點,比如ePub,我們很好地支持了ePub標準和它的CSS解析。在很多的閱讀器中,ePub僅被簡單當作了一種的文本格式,這一種誤解,其實不利于ePub標準的推廣。實際上,ePub標準主要的核心優勢是采用了HTML5和CSS技術,可以做出非常精美的電子書,包括多看書城上的很多書都是ePub格式的,所以我們在ePub的兼容性方面應該比絕大多數的應用更完美。
我們有很多用戶,甚至會自己制作ePub圖書放到多看里面閱讀。前一段時間,我們基于ePub做了一些擴展的開放標準,開放了一些多看的擴展規范,比如說我們的交互式的文內注,這個擴展規范已經開放給了用戶。我們有一些用戶專門針對我們的擴展規范,做了一些電子書。這些開放的規范都可以在我們論壇找到。
關于PDF格式,我們對PDF投入較大的就是重排功能,現在不論是文字版還是掃描版的PDF都可以實現重排。PDF是作為一個版式的文檔,它其實在小屏幕上的閱讀體驗并不好,所以為了能讓它適應小屏幕的閱讀,就需要借助重排的功能,目前這方面我們也在努力,包括切邊,包括重排掃描版的處理。
然而PDF重排是個很復雜的過程,因為PDF主要是面向印刷,很多PDF本身丟失了文檔的結構信息。它不像重排一個TXT或者Word文檔,這些文件都是有段落結構的,而PDF則不同,它是一種基于矢量的文件格式,最終印刷效果是否高保真,是否與原始版面完全一致才是它的重點,但它的文檔卻缺失了邏輯結構。所以PDF重排過程會涉及到一些對版面理解的算法。你可以將PDF理解為一張圖像,你用算法去理解這張圖像,其中哪些是段落,哪些是標題,哪些是圖,以及哪里是段落的起始和結束的位置,這些信息都需要以算法來進行處理。
CSDN:在多看在線書店中搜索書籍時,輸入“法國”,搜索結果中不僅僅有書名包含“法國”一詞的書籍,還有法國作家的著作,以及中國作家寫的相關圖書。多看的搜索基于什么?
王毅:現在我們并沒有在搜索方面投入很多人力,但是我們做了一些管理性的工作。多看不僅僅針對書名、作者進行搜索,還包括標簽。我們編輯會對每本書加上標簽,這是加工制作流程的一環。編輯會根據他的理解,為每本書打上相關的標簽。這些標簽用戶也可以在圖書詳細信息頁中看到,如果用戶點擊標簽就可以進入相關的標簽書單。另外,我們對標簽有多個維度,比如地理的緯度、人名的緯度等,都有比較嚴格的限定。
CSDN:小米并購多看為你們帶來了什么樣的變化?從技術層面講,有哪些協作呢?
王毅:最明顯的就是基礎技術的互通,現在我們所有的應用,包括多看閱讀,全部遷移到了小米帳號的體系下,多看現在也使用小米帳號,作為一個身份認證系統,小米帳號打通了整個小米的業務系統。用戶可以基于小米賬戶做很多事情,比如訪問云空間,以前的多看帳號是沒有這項服務,但是隨著無縫遷移至小米帳號后,用戶可以通過小米賬號登錄,同步賬號中的圖書、筆記等信息到小米云空間。
與此同時,米幣支付系統也是一大重點。支付系統是小米生態中非常重要的一環,現在游戲、主題和閱讀都以統一的支付系統貫穿起來。同時支持各種各樣的充值的方式,這樣我們的用戶不管是在移動端,還是在Web端都可以很方便地使用米幣來支付,這也是合并之后的一大變化。
CSDN:多看目前有100多名員工,算是一個中等大小的團隊。從技術層面看,您認為對于中小開發者來說,什么樣的開發工具或服務是必需的?
王毅:我覺得從開發團隊管理上講,采用適合自己的開發工具是很重要的,因為這有利于大幅提升他們的開發效率。就好像我們的代碼管理方式已經歷了好幾次的改變,最初我們使用的是微軟一套代碼管理系統TFS,后來開始使用SVN,由于SVN在分布式處理方面存在一些缺陷,所以最終采用了Git。
我認為選擇工具的目的是盡量杜絕以往手工作坊式的開發方式,使開發更有條理和規范。與我們現在采用Git做代碼管理的道理一樣,因為Git的特點是分布式開發,它很便于分支,同時它也很輕量級,跨平臺性能好,現在也是主流的代碼管理工具。
我們的Bug管理現在采用的是JIRA,這也是目前整個小米體系下大多數團隊所采用的平臺。這個平臺可以通過多種方式擴展,可定制接口和模塊,輕量、靈活也是它的重要特性,能夠有效地幫助中小團隊解決項目管理問題。
CSDN:近幾年,電子書讓很多傳統的書店的經營越來越困難。您覺得像多看這樣的電子閱讀產品,于整個出版業來說產生了哪些影響?
王毅:我覺得我們最大的影響是對電子書閱讀體驗的改變。我在數字出版相關技術領域工作多年,電子書的概念很多年前就存在了,只不過那時移動互聯網、移動設備尚未普及,受限于大環境,所以當時的閱讀滯留于桌面之上,更談不上什么移動閱讀體驗了。支付也面對著同樣的問題,用戶還沒有在手機上進行支付的習慣。隨著移動、支付等多個領域的發展,它慢慢使得數字閱讀會變成一個趨勢。以我們在數字閱讀領域多年的經驗來看,過去對閱讀體驗的重視程度并未被提到現在這樣的高度,因為過去主要解決的還是能不能順暢閱讀的問題,而閱讀體驗,受硬件的限制,近乎無從談起。所以,盡管當時電子書已經存在,但實際上用戶對電子書的使用率很低,它與實體書的差異很大,還遠遠達不到可以替代實體書的程度。例數早期深耕數字閱讀領域的公司,不管是方正、超星、漢王,還是清華同方,當時都做了很多推動數字化閱讀的嘗試,可最終都沒有一款應用能為大多數用戶所接受。
從多看的角度來講,我們最大的特點就是出色的閱讀體驗,它可以讓更多的用戶真正認識到“實體書并非不可替代”,而且會讓更多人逐漸接受付費下載。雖然以前也曾有人嘗試做付費閱讀,但大家買了書之后,可能發現它的閱讀體驗還不一定比盜版電子書做得好。但隨著閱讀體驗、移動快捷支付的體驗,甚至包括多設備平臺的無縫銜接、社交等增值服務的日漸增多,以及體驗的提升,會潛移默化地讓這些讀者覺得付費是值得的。雖然我們平臺上的用戶數并不是很多,但是用戶的黏性非常高。好的閱讀體驗以及不斷增多的圖書資源會使得用戶接受通過數字閱讀渠道進行消費。當越來越多的人認識到付費閱讀,或者說數字閱讀的趨勢之后,對于作者和出版社來講,他們得到的回報也會水漲船高,則更愿意把優質的內容投放到數字平臺上,這樣就形成了一個良性的循環。
從目前來看,傳統的實體書店正是在走下坡路。店面租金、物流配送、庫存等問題,讓實體書有很大的局限性。而數字閱讀平臺則不存在這些問題,這也是它的優勢所在。
CSDN:你們如何應對電子書的盜版呢?
王毅:我們在這方面做了很多努力,我們也會采用DRM系統,同時,我們對數據安全也會做嚴格的控制。所以,其實目前可以看到的針對多看系統的盜版現象,可以說幾乎沒有。
對于盜版這件事,喬布斯開始銷售音樂時也曾面對許多盜版音樂的問題,他曾說“與其花上30到60分鐘,去搜一個盜版音樂,那么你為什么不用1分鐘花1美元去買一首歌呢?這樣節省下來的時間難道還不值1美元嗎”?同樣道理,對于我們來說,當我提供的圖書質量足夠好,它內容足以吸引用戶,同時它的價格也足夠吸引用戶的時候,與其花大量時間,搜出一些可能錯字連篇、排版混亂、無法同步閱讀筆記的電子書,還不如用很低的價格去享受最優質的服務。說實在的,我們圖書的價格已經非常低了,很多圖書都在6塊錢以內,如果你花一瓶礦泉水的錢,就能買到一本好書,那你為什么不支持正版呢?當然,打擊盜版也依賴于環境,隨讀者的版權意識越來越強,盜版也將不再是個問題。
CSDN:11月25日,美國法院宣判Google數字圖書館計劃合法,對于此事您怎么看?
我認為還是應該積極地去看待這件事。就Google的理念及其公司價值來看,這對于促進實體書數字化來講有正面的引導作用。但回過頭來看國內,其實國內的圖書數字化要比國外的難度更高。
在國內做數字閱讀平臺會遇到許多問題,比如圖書的數據源就是其中之一。中國很多圖書的數據源質量差到令人發指。我們曾有一本書,內容非常好,而且在我們平臺上的銷量也很可觀。但是你要知道,我們很早之前就拿到這本書的數據,可它遲遲無法上架,就是因為出版社給我們數據源根本沒有圖,而這本書如果沒有圖,你基本很難看懂,其中有很多插圖是非常珍貴的。于是我們就找出實體書,但它的印刷效果非常糟。我們想了各種各樣辦法,甚至是通過網絡搜索插圖,同時掃描截圖,最后把這本書做了出來。類似例子非常多,現在出版社更多情況下給我們提供的都是PDF,然而PDF的質量對圖書的數字化是遠遠不夠。
數據源審查結果(點擊可查看大圖)
其實在中文圖書世界里,想要讓圖書完全數字化,路還很長。這依賴于很多環節的共同努力,數據源只是其中之一,這也是制約著我們現在圖書上架速度的一個環節。多看現在大約有12000本書,平均每個月有1000本書上架,能有這樣的速度,其實非常不易。
CSDN:多看除了發布電子書以外,還作為許多科技媒體、紙媒發布電子雜志的平臺,是什么促使你們開始與媒體合作推出雜志?
王毅:這與我們的用戶屬性有關。多看的用戶大多是IT圈里的人,而且程序員居多,所以存在這樣的需求。而且這些雜志基本上都可以免費下載,也的確很受歡迎。現在我們也在多更多的嘗試,包括最近與知乎合作推出知乎周刊。
對于雜志,我們做了非常大的投入,你可以看到平臺上的雜志,制作非常精美,不管是用小屏的手機,還是用Pad瀏覽,都是非常享受的一件事情。而且現在平臺上還有很多優秀的雜志,比如《環球科學》、《科幻世界》、《人物》等。
現在雜志與圖書有著相同的制作流程,不過在未來多看上的雜志還會有更多變化。因為雜志有很多獨特的需求和特點,比如對訂閱的需求,這是最大的不同之處。
CSDN:這一年,多看取得了哪些成績?新一年將有怎樣的計劃?
王毅:成績還談不上,更多是一些數據的增長。我們現在實現全移動平臺的覆蓋,用戶量超過了2200萬。在小米手機的帶動下,Android用戶占多數。目前與多看書城合作的出版社已經超過了200家,截止至12月,多看已經發布了約12000冊精品圖書。我想這些都是就是目前所取得的成績。
多看科技團隊
至于計劃,其實挺多的。對于我們來講,內容方面肯定會進一步加強,引入更多的合作伙伴,使內容更為的豐富。在閱讀體驗方面,需要努力的地方也很多。盡管開發資源是有限的,但我們仍希望在未來的一年里,能讓閱讀體驗更上一層樓,讓更多人能夠享受到比較好的數字閱讀。
(責編/翟方慶)
本文為CSDN原創文章,未經允許不得轉載,如需轉載請聯系market#csdn.net(#換成@)