建議先閱讀系列的第-1篇:參與度指數的含義和第-2篇:構成參與度指數的參數選擇,分類和數據收集辦法。
提高Engagement Index(EI)的計算方法,就不能不提 Eric Peterson 最初的貢獻,后來他整理成了白皮書,發(fā)布在這里:Measuring the Immeasurable-Visitor Engagement(備選下載鏈接),這是關于參與度指數計算方法的第一次正式討論;我們最終提到的參與度指數的計算方法也受了他的很大的影響。不過Petersson提出的是一個非常普遍化的一個公式,具體到一個項目中,需要根據所研究對象的屬性尋找合適的參數和權重。
Petersson給出的公式很簡單,只是一個簡單的加權求和的公式,其中使用到的參數也是網站分析中非常常見的:
其中,
• C=Click Depth Index,指用戶的訪問深度,由PV和Event組成
• D=Duration Index, 指用戶在網站的停留時間
• R=Recency Index,指用戶最近一次訪問網站的時間+用戶的訪問頻率
• B=Brand Index,指用戶對網站和產品的認知程度(awareness)
• F=Feedback Index, 指用戶對網站做的有價值的反饋信息
• I=Interaction Index,指用戶和網站內容/功能的一個互動的過程,在這個過程中用戶會對網站和產品給予更多的關注。
• L=Loyalty Index:,指用戶在較長時間段內和網站/產品互動的情況
(更詳細的解釋請參考白皮書)
我們在最初論證參與度指數的時候(可以推到2008年),因為從一開始便考慮到了一個網站(主網站)所處的生態(tài)系統(tǒng),包括第三方網站,競爭網站,衛(wèi)星網站,社交網絡應用和widget,所以最終得出結果是建立在Forrester最初提出來的參與度構成的4I (見 1參與度指數的含義)的基礎上的,和人群分組相結合,按照參與度的組成部分來計算,可以在時間軸上橫向比較的一個參數。所以我們設想中的參與度指數是至少分為三維的:
ei=f(s,i,to), EI=F(S,I,to)
其中S=Σs,人群分組,segement;I=Σi, 構成參與度指數的元素,4i (或者IIPIC),to為所選時間點或者時間區(qū)間
也就是說,
比如,一個隨便舉的例子,其中所有數據都為假設:
ei | s1=10K | s2=14K | s3=4K | S=Σns/N |
Involvement | 42 | 86 | 56 | 66 |
Interaction | 35 | 49 | 44 | 43 |
Proximity | 20 | 32 | 34 | 28 |
Influence | 13 | 20 | 23 | 18 |
Cocreation | 5 | 3 | 13 | 5 |
EI | 34 | 57 | 34 | 53 |
在這里,每個階段的總EI可以加權求平均值,權數就是每個分組的用戶數目;但是對于每一個分組的總的EI,和整個研究對象的EI則很難通過一定的公式來求得,比如說,他應該是各個階段的ei的平均值呢還是各個階段ei的和?亦或是加權和或者是加權平均值?權數如何確定?這里的主要決定因素是具體計算中,ei=f(s,i,to)的函數是怎么樣的,和EI=F(S,I,to)有什么聯(lián)系。
談到這里,希望大家對EI的計算方法有了一個大體的印象,主要是理解其中的思維和邏輯吧。至于ei=f(s,i,to)的具體寫法,這個是根據項目和需求而定的。我在案例分析中會談一下我們使用的方法。
案例所要介紹的項目是為一個奢侈品公司的電子商務網站創(chuàng)建一個Engagement Index模型。這是一個Flash網站,若干衛(wèi)星網站,在社交媒體上有行業(yè)中相對領先的布局。項目整體的scoop很大,評估的是整個digital environment。不過我們這次是從網站數據入手,先通過網站分析數據對用戶有一個大致的了解。我們使用的數據是從其網站分析工具Omniture Insight中提取出來。樣本是隨機抽取的2009年的大約900萬Visitor的所有訪問數據,總共20G 的txt文件,導入SAS之后80G。第一次處理這么多的數據,遇到的困難還是挺多的。
這個網站在6個國家有電子商務模塊,銷售可觀;但是在大部分國家沒有。品牌更注重的是這個網站如何能夠提升自身的形象,而不是銷售。正如模型的名字所說,要做的是“Engagement”,而不是“Sales”。項目的目的是通過研究網站用戶的行為特征,通過Engagement Level來評估,進而評價網站內容和相關市場營銷活動的效果,同時(我們考慮)后期有條件的話,研究不同程度的Engagement和銷售的關系。
點擊此處查看原始數據樣本。
原始數據包含諸如Visitor ID, Session Number, Language, Country, Turnover, Traffic sources,Campaign等29個原始變量。變量的數目雖然少,但是它們已經涵蓋了大多數網站分析的基本變量,在這些變量的基礎上我們可以計算出其他參數和指標。不過當然,在項目初期我們要求的很多變量還是沒有能夠提取出來。
通過原始數據樣本大家也許可以看到一些端倪。實際上,這些數據的最小記錄單元是Page,一條記錄(一行)代表一個PV,以及和這個PV相關的28個變量的值。PV可以通過Session Number歸類組成一條visit的全部記錄(2009年),而Session Number可以通過Visitor ID歸類組成一條visitor的全部記錄(2009年)。
有了這些數據,下面我們就可以開始干活了。下一篇中我會重點介紹原始數據的數據結構和各種不同層次(Page,Visit和visitor)視圖的創(chuàng)建。敬請關注Engagement Index-4:數據準備和參數創(chuàng)建
后記:這是上周寫的,竟然忘記發(fā)了。最近忙的焦頭爛額,恨不得把自己大卸八塊,然后每塊裝上三頭六臂,所以這周也沒有寫,正好拿這篇頂替了。
火上澆油,老板突然又給了一個關于Emerging Platform的東西,要求周四交框架。目前主題集中在SNS和Mobile兩塊上。自2005年以來,大家都知道哪些Emerging Platform呢(諸如Facebook, Twitter, Foursquare,iAD之類)?在Marketing的層面上,它們都能提供哪些機遇?我們如何評測在這些平臺上進行的廣告活動的效果呢?謝謝建議!也可以發(fā)送到我的email大家一起討論。hailongxia AT gmail . com
出處:http://semwatch.org/