12/18 regular meeting
2007年12月22日 星期六 by 哲民
這是我第三次報告paper,本篇paper的題目是"Mining Social Networks for Targeted Advertising",出處是:"Proceedings of the 39th Annual Hawaii International Conference on System Sciences (HICSS'06)"。這一篇paper是博班學長介紹的paper之一,算是比較入門的程度。因為Social Network其實在目前的網路應用上蠻熱門,像美國的MySpace、LinkdIn與Facebook等。而利用Social Network的模式來刊登廣告會比傳統靠內容比對的方式來得更精準,因此前一陣子Facebook推出的Social Ad Beacon還被譽為廣告界的聖盃。在報告之後,老師給了一些選擇優質paper的conference的建議。以下是本篇paper的摘要內容:
在商業中,針對部份客戶作目標性的廣告推薦是很有用的。傳統上都是靠手動方式分析先前的歷史交易資料或是客戶的相關特徵,但是近年來隨著技術的進展,這部份已經開始利用自動化的工具來處理了。目前推薦系統產生目標廣告的技術主要有兩大類,一類是content-based,另一類則是social-based。前者主要是比對個人特徵與產品內容分類的匹配性,缺點是沒有利用到有影響力的其它人。後者則是利用客戶對產品的評等關係之間的關連來作推薦,但是對於沒有被評等過的新產品或是尚未有評等產品的新客戶來說,這種方法並沒有用處。
為了修正上面所提方法的缺失,因此本篇paper提出一種基於social network概念的data mining framework for targeted advertising system。這種方法的原理是利用social network中的概念─如果兩個不認識的人間有另一個共同彼此認識的人,那麼他們之間的連結程度比任意兩個不認識的人之間還要強的許多。以此為基礎,找出客戶關係網路中的cohesive subgroups。接著將產品作分類,然後計算每個產品類別在對應的subgroup中交易的次數作為整個subgroup對該產品類別的愛好程度。透過這種方式,找出在某個固定的客戶數量下最有可能購買某項產品的客戶群 。對於新客戶來說,廣告推薦是根據新客戶屬於哪一個subgroup而定;對於新產品而言,則是根據新產品屬於哪一個分類。
最後作者們以彰化師範大學的教職員email logs與library-circulation data作為資料針對以下四種方法來實驗:
1. Group-based, 本篇paper所提出的方法
2. Single-based,將每個人視為一個subgroup
3. Neighbor-based,將有直接關係的人視為一個subgroup
4. Random,隨機選擇
結果顯示本篇paper所提出的group-based方法的performance是最佳的,並且在數量100-300之間具有明顯的統計顯著性。
最後是這次報告的投影片內容: