您的位置:首頁 ->> 台灣論衡 】 【打 印
【 第1頁 第2頁 第3頁 第4頁 第5頁 】 
大數據時代的總統選舉

http://www.CRNTT.com   2012-11-10 09:09:49  


 
  秘密進行

  不過,這個幾十人數據分析團隊具體做了些什麼,被嚴格保密。“他們是我們的核編碼。”當被問及都做了哪些工作時,競選發言人Ben LaBolt如此說道。

  在辦公室里,該團隊會給各個數據挖掘實驗進行神秘代碼命名,比如獨角鯨、追夢人。該團隊甚至在遠離其他競選工作人員的地方工作,在總部巨大辦公室的北邊盡頭,專設了一個沒有窗戶的房間。“科學家”們會為在白宮羅斯福廳的總統及他的高級幕僚發送常規工作報告,而更多的公開細節是不會透露的,競選團隊保護著他們自認為相對於羅姆尼團隊有制度優勢的地方:即數據。

  11月4日,一個高級競選顧問同意匿名向《時代》雜誌講講他們的前沿工作,也同時要讓我們保證,除非競選結束,否則不能披露信息。他們披露了他們如何利用海量數據分析挖掘,幫助奧巴馬籌集到10億美金,如何重新制訂了電視廣告投放,如何做出“搖擺州”選民的詳細模型(該模型可用於提升利用電話、上門投遞郵件、社會化媒體等手段的效率)

  如何籌集10億美金

  奧巴馬團隊在2008年對高科技的運用贏得了無數讚美,但其成功也表明了一個巨大缺陷:數據庫太多了。那時,通過奧巴馬網站打電話的志願者用的名單是一份賦閑在家者名單,這名單與在競選辦公室打電話人所用的名單是不一樣的。而動員投票名單也永遠不會與資金籌集名單重合。就像911之前的FBI和CIA:這兩支團隊絕不會共享數據。“我們早期意識到,民主黨的問題就在於數據庫太多了,”一個工作人員說,“數據庫之間不彼此碰頭。”所以在頭18個月里,競選團隊就創建了一個單一的巨大系統,可以將從民調專家、籌款人、選戰一線員工、消費者數據庫、以及“搖擺州”民主黨主要選民檔案的社會化媒體聯繫人與手機聯繫人那裡得到的所有數據都聚合到一塊。

  這個組合起來的巨大數據並不僅僅讓競選團隊能夠發現選民並獲取他們的注意,還能讓數據處理團隊去做一些測試,看哪些類型的人有可能被某種特定的事情所打動或說服。比如,在辦公室里的電話名單上,不只是列出對方的名字與號碼,還用他們可能被說服的內容、以及競選團隊最重要的優先訴求來排序。決定排序的因素中有四分之三是基本信息,比如年齡、姓別、種族、鄰居以及投票記錄。選民的消費者數據幫助完成這個圖譜。“我們可以預測哪些人會在網上捐錢,也可做出模型來看哪些人會用郵件捐。我們可以為志願者建模。”一個用數據來創建預測文檔的高級顧問說,“最後,建模對我們來說變得是一種更重要的方式,相較於2008年而言,它讓我們工作得更有效率。” 


 【 第1頁 第2頁 第3頁 第4頁 第5頁 】