汽車產業大數據的價值

作者:崔磊   |   2015 / 07 / 09

文章來源:蓋世汽車網   |   圖片來源:蓋世汽車網


6月26日,“今日頭條”在上海舉辦了一場別開生面的大數據發表會。僅僅一年時間,今日頭條就依靠龐大的移動端裝機量,積累了百億規模的大數據記錄,這使得張一鳴(今日頭條創始人、CEO)可以有足夠的資訊用來分析。參加這場掌聲頻傳的大數據發表無疑是受益匪淺的,但結合自身對大數據的使用和思考,同時也發現了一些問題,借此機會與大家共同探討。

資料量不再是大數據門檻

不論從產品營運還是資料積累角度,今日頭條都是成功的。它僅僅用了不到3年時間,就獲得了超過2.5億的產品啟動量,以及超過2000萬的日活躍用戶。這為今日頭條積累了天文數字般的資料量。例如僅僅在2014年間,汽車資訊類的點擊就達到25.3億次,還有1896萬次收藏和333萬條評論。

這僅僅是一家創立僅3年的產品一年中某個領域的資料量,而眾多使用者群體龐大的傳統互聯網企業,如百度這樣的搜尋引擎、搜狐等門戶網站、微博等SNS平臺,積累的資料也都是數以百億計的。尤其是移動互聯網快速發展的當下,資料量已經早已不是大數據分析的限制因素了。

汽車大數據的價值?

既然大數據概念這麼火,需要專門搞發表會,那麼汽車大數據到底有什麼意義呢?我們發現,大數據確實可以告訴我們一些有意思的事情。

IMG_5477_2345看图王

今日頭條給出的資料顯示,SUV的關注度大約為30%,如今SUV市場佔有率相當;資料告訴我們,經濟欠發達地區的今日頭條使用者更關注汽車資訊,說明隨著經濟發展那裡的人們開始關注汽車產品;資料告訴我們,德系車依然是中國消費者最關注的車系等。有些是我們已經知道的,有些是我們通過大數據才知道的。

在日常工作中,筆者通常依靠百度指數作為大數據的來源。按照筆者的分析,百度指數作為一項“搜尋大數據”,與汽車銷量存在著一定正相關關係,即搜尋指數高的車型銷量高。

01大眾速騰 02比亞迪F3 03寶馬5系 04奧迪A4L

通過將特定時間段特定車型的銷量和百度搜尋指數進行耦合觀察,可以明顯看出銷量與搜尋指數之間存在著顯著的正相關關係。實際上按照筆者的統計,這一規律符合大多數汽車產品,尤其是越成熟的產品(時間、市場、管道),搜尋指數與銷量的關係相對越緊密。有興趣的讀者可以自行選擇車型對照試驗。

然而,受到各種因素的影響,兩個資料並不能完全對應,在波動幅度、頻率等方面也存在顯著差異。少部分產品甚至差異巨大,如上圖中的A4L。

換言之,目前的大數據,可以給我們提供一種定性分析的角度,但還做不到嚴格的定量分析。這又是為何呢?

汽車大數據的問題

總體而言,目前的汽車大數據依然處於非常原始的階段,即最基本的資料收集。看起來很美的背後,存在著很多顯見的錯誤。

  • 大數據本身可靠度較低
    目前的資料收集依然十分粗糙,資料受到干擾的情況十分嚴重,尤其是一些通用關鍵字。如此次數據發佈會就完全剔除了大眾品牌的大數據分析,因為“大眾”一詞的資料受到的干擾較多。這說明目前的大數據收集依然不夠精細和準確,而且我們同樣難以排除其他關鍵字被干擾的可能,同時我們不知道影響因素到底是什麼。
  • 評價標準是明顯的錯誤
    如此次數據發表會更多倚靠“總閱讀量”進行排名,進而得出關注者“最關注”的排行。總的閱讀量固然是一個重要指標,但總閱讀量等於每篇閱讀量之和,換言之假如某方面文章篇數太多,讀者不得不去點擊閱讀,這樣的閱讀量並不能反應真實的關注度。而如果在總閱讀量上輔之以平均閱讀量、總文章數等指標,則評價標準就能更加客觀。
  • 資料分析解讀能力弱
    我們在獲得巨量資料的同時,目前還並不能對資料進行有效的挖掘和解讀,使得資料僅僅是一些似是而非的數字。癥結在於,我們目前還沒有很好的辦法搞清楚資料之間的邏輯關係,只能依靠經驗、甚至猜測去解讀數據,這顯然是極度不可靠的。

以上的種種問題,每個都足以嚴重到重創汽車大數據的可信度和商業價值,讓我們面對大數據只能無奈地說一句“然並卵”(然而並沒有什麼卵用,沒什麼價值)。

縱然大數據的概念現在依然炒得火熱,但看起來很美好的大數據,目前依然只是互聯網時代的一個噱頭。不論作為企業還是消費者,在保持對大數據的熱情的同時,還應抱有足夠的戒心,因為一個不小心,可能就被騙了。(文/崔磊)

蓋世汽車網授權轉載》

喜歡這篇文章?加入你的S夾!

蓋世汽車網
蓋世汽車資訊業內人士最愛看的汽車資訊,蓋世汽車網立志打造專業人士最愛看的汽車資訊,提供最新最齊全的國內外新聞,豐富的產業評論、數據分析及焦點關注,詳盡介紹各主流汽車市場產業動態及市場銷量。
蓋世汽車網的最新文章
More

社群熱門分享排行榜
本週
本月
追蹤股感的社群