Facebook 人工智能的真正野心

作者:熊晉穎   |   2017 / 02 / 03

文章來源:華爾街見聞   |   圖片來源:Joseph Wang


在智能助手上的競爭是激烈的,蘋果有 Siri,谷歌有 Google Now, 微軟有 Cortana,而 Facebook 是智能助手“M”。不過對於 Facebook 來說,一個這樣的智能助手遠遠不夠,在人工智能上 Facebook 有著更大的野心。

Facebook希望其平台能利用機器學習來理解用戶發文、評論、圖片以及影音的內容含義,然後再將這些訊息存儲為元數據,以提升廣告定位,並增強推送新聞的相關性。同時元數據還將作為原始材料,用於創建一個高級的智能對話機器人。

這並非遙不可及的目標,實際上,今天的 Facebook 在面對大眾時已經涉及到了大量的人工智能,不管是其圖片、影音、新聞推送或是剛起步的聊天機器人。

“M”智能助手

Facebook 自己的人工智能助手被稱作“M項目” (Project M) 。這一項目雖不具備與人類相似的智能,但具有狹義上的智能,可以通過觀察人類行為來學習。

早期階段,M 項目是基於文本的數字助手,可以用於理解用戶的意圖 (比如,叫一部 Uber 車) 。當 M 智能助手遭遇一個難以解決的問題時,將會請求人類訓練員的幫助,並從人類訓練員介入解決中學習,在下一次預測用戶意圖時提高準確性。

目前 M 項目當然不是終極版,而是一個實現智能對話機器長期目標的里程碑。每一個這樣的里程碑都在通向這樣一個未來,機器擁有與人類更相近的理解能力。

Facebook 人工智能研究總監 Yann LeCun 將 Facebook 的智能對話機器人描述為 M 項目的未來超高級版本。他表示“根本上來說,這仍然是 M,但完全自動化和個性化了。所以 M 是你的朋友,不是每個人的 M。”

LeCun 是​​人工智能和機器學習研究的先驅,領導著 Facebook 的人工智能實驗室 (FAIR) 。這一實驗室於 2014 年 12 月成立。

蓬勃發展的圖像識別

起點是在 2012 年, Facebook 開始應用機器學習來理解用戶圖片的內容和語境。當時,應用電腦視覺研究是一個廣泛研究的領域,也是機器學習學術研究的早期範例。

馬克·祖克柏 (Mark Zuckerberg) 及 Facebook 首席技術長 Mike Schroepfer 將人工智能由研究擴展至產品化,並將其納入公司層面的平台,增加對機器學習的投資。同時期 GPU 誕生,這大幅提升了圖像識別的準確性。

在圖像識別的初期,唯一能使用的是面部識別。當時 Facebook 應用電腦視覺研究團隊需要做的,不是在預設特定應用場景的前提下理解圖片,而是建立這樣一種方法,由研發者利用機器學習模型來尋找自己的答案。

現在,Facebook 圖像識別已經轉移到了一個被稱為“Lumos”的自助平台,無需人工監督。 FAIR 團隊以及應用電腦視覺團隊打造出了識別圖像的機器學習訓練模型,並已通過 FBLearner Flow 平台分發給了整個公司 40 多個產品研發小組,包括搜索、廣告和新聞等。各個產品研發小組可以運用該平台訓練機器學習模型的圖像識別。

用戶已經可以體驗到 Facebook 的圖像識別,比如暴力、仇恨言論和黃色圖片很少在用戶新聞源中出現。過去這些圖片須由用戶標記出來,再由相關團隊確認為不良圖片並刪除。但現在機器學習模型被用來識別和刪除這些圖片。相關研究團隊則需要獨立創建新分類來識別新型的不良圖片,並訓練機器學習自動對其作出響應。

尚在早期的影音識別

相比圖像識別蓬勃發展,影音內容識別仍然處於更早期的階段。從技術上說,提升影音內容識別的準確性是可能的。但如果基礎設備的性價比沒有改善,算法上也沒有突破,那麼這在商業上是不可行的。

儘管如此,Facebook FAIR 團隊以及應用電腦視覺團隊已經展示出對於用戶上傳的 Facebook Live 影音進行動態識別,比如從一段影音中分割出煙花、食品或貓。從 Facebook 的展示中可以看到,人工智能技術有可能達到更多的功能,比如對影音進行實時排名,對推送給用戶的新聞進行個性化設置,並消除影音發布及分發的延遲。

為加快這一領域的研發,Facebook 已與學術及社區研究人員展開合作,授權其影音識別軟體以開源的方式公開部分研究成果,並舉辦研討會。

影音識別的機器學習模型已有所應用。 2016 年 Oculus Connect 開發者大會上,一款具備由內而外追踪功能的 Santa Cruz VR 頭顯設備原型就使用到了這一模型。

前期的電腦“讀心術”

去年 Facebook 創建了一個秘密的硬體研究部門,開發“大腦與電腦的交互技術”。這聽起來很像科幻電影中的讀心術或心靈感應。

Facebook 的新硬體部門“Building 8”最近的招聘職位中提到了一項硬體項目,涉及到“神經影像學” (neuroimaging) 和“電生理數據” (electrophysiological data) 以及創建一個“未來的交流平台” 。

其中一個招聘職位是大腦與電腦交互工程師,要求是神經科學的博士,幫助項目在兩年內完成從初始設立至產品成型。另一個職位是尋找一名能“開發音頻信號處理算法”的工程師。

Facebook 並沒有詳細說明這些工作職位,但 CEO 祖克柏曾在 2015 年提及,公司確實在研發某種類型的大腦控制與通訊設備。

目前尚不清楚Faceook最終可能採用怎樣的技術來實現這一願景。儘管還有很長的路要走,但這樣的產品可能代表一次巨大的飛躍,把 Facebook 這一世界上最大的社交網絡公司帶向科技的最前沿。

研發硬體產品的“Building 8”部門於 2016 年 4 月剛成立,並由前谷歌尖端技術研發團隊ATAP負責人 Regina Dugan 領導。此前,Dugan 還曾擔任過美國國防部高級研究計劃局 (DARPA) 局長,集中致力於突破性技術的研發。

封面圖片來源:https://fbnewsroomus.files.wordpress.com/2016/04/mz-newsroom-01.jpg

華爾街見聞》授權轉載

(更多精彩財經資訊,點擊這裡下載華爾街見聞App)華爾街見聞-文末圖片連結

延伸閱讀:
喜歡這篇文章?加入你的S夾!

華爾街見聞
華爾街見聞,中國領先的財經新媒體平台,提供全球經濟和金融資訊,幫助中國投資者理解國際金融市場。讀懂金融、理解各國宏觀政策,從華爾街見聞開始。
華爾街見聞的最新文章
More