商湯科技:AI 公司從技術到商業化的 5 個關鍵

作者:都保杰   |   2018 / 08 / 26

文章來源:獵雲網   |   圖片來源:Joyce


從技術到商業化落實是每個人工智慧公司都要面臨的考驗,商湯科技聯合創辦人、副總裁楊帆認為這個過程有五個關鍵點:真實有效的規模化剛性需求、需求的技術紅線、融合創新能力、有效的數據閉環、核心價值要素轉移。

以下是楊帆近期分享的 “從技術突破到商業變現” 的精華重點,希望能有所借鑒或幫助:

我個人經歷很簡單,清華畢業後去了微軟(Microsoft, MSFT-US)。我從小的夢想就是成為一個科學家,其實不管以前的年代還是現在的人工智慧時代,科學家做出來的算法都很 “理想”。

我不知道有多少人承擔把科學家的算法變成產品的,就是你不產出算法但要直接跟算法打交道。你打過交道就會知道,科學家們做事情時往往會把問題理想化,會把問題抽象化。但是要知道在真實世界中面臨的問題,往往很難被抽象化,它的影響因素和干擾因素非常多,所以我一直負責將科學家的 “理想” 變成現實。

2014 年,商湯科技創立。我以前想更多的是做產品,但今天想的是把 AI 變成一個產業,想用 AI 幫助公司,甚至幫助產業。所以在產品之外,還有很多要考慮的問題,一些是商業問題,還有一些其他方面的問題,最終決定技術是不是能給我們帶來價值。

價值,是影響一個 AI 技術商業化方向的核心

有個數據來源於普華永道,預測到 2030 年,人工智慧將為世界經濟貢獻 15.7 兆美元,這相當於目前印度加中國的生產總值總和,而中國公司在其中將起到非常重要和關鍵的作用。

在今天的中國,我們整個 AI 技術的落實和應用發展非常快,大家都有共識:第一,我們數據產生能力非常強;第二,產業對新技術擁抱意識也非常強。兩者結合造就了我們在應用落實上跑得特別快,這是一個好的大方向。

在我們所認知的未來 5 ~ 10 年,比如對於一個城市如何最佳化它的營運管理,會由許多細節組成,包括遠距離感測、安全防護、大樓、商業等領域,都會納入到城市管理中。商湯所涉及的產業也比較多,從網路到手機、安全防護、汽車、娛樂等非常多,商湯科技已與超過 700 家中國外知名企業建立合作。

商湯科技是技術原創能力非常強的團隊,這讓我們一直引以為傲,今年,商湯和聯合實驗室在 CVPR 2018 上發了 44 篇論文,中國營運企業的論文總數量為 100 篇左右,上半年,商湯科技也接連完成了 C 輪和 C+ 輪融資。

接下來問題就來了,這麼多產業,技術能不能給這些產業帶來價值?帶來價值後我們能不能也收穫價值?我們收穫的價值是不是足夠多?時間是不是夠長?這些其實都會影響我們選擇一個 AI 技術去商業化的方向。

5G 技術走向成熟會激發更多影片類應用

AI 有很多方面,包括電腦視覺、自然語言處理、人機交互等等。為什麼視覺領域誕生了這麼多大大小小的新公司?語音處理領域,可能就只是科大訊飛(002230-CN),而沒有新的創業公司取得比較好的位置?從事自然語言理解或者機器學習分析的,可能也不多,原因是什麼?

在這裡,我分享一點我的認知,回過頭來看一下 AI 或整個資訊產業,什麼是電腦學科?它是對資訊採集、分析、儲存、回饋的學科,網路發展史基本圍繞著這裡面某一個環節的技術進步所帶來的產業升級,催生一些新的公司,給我們創造價值。

前幾年直播很狂熱,現在應用類影片也很熱門。大家有沒有想過為什麼這兩年才流行起來?智慧型手機是一個原因,讓我們的資訊採集和製造能力比以往無比強大,今天的手機鏡頭的清晰度非常高,可以快速產出大量影片,任何人都可以低成本生產。另外,4G 網路,也可以讓大家以非常低廉的成本,去傳播資訊。如此,這個產業獲得了催生和成熟。

此外,還有一個面向,就是資訊的載體型態。很早之前,電腦只能處理一些數位、文書、語音,後來可以流暢地處理圖像、影片,我們今天所處的環境是一個多態樣融合,各種資訊融合在一起,同時技術進步伴隨著不同資訊載體型態的發展。在我看來,載體型態的發展挑戰更大,影片相比語音、文書來說,是訊號雜訊比很大的資訊型態。

舉個例子,比如看一部 2 小時的高畫質電影,影片的容量是 10 幾 GB,這還是壓縮過的。但是把這個電影寫成一部小說存在硬碟上,可能也就幾十 KB。但是,不管是讀小說還是看電影,你所獲得的最關鍵 90% 資訊是一樣的。

為什麼?影片態包含有大量冗餘資訊,這些資訊可能沒有很高的價值,但當你需要時它又包含著更多細節,如果想對整個事物、整個事情有一個更深入和細緻的瞭解,會發現這裡有大量微小的資訊,同時它的噪音也非常大,對於電腦而言它的提煉難度更高。所以,這就是為什麼語音類技術、圖像影片類技術比文書搜尋技術更晚。

2014、2015 年的時候,文書有科技巨頭做了,這種情況下,創業公司基本不會有機會。但影片不一樣,2014 年之前可能沒有什麼公司真正擁有大量的影片,可能會有一些網路上的影片,但如果把天然資訊量考慮進來的話,相比今天的影片製造和蒐集能力來看仍然是九牛一毛,而隨著 5G 技術即將走向成熟,這會激發更多的影片類應用。

所以,從技術做商業化落實到底要注意哪些關鍵點?我有一些心得。

真實有效的規模化剛性需求

我們做任何一件事,哪怕擁有一個特別厲害的技術,一定最終是從需求出發的,一定是要說我到底給用戶創造了什麼價值。

我們這幾年見過很多偽需求,什麼叫偽需求?舉個例子,前些年一個做白色家電的生產商,他們覺得商湯的人臉辨識技術非常棒,他們想把家裡空調變成人臉辨識的空調,20 多歲年輕人走到這兒的時候調成 16 度,當老人進來的時候調到 26 度,溫度自動感應,多人性化。

我回覆了他的需求,提出了兩個問題:假如人進來時沒有拍到臉,拍到背影怎麼辦?假如年輕人和老人同時進來,空調感應要設多少度?這個在我看來就是典型的偽需求,用一個遙控器就能很簡單解決。所以,用戶可能很多時候沒有想得很清楚,但是,我們在想要做一個商業的時候,要清楚是不是能真正解決用戶真實的痛點和需求。

有很多需求是真的,但在經濟上不划算。舉個例子,為公廁推出人臉辨識衛生紙機,人臉在這兒一掃描,衛生紙就出現這麼多,鼓勵大家節約用紙,不要把過多的衛生紙拿走。這個需求是不是真的呢?是真的,因為目的是節約用紙,但這個需求不剛性,只能作為公益。

大家可以算一算,本身一個塑膠殻的衛生紙機要多少錢,現在進行改造,裝人臉辨識,還要裝個小螢幕,這個會增加多少錢?例子有點極端,但是我們遇到過很多這樣的問題,做任何商業一定是雙贏的,雙方一定都有投入、都有回報,這個模式才能持續、才能變大。

當然,對於剛性這個問題有時候很難判斷,因為商業邏輯往往很複雜。我見過一個跟衛生紙機類似的需求,就是超市置物櫃。現在超市置物櫃是按一下就會出現一個條碼小紙條,條碼非常不便,一個小紙條經常揉了、丟了會拿不出來,確實不是很方便,於是有人提是不是可以把超市置物櫃改成人臉辨識的?

這個問題,我首先想到的就是成本問題。因為這個創新能為超市帶來多大的便利?超市願不願意承擔成本?我沒想通,但後來溝通之後,發現這個事情背後藏的邏輯很深。

這不光是裝一個鏡頭,為讓掃描臉部置物櫃更便利,這裡一定會放一個螢幕,給顧客操作回饋,不知道大家聽到 “螢幕” 二字敏不敏感?反正內部的人聽到螢幕眼睛都是發亮的,因為有螢幕就可以打廣告,而且廣告可以鎖定面向去打。

要知道置物櫃位在商場和超市裡,顧客去用一定是要準備發生消費行為的,這個時機打廣告非常有價值。其次,鏡頭可以分辨出顧客是男是女,大概年齡,所以廣告是能鎖定面向的。當然,目前不一定打得非常精細,但是隨著超市背後會員體系越來越完整,掃描臉部的那一刻就會知道你是誰,知道你是超市的一個會員,知道你過去的消費記錄,屆時廣告是不是會更精準?

把需求放到這個邏輯來看,就算幾千塊錢、甚至幾萬塊錢成本也是非常低的。所以,我認為這是非常剛性的。

到底什麼需求是剛性,什麼需求不剛性?需要我們在實際工作生活中跟需求方仔細地去思考,是不是能夠挖掘更大的價值點。

需求的技術紅線

從 2013 年到現在,整個人臉辨識,在不同場景下,對準確率的要求其實千差萬別。從商湯自身定位來看,每一年我們能把人臉識識錯誤率下降一百倍,但在資安防護領域,還是有很多場域應用需要我們繼續提高。

這裡有一個很關鍵的問題,就是當你有這樣一個技術,把它用在不同場景時的技術需求是不一樣的。這個時候需要一個好的判斷力,在未來半年或者一年剛好能去解決這個場景中的關鍵問題。如果來的太早,就要花很長時間研發,遲遲拿不到市場回報,企業就會被損耗滅亡;如果來的太晚,就會發現市場上有很多家都能做這個業務的企業,屆時比的不是技術而是別的能力,這就不適合技術企業切入這個市場。

當決定進入一個市場,第一,要看到這裡有剛性需求的場景。第二,需要大致判斷這個場景,以我的技術水準要花多長時間解決掉,現在是不是剛剛好解決?我解決了,同類型市場其他人是不是也能解決?這個是決定下一步是不是要做這個事情的先決點。第三,真正做一個產業時,以一個技術點出發,只能解決需求的一小部分,當想讓這個需求進一步發展完善,它一定有更多技術點需要去解決。

融合創新能力

這是商湯為直播 APP 廠商提供的一套 AR 解決方案,我們的技術會緊密跟隨用戶需求一起往前走。前一陣我們還發了一個產品 Demo,商湯的 “瘦身” 技術,可以瘦腰、瘦腿。我當時發給了朋友圈,以前的同事留言給我說,網路以前臉不可信,現在連身材都不可信了。沒辦法,順應時代的發展,順應用戶的真實需求。

今天,做一個產品,就算其中 90% 靠人臉辨識解決,並不是說把人臉辨識做好就夠了,可能剩下 70% 的工作量是解決剩下的 10%,這才決定了產品最終的差異化。

所以,產品能給客戶提供價值,實際上在這個過程中需要重新定義這個問題,除了找到核心技術競爭力之外,到底離客戶的需求真正被滿足,差距在哪裡,以什麼樣的方式去解決這樣的差距,這往往是需要投入很大的,進行持續性投入的一個關鍵點。

有效的數據閉環

怎麼樣保證數據的獲取,特別在新的領域,是雞和蛋的問題。

閉環需要有一個起步可以開始執行,只要比別人先做有三個月時間,很多競爭對手就會被擱在門外了,因為閉環的加速優勢會起到很大作用。任何一點取得突破就可以,比如技術比別人好,把其他場景的技術遷移過來,就得到了一個起步技術,就可以開始跑;或者有資源和數據;或者說與下遊產業用戶形成了很深的合作。

在這個環節中怎樣找到合適的切入點切入正回饋,就需要一個案例一個案例去看了,所以存在合適的業務模式選擇問題。大家知道,我們現在對數據隱私性,數據的所有權,有一系列值得我們長期持續探討的問題。不同產業、業務模式怎麼去選,怎麼樣對數據產權有有效的界定,成為業務發展的助力,而不是阻礙。

核心價值要素轉移

最後一點,我認為這是最關鍵的。

首先任何一個新技術解決一個場景一定有時間窗口,技術一定會擴散,你的技術會進步,別人也會進步。但是這個產業的需求,至少這個場景的需求不會隨著時間的流逝而提升。所以技術門檻一定是有時間窗口的。

對於一個技術企業最重要是在有限的時間窗口到底能夠做什麼。一個前提,當你切入一個新市場,有無比強大的技術能力,保證比別人做出的東西強,這個其實是非常非常難的。如果想認真地在一個產業進行產品不斷更新、業務提升,很重要的一個問題,就是你的技術領先對你最重要的是什麼?是技術的打磨,還是收入的回饋和獲取?還是說需要去思考產業要素,到底怎麼進行有效的分配轉移?

舉個例子,我們曾跟一個大型連鎖超市合作一個項目,用人工智慧技術去解決超市預防損失的問題。超市有一個掌握了偷東西黑名單的資料庫,我們就基於這個資料庫做了一個人臉抽查系統,在超市入口處安裝上鏡頭,顧客都會被識別,如果是黑名單就會報警通知保全人員。

我們當時覺得這個合作非常好,人臉辨識,還能做小運算,一整套方案很成熟。我們整個方案不停研磨,把算法也弄的很好,場景也做得很好,產品也不貴,一整套方案拿出去,大概推了幾十家店。後來另一家廠商入場,他就做一件事,超市以前都有鏡頭,他用純影片的 NVR(Network Video Recorder),如果這個超市沒裝,就賣你這個設備,而且這個設備附帶一個人臉辨識。

這件事情最關鍵的一點是什麼?他也要做技術研發也會有成本投入,我也有成本投入。我們的技術水準比這家廠商好,但這場仗輸了,兩個核心原因:第一,對手具備強大的供應鏈,它從上游供應鏈拿到的報價比你低 30% 甚至 40%。第二,他有全國服務支撐體系,有大量的合作夥伴,所有店都可以派人去安裝部署。而我們找一個全國代理商做這樣的服務和售後,跌跌撞撞非常難。

反過頭來看,這個產業的核心要素是什麼?對於商湯,對於零售,核心要素是一整套解決方案的硬體成本,在這種場景下、在能力基本達標的情況下客戶對硬體成本是極度敏感的。因此,我們更關注的是細分場景,在那些場景可以形成差異化優勢。

今天舉了幾個簡單的例子,從有一個好的技術到真正完成有效的商業落實,這裡有幾個值得大家注意的關鍵點,在每個環節可能都要想一想。做一個產品、做一個產業,在這幾點上是不是所有道理都想得通,但想通這些事情往後就會好做很多。

獵雲網》授權轉載

【延伸閱讀】

loading animation
喜歡這篇文章?加入你的S夾!

分享好文章

獵雲網
「獵雲網」用心服務創業者。
創業本就是一場征途式的孤獨馬拉松。我們關注那些會改變世界的小火苗!不做隔岸觀火者,也不做只拍手稱快者。我們願意參與近這場創業大潮。我們是一群年輕有夢想的創業派。遵守規則,也蔑視規則,推崇創新,也扼殺創新。我們不用別人來指點未來應該走向哪裡。我們的征途是星辰大海!
獵雲網的最新文章
More