2021年12月上旬,商湯科技首次公開募股定價本該正常進行,然而,美國財政部一紙政令給商湯的IPO進程帶來新的波折。商湯被列入“軍事工業復合體公司”黑名單,要求“美國相關”投資者一律不許參與商湯募資。但商湯上市后的表現似乎讓美國失望了……
事實上,在AI領域,CV四小龍商湯、曠視、云從和依圖作為AI行業的代表企業,一直以來備受各界關注,背后有龐大融資規模的因素,也有長期巨額虧損的因素,不同的人有著不同的關注角度,而美國虎視眈眈的則是這些企業代表的研究方向與已經展現出來的實力,會給其帶來巨大的威脅。
當然,除了CV賽道,讓美國不適的是整個中國的AI產業,除了CV四小龍,科大訊飛、海康威視等都在制裁的清單上。背后的原因顯而易見,AI作為下一個20年全球化競爭的核心賽道之一,也是中美科創競爭的關鍵核心戰場之一。而中國AI產業的先發優勢與全面、深層次的布局已經形成了極強的競爭優勢,并在各方面領跑全球。
但很顯然,中國AI產業取得的成就并非是單個企業,而是體系化、系統化的領先,美國試圖通過“制裁”、“拉黑”企業阻礙中國AI產業的持續性領先,這個算盤是敲不響的,以AI第一股科大訊飛為例,目前科大訊飛已經通過在智能語音、計算機機器視覺等感知智能領域的突破,以及深度學習、自然語言處理等認知智能層面的單點技術的突破,實現了系統性創新。
美國在怕什么?
數據顯示,早在2019年,我國人工智能專利申請數量超過11萬項,超過美國的8萬項,穩居世界第一,計算機視覺作為全球布局最集中的領域,國內企業數量在全球占比也已超過40%。最新數據顯示,2018年-2021年全球共新增申請了65萬件人工智能相關專利,中國、美國和日本申請量分列前三,其中中國為44.5萬件,占比68.5%。
專利數量的豐富度背后,則是中國市場應用場景的豐富度,無論是在布局廣度還是深度方面,均已經形成了明顯的競爭優勢。同時,中國AI行業的創新普遍有著明顯的原創性,占據著大部分創新應用的主導權,疊加場景應用的加速落地,后續發展勢頭依然強勁。
在過去科技領域,美國長期處于優勢地位,也讓美國在上一輪的競爭中有了躺著賺錢的實力,作為下一個二十年國際化競爭的核心賽道,AI代表的不僅是下一代的效率革命,也是國家實力的體現。基本面是,中國AI產業的強勢崛起,無疑讓美國感受到了威脅。
從這個角度來看,美國頻繁拉黑中國AI企業的目的無非就是希望借此阻礙中國AI企業的發展,防止中國成為全球AI產業的領跑者,從而維護自身的技術優勢去搶占下半場競爭的主導權。
事實上,美國在AI領域對中國的防備不是沒有的。早在2019年初,特朗普政府就簽署了“美國AI倡議”:為確保美國繼續保持 AI 創新的領導地位, AI 倡議要求聯邦機構根據各自機構的任務,在其研發投資中優先考慮 AI 研發。2020年初,美國為了緩解“領先地位”焦慮,推出“AI十原則”,其中強調“AI增長創新是美國政府高級優先項。”
然而,作為一個關鍵的賽道,這種“你追我趕”的競爭方式根本上無法緩解美國的焦慮,因為對AI的投入,中國從未放慢腳步,也因此“拉黑”成為美國新的競爭手段。
美國之所以覺得這種方式有用,也是抓住了目前AI企業持續高投入、虧損的痛點,通過阻礙AI企業上市融資的方式來釜底抽薪。但這一計劃大概率落空,一來,像科大訊飛這樣已經上市的企業,業務多元化布局,已經實現了規模化盈利,資金充足;二來,未上市的獨角獸企業,本身具備技術創新實力,少了美國相關投資者,也不見得就徹底融不到錢了,以商湯為例,重啟上市計劃,在融資規模沒有變化的情況下,基石投資規模反倒從原來的4.5億美元,提升至5.1億美元,可見市場對中國AI企業的看好。
NLP與CV雙賽道演進,中國企業已搶先一步
從創新邏輯來看,及中美投資者偏好來看,美國AI領域主要偏重于底層基礎創新,而中國AI企業則更加強調應用創新,這依托于過去中國互聯網在各行業商業模式創新的優勢,也意味著中國AI創新邏輯是場景與需求驅動的反向創新,有著更高的落地效率。
結果也是顯而易見的,無論是計算機視覺技術、學習算法、還是自然語言處理,已經深度融合到了各行各業,從To B到To C全面覆蓋,大到無人駕駛,小到文字識別。
回到本質來看,AI是什么?也即我們追求的AI的能力到底是什么?事實上,即是構造一個可以用于理解世界的結構,簡單來理解的話,就是再造一個“人腦系統”,通過這個系統去理解世界的結構,然后去通過各種技能解放人類雙手。從這個邏輯來看,AI未來的能力一定是集成式的,因為只有集成才會擁有更加豐富的智慧。其中,NLP(自然語言處理)與CV(計算機視覺技術)則是最為關鍵的兩個環節,也即交流與觀察。
這也是AI行業在單點技能實現突破后,下一個階段的重要發展趨勢,而這樣的集成與融合在中國AI行業已經悄然展開。
早在2016年,基于強大的NLP技術沉淀,科大訊飛研發出一套深度全序列卷積神經網絡的語音識別框架(DFCNN),該技術解決方案可以直接將一句語音轉化成一張圖像作為輸入。簡單來說,DFCNN技術方案可以通過“觀看”語譜圖即可理解語音中表達的內容。據了解,科大訊飛將這一計數法方案與諸多現有的技術點結合后,DFCNN的語音識別框架在內部數千小時的中文語音短信聽寫任務上,相比目前業界最好的語音識別框架雙向RNN-CTC系統獲得了15%的性能提升。
(DFCNN示意圖)
一個技術方案背后,是科大訊飛早在2016年就已經展開了AI集成式能力的布局,從行業的角度來看,這是對下半場的提前布局,帶領中國AI產業再一次實現搶先一步的跨越。
在業界的普遍認知里,科大訊飛是一家很強的語音公司。但實際上,除了語音的強之外,其在CV領域的布局幾乎是與CV行業的快速發展幾乎同步。早在2008年,科大訊飛就已經展開了在CV領域的探索,并且基于自然語言處理技術的深厚積淀,科大訊飛在CV賽道的邏輯也走出了差異化,比如在文本識別范疇,科大訊飛的解決方案來自于語音識別對連續波形轉換的技術邏輯,在這一解決方案中,科大訊飛將語音識別中的HMM模型框架引入到文本行識別,大幅提升了精度。
2013年,科大訊飛的文本識別技術就已經應用于其主營業務之一智慧教育,并逐漸成為智能閱卷、評分測評甚至現在“因材施教”的個性化教育等應用的入口。
在文本識別生根發芽之際,科大訊飛又開啟了計算機視覺領域其他技術方向探索的征程,從人臉識別、醫學影像到輔助駕駛、虛擬形象等。
換個角度來看,科大訊飛在CV及NLP領域互相借鑒、融合底層的技術邏輯,這也為集成化的AI能力落地奠定了堅實的基礎。在科大訊飛AI研究院,計算機視覺、認知、語音三大方向一盤棋,也形成了科大訊飛跨領域、融合式的創新的能力。
可以預見的是,在新的階段,多種技術與場景需求的系統性創新是AI能力實現廣泛落地的先決條件,同時,行業對集成化能力需求的進一步提升,也將進一步提升中國AI產業的競爭能力。
下半場將啟,科大訊飛陽謀浮出水面
多項能力的集成是AI行業下半場開啟的重要信號,這也是AI邁向新階段的關鍵體現點。縱觀CV和NLP兩大核心能力的現狀,在技術方面都實現了深度的突破,并且目前均已經實現廣泛的落地與應用。
在語音市場,根據中國語音產業聯盟發布的《2020~2021中國語音產業發展白皮書》,我國智能語音市場規模持續穩定增長,其中科大訊飛以60%市場份額穩居第一;根據艾媒咨詢發布的《2020年中國人工智能產業專題研究報告》科大訊飛的綜合實力和成長能力遠超同行業競爭者,獨占第一梯隊。
無論是從市占率,還是技術實力等方面來看,科大訊飛在語音領域都處于寡頭地位。在語音之外,事實上,CV領域科大訊飛也有著領先優勢,取得了非凡的成就,如科大訊飛在計算機視覺頂級會議CVPR 2019和文檔分析與識別頂級會議ICDAR 2019的多項評測任務中獲得冠軍;在ICPR MTWI圖文識別挑戰賽中包攬了全部三項任務的冠軍等等;在2021年輕量級文字識別技術創新大賽中,科大訊飛以復雜自然場景83.29%的正確率,取得第一名。
我們也不難看出,科大訊飛除了NLP強,CV也同樣很強,但相比于NLP,其在CV領域一直比較低調。一方面,在語音市場市占率超過60%的市場地位讓業界對科大訊飛形成了固有的認知,疊加消費業務重點布局語音市場,也潛移默化的削弱了其在CV領域的聲量。除了這一客觀因素之外,也有科大訊飛的主觀因素。
作為深耕AI行業20余年的龍頭企業,對于AI本質的理解肯定是更加深刻與完善的,自然也有更加超前的戰略眼光,從其在2008年就展開了在計算機視覺領域的布局也不看看出這一點,即科大訊飛長遠的布局邏輯是多元布局、單點突破,再實現系統性的創新能力,從而實現自身的跨越式發展,帶領行業提前進入下半場。
至此,我們也可以明顯看出背后的邏輯,從行業角度來看,行業對AI能力的需求逐漸進入集成化時代,且無論是CV賽道,還是NLP賽道在技術上都已實現了重大突破,大規模落地應用,下一階段的重點多項技術的集成化;對于科大訊飛來說,雙賽道布局,且底層技術邏輯相互借鑒共用的思路,能更加快速地實現集成化發展。
不可忽視的是,新階段,必然是新領域、新的解決方案,所以AI行業持續的投入還在繼續,縱觀全球范圍,目前的AI企業大都以單點突破為主,在后續的發展中缺錢依然是常態,而科大訊飛除了先發優勢,也是最不缺錢的那一個。搶占先機、掌控主導權,似乎科大訊飛已經勝券在握。
也同樣,在下半場的國際競爭中,也為中國AI市場贏得了新的提前進場的入場券,而美國以“拉黑”企業阻礙中國AI持續領先的計劃,怕是又要落空了……
請登錄以參與評論
現在登錄