AI技術的升級迭代,讓整個社會的發展,日新月異。近日,繼6月初科大訊飛在24周年慶上,發布了訊飛星火認知大模型(以下簡稱訊飛星火)V1.5后,訊飛星火又升級至2.0版本。
據了解,訊飛星火上次更新,主要升級了多輪對話,邏輯和數學能力等。此番更是發布了其代碼能力和升級后的多模態能力的突破,同時發布了搭載訊飛星火的編程助手、教師助手,升級學習機、訊飛智作2.0等多項應用和產品。
?圖源:訊飛星火2.0發布會現場
科大訊飛董事長劉慶峰、研究院院長劉聰對升級版的訊飛星火,充滿信心。劉慶峰表示,代碼能力是支撐認知大模型智慧的關鍵維度,多模態能力則是實現通用人工智能的必經之路,也是科大訊飛既定的人工智能技術長期戰略,大模型賦能個體和行業的大未來正在到來。
作為與綜合性互聯網平臺有著不同定位的訊飛星火大模型,其實際能力如何?我們接下來從多個維度進行評測、分析對比,或許可以看出訊飛星火與其他大模型平臺的差異化之處,以及訊飛星火更廣泛的應用價值與市場價值。
多模態能力加持,操作體驗升級
AI大模型作為生產力工具,其實際使用體驗、內容輸出的模態,也是決定其市場競爭力的關鍵。與其他大模型產品只覆蓋了部分終端相比,訊飛星火同時支持五端(安卓、IOS、小程序、PC、H5),加上這次基于多模態能力的升級,其操作體驗也更進一步。
過去,科大訊飛在AIGC上的布局了三大模塊:音頻創作、視覺創作和文本創作。而音頻創作,更是訊飛星火的基本盤。在此基礎上,訊飛星火也逐步完善了其以虛擬人為核心的完整視頻創作能力。
據了解,訊飛星火多模態是指將多種模態信息輸入到同一個模型中進行訓練,從而使模型具有多種不同類型的數據處理能力。而多模態輸入包括文本、圖像、聲音、傳感器等多種數據。
而在虛擬人多模態合成方面,科大訊飛從2018年首發多語種虛擬人口唇驅動,2021年發布了2D真人捏臉系統。目前已經形成了3D虛擬口唇表情和動作的AI驅動到AI貫穿3D形象構建的全流程。
據了解,虛擬人領域的關鍵技術是動作生成,也就是如何讓虛擬人的肢體語言與其輸出的內容對應。而該項技術的關鍵因素之一是語音發音中的韻律節奏、另一個就是動作意圖。
針對這一難點,訊飛星火針的解決方案是對這兩部分進行建模,能夠很好實現動作合成。據中國AIGC產業峰會數據顯示,訊飛研究院提出的語義驅動虛擬人動作技術,在虛擬人動作的擬人度和契合度方面,都較傳統方案有很大改善,從2.63分提升到3.75分左右。
圖源:中國AIGC產業峰會數據
訊飛星火目前也在進一步優化半身數字人像生成技術以及3D虛擬人的動態生成技術。值得一提的是,近兩年科大訊飛研究院打造了個性化3D虛擬人復刻系統,實現了基于一張圖片、一段語音就能驅動3D虛擬人,同時還支持3D虛擬人發型、眼睛、嘴型進行動態二次編輯。
例如,向訊飛星火發出一段文字、一張圖片、一段語音就能驅動3D虛擬人,而加一些對虛擬人的形容詞進行描述,就可以對數字人的形象進行“定制”,甚至實現個性化“復刻”。
對比發現,目前訊飛星火目前將各種多模理解、多模生成的能力實現統一、進行多模輸入和輸出的大模型產品,在市面依然十分少見。例如,百度文心一言目前只有文-文、文-圖,不支持虛擬人視頻生成,甚至其PC端目前并不支持圖片上傳,僅有APP端支持圖片輸出,相關能力應用也是。
不過,今年6月,例如商湯科技發布了如影App,也可以提供豐富的視頻創作素材庫,用戶只需選擇喜歡的視頻模板,輸入文案,就可一鍵生成知識分享、品牌宣傳、短視頻帶貨、培訓宣講、熱點資訊等各類數字人視頻。
只是,像訊飛星火這樣能將多模態內容生成融為一體,在一款產品中集中呈現,在業界依然十分罕見。在AI大模型的研發成果與實際應用產品布局方面,訊飛星火已經快人一步。
場景為王,多場景應用釋放價值
任何技術發揮市場價值,都需要首先結合應用場景,實現其應用價值。AI大模型之所以熱度不減,是因為其確確實實在人們的工作、生活中能夠起到提高“生產力”的作用。因此,此類產品能夠覆蓋多少應用場景,也是其是否能夠獲得用戶肯定、好評的關鍵因子。
科大訊飛一直在強調訊飛星火的場景價值,且正在各個擊破。對于用戶而言,訊飛星火的一大優勢是針對以辦公場景為代表的各類垂直場景中的需求進行了細分,因此對于用戶解決實際問題,也更有針對性,效率更高。
例如,相比一般的大模型產品可以提問、撰文、寫詩、做算術題,訊飛星火還可以創作劇本。但是有些大模型產品卻并不支持。本次實測題目是:請以校園霸凌為題材,寫一部心理劇劇本,角色需要包含老師、同學、家長、校長,場景為辦公室、操場、宿舍、食堂。
測試結果是:百度文心一言、科大訊飛星火就分別按照劇本內容、角色、場景要求輸出了多幕劇,但是通義千問卻明確表示:作為機器人,無法回答此類問題。
圖源:文心一言評測截圖(劇本創作)
圖源:通義千問評測截圖(劇本創作)
圖源:訊飛星火評測截圖(劇本創作)
親測發現,除了在場景覆蓋方面,訊飛星火相對更為全面外,訊飛星火對于用戶輸入語言的情緒感知能力方面,也與其他產品有著明顯的區別。
值得一提的是,多模態能力之外,搭載訊飛星火2.0的訊飛智作2.0等產品,通過文圖生成、圖片理解等,進一步釋放其應用價值。
據了解,借助這些產品,可通過AIGC實現創意視頻制作和后期生成,而訊飛智作APP就是結合了以上很多AIGC能力,訊飛星火試圖將其打造為一個音視頻內容的AI創作基地。
例如,訊飛星火的圖像問答、識圖創作等功能,就是目前市面大模型產品較少具備的。親測發現,新版本的訊飛星火支持上傳圖片,可以進行圖片內容識別、解讀,并且能準確地進行圖片上的算術題目進行精確計算。
圖源:訊飛星火測評截圖(圖像描述、識圖創作)
以2023年高考數學題為例,將下圖中的試題截圖上傳至訊飛星火,并要求其對圖片中的數學題進行計算。短短幾秒鐘,就能輸出其計算過程,并輸出正確結果。
不難看出,由于其豐富的多模態功能,訊飛星火也可以廣泛應用在教育場景下的試卷批改、錯題輔導、錯別字檢測等場景,進一步發揮其優勢。
值得注意的是,目前百度文心一言(PC端)、阿里通義千問等大模型產品并不支持圖片輸入及圖像問答、識圖創作等,甚至在這些平臺的對話窗口,并無圖片上傳功能。
圖源:訊飛星火測評截圖(圖片識別、解答高考數學題)
另外,在圖片內容生成方面,訊飛星火可以按照語義表達,輸出對應場景的圖片。而通義千問等平臺提示無此功能,而文心一言雖然也具備這樣的功能,但是輸出的圖片內容與提問者所需要表達的意境差距較大,而且畫面不像繪畫那么真實。
圖源:通義千問評測截圖(畫畫、生成圖片)
圖源:訊飛星火評測截圖(畫畫、生成圖片)
圖源:文心一言評測截圖(畫畫、生成圖片)
與此同時,訊飛星火升級后的代碼能力,也可以通過測試對比窺見一斑。不過,親測對比文心一言、通義千問,也都有這些功能,只是相比而言,訊飛星火的代碼更加簡潔,且相關代碼說明也十分詳細,通義千問的代碼與訊飛星火相當,但是代碼編寫說明也是一筆帶過。
對比之下,文心一言輸出的代碼雖然也是正確的,但是實現方式卻相對繁瑣,且只提示了程序運行的操作方式,并未說明編程的思路與原理。
圖源:訊飛星火評測截圖(編程寫代碼)
圖源:文心一言評測截圖(編程寫代碼)
圖源:通義千問評測截圖(編程寫代碼)
由此可見,對比同一梯隊的不同大模型產品,豐富多樣的場景,是訊飛星火的優勢所在,而且這些場景,多數與科大訊飛的教育基因有關。
為了讓開發人員更好地應用星火認知大模型V2.0,科大訊飛專門發布了全新產品“智能編程助手iFlyCode 1.0”。該產品可將五項代碼能力無縫融合到開發環境,同時提供專業的代碼知識服務。
目前,訊飛星火的大模型助手中心,有超過500個垂直場景,2000多個助手,對比通用大模型,可以擁有更精準的結果和更高的效率,并將釋放其在垂直領域的行業優勢。
訊飛星火的智能化水平與應用空間展望
實際上,目前AI大模型產品紛紛競技、秀肌肉后,高下也逐漸明朗。例如,近日,新華社研究院發布《人工智能大模型體驗報告2.0》(以下簡稱《報告》),通過500道題目、對標接受過高等教育的人類水平、更強調對產業和生活的實際價值,嚴格按基礎能力指數、智商指數、情商指數、工具提效指數四大測評維度進行權重設計。
其中,訊飛星火以總分1013分位列本次國產主流大模型測評榜首位,在四大評測維度中的智商指數和工具提效指數兩個維度獲得第一,《報告》認為訊飛星火“在工作提效方面優勢明顯”。值得一提的是,其中參測的8款大模型均為科技巨頭或背靠權威院所,“根正苗紅”的玩家。
而通過權威機構的評測及上文評測可以看出,訊飛星火發揮了其在教育行業的專業性,無論是操作體驗、內容輸出質量、還是語義理解、輸出內容的可讀性、情感表現力都略勝一籌。
值得期待的是,科大訊飛作為教育行業的垂直AI玩家之一,其訊飛星火大模型產品未來的商業應用,還有更大的想象空間。例如,訊飛星火有了生成式AI的基本功能及升級版的智能化特點后,可以在智能硬件、教育互動、商務辦公、居家出行等多方面得以應用。
研究發現,人工智能與各行業的深度融合是促進產業升級和轉型的重要方式之一,而對于AI大模型的價值遠景,業內的共識是,向專業垂直深耕,向行業橫向拓寬,才是其走向商用的未來所在。據訊飛星火2.0發布會時公開的數據,訊飛星火已陸續在教育、辦公、汽車、金融、工業、醫療等行業應用落地,4109個助手開發者團隊開發出7862款星火助手。
在科大訊飛的行業基因驅使下,訊飛星火的全行業布局,也將讓其場景相比其他綜合類的大模型產品,更加豐富多樣。與此同時,得益于其多年的數據沉淀,訊飛星火的機器學習能力也勢必更強,迭代速度也將更快。
正如科大訊飛董事長劉慶峰在訊飛星火2.0發布會上表示:“我們希望通過通用人工智能,極大降低社會創新創業門檻”。這也意味著,訊飛星火不只是教育AI工具,更可以像其廣告語:星星之火,可以燎原。
結語
“群模亂舞”之下,各大互聯網基因的企業爭先恐后入局,但是卻各有優劣。訊飛星火作為獨特的存在,依靠其在教育+AI賽道的深耕沉淀,形成了“以點帶面”,從垂直行業切入,向周邊產業應用延展的獨特發展模式,與其星火燎原的初心遙相呼應,值得行業借鑒,未來可期。
前段時間,攜程也推出了基于旅游行業的首個垂直行業大模型應用。對此,業界人士更傾向于認為,大模型產品是應用與場景為王,結合行業、垂直賽道的大模型,將會有著更大的想象空間。
可以預見的是,作為教育行業最懂AI的玩家,AI賽道最懂教育的玩家,科大訊飛在全方位布局大模型在更多行業的應用之時,也因為其開放性,而加速其商業化的步伐。
作者:尼古
編輯:尼克
免責聲明:本文基于已公開的資料信息或受訪人提供的信息撰寫,但科技四少及文章作者不保證該文章提及或者展示關聯等信息資料的完整性、準確性。在任何情況下,本文中的信息或所表述的意見均不構成對任何人的投資建議。