近日,2023年高考落下帷幕,“用AI寫高考作文”的話題也備受熱議。2023年,受ChatGPT熱潮的影響,國內的AI大模型產品也如雨后春筍。例如,百度、阿里、360等互聯網巨頭企業均相繼推出文心一言、通義千問、360智腦等AI大模型產品。
與此同時,一些深耕教育AI賽道的玩家也不甘人后,借助AI大模型,將其原本的優勢得以釋放。作為智能語音和人工智能賽道的上市企業,科大訊飛推出的大模型產品訊飛星火,也在這波AI熱潮中備受關注。
那么,與高考與教育賽道高度相關的訊飛星火,實際寫作水平與使用體驗如何?筆者對其進行了高考作文相關的系列提問。通過親測體驗,發現這確實是一款十分智能的AI大模型產品。雖然也有一些美中不足的地方,但是也可謂瑕不掩瑜。
瑕不掩瑜,真實水平或不敵優等生
首先,筆者以全國甲卷為例,與科大訊飛星火認知大模型進行了對話。該卷作文題目是:人們因技術發展得以更好地掌控時間,但也有人因此成了時間的仆人。這句話引發了你怎樣的聯想與思考?請寫一篇文章。
筆者將該高考作文的要求,全文輸入訊飛星火。訊飛星火的“高考作文”如下:全文一共855字,回答時間在30秒以內。
圖源:訊飛星火認知大模型
通過輸出的內容可以看出,科大訊飛星火對于提問的語義理解基本正確,行文的邏輯也十分順暢,例如,在如何正確的利用時間方面,訊飛星火采用了“因為......所以”等表達方式,可謂有理有據,同時行文的措辭表達也非常的口語化,并沒有多么華麗的辭藻與晦澀難懂的句子。
不過,作為體現考生寫作水平最重要的考試,高考作文還會考查考生作文的立意新穎程度、文字功底等。而如果從這些角度去評價訊飛星火的“高考作文”,也不難看出其存在的明顯不足。
首先,在立意方面。訊飛星火用“時間”是把殺豬刀為題,雖然通俗易懂,但是未免過于普通,甚至讓人覺得有些敷衍套作的意味。
其次,文章中有多個論點,例如“時間很重要”、“我們應該學會利用時間”、“應該勞逸結合等”。只是,這些觀點的論據,都帶有一定的說教意味,既沒有引經據典,也沒有太多實例輔助讀者理解,因此論據也顯得不夠具體和有說服力、更缺少文采。
雖然文末舉了兩個例子,但是沒有插入到文章對應的觀點之中進行佐證,也顯得不夠完整。為了驗證訊飛星火的智能性,筆者繼續對其進行提問,試圖讓其再寫一篇立意更新穎、更有深度的文章。全文如下,一共827字,回答時間同樣在30秒以內。
通過全文內容可以看出,這次的“高考作文”在內容方面,更加接近筆者的需求。例如,行文中用到了莎士比亞、愛因斯坦、愛迪生、喬布斯等名人名言。
只不過,除了前兩位名人關于時間的名言能夠對其觀點進行佐證外,文章中引用的愛迪生與喬布斯的名言卻與觀點關系并不大,因此依然顯得說服力不足。由此可見,雖然訊飛星火理解了作文題目要求的語義,但是在引經據典的作文要求方面,還是有“套作”的嫌疑。
據筆者親測多款大模型產品,發現這類產品“套作”的現象十分普遍。因此有網友分析表示,或許AI大模型產品并不理解“套作”的含義。按照一些網友的理解,套作指的是不能生搬硬套、套公式套模板。因此,也有網友評價訊飛星火自動生成的文章過于普通,更像是一個普通初中生的作文。
除此以外,筆者發現,大多數大模型產品的“高考作文”,體裁都是議論文。因此,也試圖讓訊飛星火換一種體裁與風格,試試訊飛星火寫作更加生活化的話題作文的水平。于是,又以2023年新課標I卷關于“故事”的話題作文,來對訊飛星火進行測試。
將作文題目全文輸入訊飛星火,輸出的文章字數是763字,文章的中心思想是:故事有力量,而好故事的意義與價值是多方面的。全文也非常有層次的進行了逐個論點的陳述、佐證。而佐證的內容,主要是引經據典,通過古代、近現代的文學作品進行舉例說明,從而得出結論。
不過,全文體裁看起來,依然是一篇議論文。筆者認為,現代元素還是少了一些,依然具有很強的說教味道。如果能夠結合好故事給身邊親友帶來的改變來舉例說明,或許遠比只是提到那些文學作品,更有說服力。
體驗過關,但美中有不足
好在訊飛星火在功能體驗上,比市面其他大模型產品,更加體貼入微。例如,除了查看歷史提問、新建對話等,而且相關菜單也放在了十分顯眼的位置,避免用戶無法快速找到歷史對話記錄,還可以一鍵選擇“重新回答”。
于是,筆者試著換一種提問方式,并試著連續發問。不過親測發現,科大訊飛星火似乎不太支持連續發問。
對于筆者針對上一篇作文的疑問,訊飛星火也采用了“忽略”的處理方式。沒有正面回答筆者關于對上一篇“高考作文”不滿意的回答,而是直接重新寫了一篇文章。
值得驚喜的是,這次輸出的關于“好故事”的作文,終于不再是議論文了。而是很具生活化,列舉了很多實際生活案例的一篇文章,因此讀起來也更加像真實考生的創作。
由此可見,AI大模型產品輸出的內容如何,關鍵還在于用戶如何提問。在訊飛星火能夠全面理解用戶提問的語義基礎上,只要提問的內容足夠具體、要求合理,訊飛星火是能夠輸出用戶真正想要的內容的。
不過,美中不足的是,訊飛星火在理解用戶的提問意圖時,還是存在一些明顯的偏差。例如前文的多次測試中,明確要求作文需要自擬題目,字數不少于800字。但是訊飛星火實際輸出的作文,既沒有標題,字數有時也不及800字。通過親測對比其他大模型產品,這種問題也相對普遍。
由此也可以預見,未來大模型產品如何更加精準的進行語義理解,將是非常重要的競爭力之一。
人類未來需要什么樣的AI大模型產品?
測完訊飛星火大模型產品的智能程度、用戶體驗,我們不妨從用戶角度來看,人類到底需要什么樣的大模型產品。首先,我們來看看訊飛星火是怎么回答這個問題的,也非常有意思。
通過訊飛星火的回答,不難看出,這些因素確實是用戶未來十分關注的優化方向。只是,在這些特點之前,如何建立機器人與人類之間的良好溝通,才是第一步。
這正如不同國家的人,使用不同的語言,如果沒有翻譯機,彼此又不懂他國語言,那么就是雞同鴨講,自然得不到正確的反饋。因此筆者認為,所有的大模型產品,未來首要需要解決的,便是如何正確地理解人類的基礎語言,包括隨著時代變化而產生的新詞匯、網絡語言、口語、方言等。
難能可貴的是,科大訊飛一直深耕智能語音和人工智能賽道,其翻譯機產品在全球暢銷,便是其對不同語言轉換技術的有力印證。因此,對比之下,訊飛星火相比其他大模型,理論上具有更強的技術研發能力,能讓訊飛星火目前存在的一些瑕疵進行優化迭代。
而在各個互聯網科技大廠都紛紛推出大模型產品之時, 今年高考的“作文大賽”,既是一個練兵場,也是一塊試金石。在各個大廠集體奔赴考場時,誰負誰勝已經不再重要,重要的是借助這次契機,大廠的AI大模型存在什么利弊,或許各大玩家心知肚明。
非常有趣的是,當筆者試圖提問訊飛科技,AI大模型產品哪家強之時,其回答非常的“圓滑”,也非常的低調,并沒有宣稱自己就是行業第一,甚至在回答內容里,提到的都是別家的產品,都沒有提到“訊飛星火”。如果用調侃的語氣來看這樣的回答,科大訊飛這種“低調務實”的精神,還是值得肯定的。
人類的進步,永遠都是思想的突破。人工智能的應用,目前還只是萬里長征的第一步。雖然離人們想要的完美尚有距離,但是一定會向著人類想要達到的效果邁進。
結語
作為教育AI賽道的玩家之一,科大訊飛顯然是更懂教育、更懂學生的。因此,相比一些大模型產品面向的行業大而全,訊飛星火在AI大模型集體寫作文這個熱門事件上,幾乎是獨一無二的存在,因此訊飛星火在受到更多關注的同時,也將背負著更多人的希望。
我們相信,在AI大模型的應用越來越成熟的同時,其逐漸向行業垂直,走向專業化、生態化也將成為必然,而科大訊飛不僅能將訊飛星火用在其學習機等AI硬件產品上,更將因為其開放性,而為教育行業添磚加瓦、增色添彩。