
題圖來自視覺中國
文源:虎嗅
9月21日,科大訊飛被鋪天蓋地的報道指責“AI同傳造假”。晚間8點,科大訊飛還舉行了電話會議來回應這件事。
簡單的事件回顧
知乎用戶、同傳譯員Bell Wang爆料,科大訊飛在現場和直播中展示的“AI同傳”,用的其實是自己人工同傳翻譯的結果。
Bell Wang在標題里用了一個大大的問句:科大訊飛,你的AI同傳操(qi)作(zha)能更風騷一點嗎?還表示自己“被深深惡心了一把”。
Bell Wang表示,科大訊飛展示的翻譯成果,其實都是語音識別的自己和搭檔的輸出。而讓其最不能忍的,是在科大訊飛“知領”直播的內容中,放的也是自己翻譯的內容文本,但是里面出現的聲音卻是機器人的。
感到被“欺騙”的Bell Wang表示自己介意的是這些事情:
科大訊飛事前沒有告訴其有語音識別的字幕;
沒有告訴其直播的同傳是機器朗讀他們翻譯識別出來的文稿;
更沒有征得其同意就冒名使用了自己的翻譯成果。
訊飛火速回應:我們是人機耦合
事情發酵之后,科大訊飛火速回應同傳造假:我們從來沒提過AI同傳的概念,始終強調是人機耦合的模式,人工智能目前還無法替代同傳,人機耦合才是未來發展之道。
其還向媒體用公開信的形式回應道:
科大訊飛智能會議系統主要提供兩種解決方案,一種是離線翻譯,現場全自動翻譯并同步展示在屏幕上,沒有任何人工同傳參與。比如在9月17日上海舉辦的2018人工智能大會上,現場十幾位發言嘉賓中有三位嘉賓的演講用了人機協作轉寫同傳老師語音的方式,其余均采取全自動機器翻譯。
另一種是僅提供會議轉寫上屏服務,主辦方考慮到大會專業技術背景,專門配備了專業同傳譯員,訊飛僅需提供語音識別技術,轉寫譯員翻譯結果并在會場大屏呈現,同時應主辦方要求,在直播中合成識別結果。
“關于同傳譯員對于科大訊飛的誤解,我們認為是對會議服務方面的分工溝通了解不清,目前我們已經委托會議主辦方進行溝通,希望盡快消除誤解”。
下午,科大訊飛執行總裁胡郁也在朋友圈回應道:“人機協同的訊飛聽見,動了誰的奶酪?”“事情還真的得說得更清楚一點才行,有則改之,無則加勉。”
關于AI能不能代替人的話題已經討論的夠多了,短期內應該是不會有什么確切的答案了。但AI同傳目前到底做到了什么程度?你可以移步虎嗅文章《AI同傳“翻車”,其實是人類自己恐懼》了解一下。
科大訊飛電話會議回應一切
晚上8點,科大訊飛針對該事件召開專門的電話會議,除了強調了上述科大訊飛回應的內容之外,科大訊飛高級副總裁江濤、科大訊飛翻譯產品經理劉晨璇還對另外一些問題進行了解答。
科大訊飛方面表示,在9月20日的“2018創新與新興產業發展國際會議”(IEID)的主會場上,董事長劉慶峰曾在該會議的主會場上介紹了科大訊飛兩套會議同傳系統方案的不同。他說:“凡是大家看到科大訊飛這個翻譯屏幕上沒有兩種語種只有一個語種的,就是人機耦合的,我們希望機器幫助我們頂尖的同傳更好地發展他的能力。”
而“Bell Wang”參與的是高端裝備技術與產業分會的分會場,科大訊飛表示,可能是該名同傳譯員并未聽到劉慶峰的介紹,造成了誤會。
科大訊飛方面強調,從來沒把同傳人員的翻譯包裝成訊飛的機器翻譯。
根據機器之能的報道,對于媒體提出的“科大訊飛直接采用同傳譯員的翻譯,是否侵犯了同傳譯員的知識產權”的問題,科大訊飛高級副總裁江濤表示,主辦方更適合來處理和決定同傳譯員的知識產權使用問題,而科大訊飛只是針對會議進行技術支持,并沒有直接對接同傳工作人員,只是按照主辦方的要求完成技術支持工作。
而到底什么是“人機耦合”,劉晨璇對此解釋道:人機耦合主要指科大訊飛的機器翻譯模式,包括兩種,一種是除了機器承擔語音識別工作外,在翻譯過程中,機器輔助人工進行同傳工作,包括提示關鍵單詞的解釋和顯示英文轉寫字幕;第二種是直接轉寫同傳翻譯的結果,并配上字幕顯示。而兩種模式的選用由客戶方指定。
科大訊飛強調,嘉賓在臺上用英語發言,機器能夠將轉寫的英文顯示在同傳的顯示評上,提供完整的發言內容信息。此外,機器還會針對關鍵信息進行解釋,降低同傳口譯的工作強度,減少同傳口譯的信息遺漏。
江濤同時還表示,即使訊飛的機器翻譯將在明年達到專業八級的程度,也無法替代同傳。“科大訊飛從來沒有在產品上使用‘AI 同傳’的描述”。科大訊飛的翻譯機產品只是提供交傳方案,現在的機器翻譯技術還不能達到同傳的效果。
因為同傳需要對翻譯所涉及的領域進行認知和洞察,要理解說話人的意圖,機器和人工智能在短時間內還做不到。
騰訊旗下的興趣內容基金(TOPIC)領投差評消息傳出后,讓曾經多次被指責洗稿的后者成為科技自媒體圈的眾矢之的。面對各界的批評,騰訊方面表示將重啟盡職調查,如屬實將考慮撤回投資。
事件中的另一個主角差評則火力全開反駁外界的質疑,連續發出六篇文章為自己辯護。結果引來更多的批評,過程大家應該都知道。但事情突然回轉,今天凌晨差評推送了一篇疑似道歉和解的文章,這個“變臉”有些快,只怕大洋彼岸的川普也自愧不如。
差評今天凌晨推送的這篇文章很有意思,充分地反映了差評團隊的水平和立場。
文章的正文幾乎都是中文,但卻起了個英文標題“TO BE BETTER”,洋氣十足。然后開頭就洋洋灑灑地羅列了一堆數據,自己六條反駁的文章在短短72小時獲得了多少閱讀、點贊和留言,似乎是在在工作總結大會炫耀自己的影響力,對質疑者宣示看看有多少粉絲在支持我;我好奇的是差評為啥不把這72小時增加的粉絲數量也曬出來呢,豈不是更有說服力?然后用大篇幅講述自己如何努力地為用戶創作優質內容的過程,大談責任和重擔,說實話看了確實有幾分感動。文中沒有向外界就關注重點——洗稿問題致歉,但卻“大度”地在個別細節向原作者表示了歉意。
看起來好像是一篇道歉的文章,但通篇都小心翼翼地設法回避外界的質疑和問題,以維護自己的品牌形象,可謂是用心良苦。
不少人第一反應就是:差評終于被大家群毆打醒了,開始認識到自己的錯誤。只可惜事實并非如此,盡管變相地承認了自己存在著偽原創的事實,但差評真正沒有認識到自己的錯誤,更遑提深刻反省。除了推出了幾條形式上的整改措施外,整個事件中沒有任何人對洗稿問題負責,也沒有任何一個人因此受到內部處罰。
我們來看看差評最后鄭重其事地提出的“整改”方案(注:以下文字引自差評原文,以確保本人原創不被爭議,特此聲明):
1. 純線上采編,無獨立觀點的整合綜述類文章,我們將不標記原創標,并按照學術論文形式,在文末標記參考資料來源出處。2.純線下采編,占據一手的材料,無論是否產生觀點,均標記為原創文章。3.臥底類文章,如全部圖片材料,均為一手資料,我們均標記為原創文章;如不是一手的,則不標原創標,并按照學術論文形式,在文末標記參考資料來源出處。4.外網編譯類文章,均不標記原創標,如需要支付版權費用的,我們會支付版權費用;若無需支付版權費用的,按照學術論文形式,在文末標記參考資料來源出處。5.熱點分析類文章,視觀點獨立與否,判定是否標原創標,并按照學術論文形式,在文末標記參考資料來源出處。6.引用類段略,文中標注引用來源,并按照學術論文形式,在文末標記參考資料來源出處。盡可能跟對方聯系取得同意。
與羅永浩前不久重新定義了“重新定義”一樣,差評這次則重新定義了“洗稿”,那就是將洗稿這個不雅的稱呼改為高大上的“線上采編”,將自己的洗稿文章美化為了“整合綜述”。差評既沒有承認以往的洗稿行為,更沒有為此道歉,當然也不必要承諾今后不再洗稿,線上采編和整合綜述類的內容還是接著做的。
結合整篇文章來看,差評的意思已經非常明白:以前的事情我沒錯,非要有的話我頂多就是沒標記來處、拿去申請原創了;既然沒有錯,那類似的行為我就不可能停止,但大家放心我以后會更加小心,也不會去申請原創標識。我已經讓步很大了,騰訊的投資都要被你們攪黃了,你們還想怎么樣?
我憑自己本事洗的稿,憑什么要道歉?
此前,差評曾推出了6篇文章反駁外界對其洗稿的批評,態度之強硬讓人吃驚。當時業界對此的看法有兩種:一是認為差評公關應對失誤所致;二是認為差評無法承擔“承認洗稿帶來的巨大負面影響”,擔心會導致嚇走投資人今后難以融資、失去粉絲的支持業務下降,所以在公眾面前選擇硬抗到底。
不過,也有一部分提出了另一種觀點,認為差評強硬反駁是在故意事件營銷,以擴大影響從中吸粉獲利。
差評不是純粹的科技自媒體,而是做得還不錯的內容電商。它在選品、種草營銷上非常有心得、能力超強,遠勝于其科技評論內容生產能力。這一點甚至得到了很多批評它的科技自媒體的認可。近年來差評在黑店、淘寶等電商平臺連獲大獎,據說月流水早就達到了數百萬,近來或突破千萬元大關,曾經在黑市創下了16小時GMV破百萬的記錄,靠的就是數十萬粉絲的支持。
差評更像一家內容電商公司,而且表現不俗
因此,與其說差評粉絲是科技評論文章的讀者,不如說他們是追逐時尚潮貨的年輕電商用戶群體。而據說騰訊基金看中差評的價值主要就在于其內容電商能力,而這塊恰恰是騰訊所欠缺的部分。
洗稿風波看似對它不利,其實不然,把事件搞大能擴大其品牌知名度的影響,知道的人越多,對其未來的運營越有好處。這與當年王自如輸給老羅卻提高知名度、帶動業務上升如出一轍。
這么做也有風險,但與提高知名度的收益相比很小。即便被人把它告上法庭,目前情況下很難判定侵權成立(霍炬案就是例子),即便敗訴也賠不了幾個錢,在經濟上幾乎是零風險。頂多在科技者群體中臭了名氣,就算全部取關又如何,也不會動搖差評的用戶基本盤(否則差評不會如此底氣十足,有人將此稱為挾粉自重,實不為過)。唯一有所顧忌的是,要是這次騰訊投資黃了或可能影響其他機構的投資意愿。不過其他投資機構不是騰訊就沒有類似的價值觀包袱,實際的影響也不會太大。只要把用戶、營收和利潤數據做上去,還是會有人來送錢的。
作為強調洞察人性運營的新媒體,差評顯然知曉其中的利害關系,不愿錯過這百年難得一遇的拉新大好機會。因此,我認為差評故意事件營銷擴大影響的概率要大得多。
更值得注意的是,很多人反映《TO BE BETTER》這篇所謂道歉文章在打開的歷史消息中不可見。于是我也關注了此號(之前只聽過它洗稿的傳聞,但從來沒關注過,應該不在它的黑名單中),發現的確沒有今天凌晨的最新文章,第一條仍是上次推送的《5000人的朋友圈是有局限的》那篇文章。
《TO BE BETTER》疑似未公開推送給所有用戶
如果不是公眾號系統問題的話,我想應該就是差評對《TO BE BETTER》采取了定向推送。差評應該僅向它后臺設置的某個或某些組別(比如忠實粉等)定向發布,而非全部人可見,因此其他人包括后來的新用戶無法正常在歷史消息中看到。這么看來,《TO BE BETTER》這篇文章并不是寫給所有人,只是差評對忠實粉絲作出的一個交代。
也就是說,至于包括科技自媒體在內的“同行”其他人的看法,差評或本來就不在意和理會。
這次科技自媒體群起批評差評只是長期以來被壓抑的一次集中爆發,同時有一定的偶然因素,比如領投方恰好是騰訊的內容基金,被投資對象則是曾經多次卷入洗稿風波的差評,這兩個對象換成其他人可能結果都不太一樣。當然差評的挑釁死硬態度也是很重要的原因,比如我其實本來不想寫,結果被今早他們的“道歉文”感動了寫了本文。
誠如一些為差評辯論的人所言的那樣,差評不是洗稿最多、洗稿行為最惡劣的一家,類似的做號者多如牛毛。但現實卻是,絕大多數自媒體作者面對侵權寧可選擇忍讓或僅限于吐槽撕逼,卻很少有人通過法律途徑為自己討回公道?無非是以下兩個主要原因:
1、維權訴訟的綜合成本很高:內容侵權標的價值不大,直接的訴訟費用并不算多,訴訟成本主要高在請律師和時間成本之上。由于調查取證、寫起訴書、起訴應訴等環節都比較專業,大部分人難以應付,必須找專業律師,而律師費目前都在數千元起,對于被侵權的普通作者來說這是一筆不菲的費用。此外,當事人還需要為此付出很多時間和精力,機會成本同樣非常可觀。即便獲得了勝訴,以目前國內法律的賠償標準也無法攤銷成本。
2、法律相對滯后,贏得訴訟的概率低:之前因為洗稿事件霍炬憤而起訴,索賠1元只為討個說法。結果一審敗訴,霍炬不服上訴,二審仍然敗訴。與法院的判決相反,自媒體和業內普遍認為差評文章是顯然的洗稿,因為素材、內容和行文結構都一致。國內法律體系雖然不是判例法,但典型案例的判決方式同樣會對今后類似案件的判決產生重要的影響。
我不是說法院在霍炬案的判決中存在過失,可能是現行法律滯后導致無法可依,但顯然這個判決對于內容版權保護造成了非常不利的后果。
經濟上學有一條定理,說是人們會對激勵作出相應的反映。業內公認的洗稿被判無罪,這個典型案例就成了內容產業的一個激勵措施。一方面它大大降低了侵權風險和犯罪成本,激勵洗稿群體更加瘋狂作案;另一方面由于勝訴概率太低,內容創作只好無奈放棄維權,以免反受其辱(霍炬案判決結果就被差評作為自己沒有洗稿的法律證據)。因此,在霍炬號召被侵權者去法院起訴時,并沒有人站出來響應,實屬是非常無奈的事情。
洗稿抄襲猖獗,有待于法律機制的完善
針對內容創作屢屢被侵權,著名科技自媒體作者羅超認為內容平臺要更加有所作為,加強對作者和原創版權的保護。這個觀點我也很贊成,關于平臺方面的改進就不贅述了。
但是也要清醒地看到,光靠內容平臺的改進還是遠遠不夠的。一來內容平臺難以解決跨平臺的保護問題,特別對打時空差的洗稿行為無能為力;二來平臺不具備執法權,內部處罰的力度不足以起到震懾。因此,內容創作保護無法脫離現有的知識產權大環境,保障知識產權還需要完善相關法律和機制。
我的幾個建議,可能不是很成熟請大家補充完善:
1、現有的知識產權保護法律存在著一定的滯后和漏洞,洗稿作為新興的侵權行為應該盡快列入法律并明文禁止;大幅提高內容侵權行為的經濟賠償額度,增加侵權者的犯罪成本,以保護更多的作者;明確內容平臺的監管權限和職責,形成較為規范統一的互聯網內容聯動保護機制,一個內容平臺侵權全網信息可查,讓侵權者無處循形。
2、鑒于目前侵權訴訟流程長、成本高的特點,適當簡化相關流程,比如成立專業的知識產權法庭,可以在線提交證據,簡單案件甚至可在線審理判決。
3、充分發揮社會專業力量的優勢,降低司法成本,在法院體系之外授權成立民間的行業仲裁機構,提供更專業更便利的服務,對仲裁結果不服可再提交法院訴訟解決。
互聯網內容產業蓬勃發展,已經成為內容創作的重要平臺。沒有良好的程序和機制,保護原創作者的合法權益就只能淪為空話。在推動保護知識產權的法律機制完善上,互聯網企業的大佬是具有一定能力的。他們中很多人是地方或國家的兩會代表,希望今后能看到他們提出相關的提案。
不管差評基于何種原因考慮而強行收尾,但我覺得關于內容創作保護的討論不能到此為止,應該督促各方拿出真正的行動來。否則這次科技自媒體集體批評差評之后,留下的仍是一地雞毛,什么也沒有改變。
]]>