
烽巢網(wǎng)23日新聞,“人工智能”一詞從一開始就被用于視頻游戲,但它很少意味著真正的人工智能。相反,它是一個通用術(shù)語,用來描述一個預(yù)先編程的對手或一個假裝聰明的角色,但實(shí)際上只是遵循一套狹窄的指令。不過,這種情況正在慢慢發(fā)生變化——那些制作視頻游戲的人正在幫助他們。
在今天的GDC上,EA宣布他們已經(jīng)在2016年的WWI射擊戰(zhàn)場1中訓(xùn)練AI特工。該公司表示,這是第一次這樣的工作已經(jīng)完成預(yù)算的AAA級標(biāo)題(這是有爭議的),但更重要的是,它說它的方法的發(fā)展將有助于改善未來的游戲:提供更嚴(yán)格、更現(xiàn)實(shí)的人類玩家的敵人,給開發(fā)人員調(diào)試軟件的新方法。
與機(jī)器人不同的是,EA的人工智能代理將學(xué)習(xí)如何玩,而不是僅僅遵循指令,而是采用了兩種標(biāo)準(zhǔn)方法的結(jié)合:模仿學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。這兩項(xiàng)工作都和你預(yù)期的一樣。第一部分是觀察人類球員,然后試圖模仿他們。EA告訴我們,這大約占了他們知識的2%,并使他們走上了正確的道路。
在最初的學(xué)習(xí)完成后,經(jīng)紀(jì)人必須自己找出游戲的剩余部分,并獎勵完成任務(wù)(比如殺死敵人),幫助他們經(jīng)歷一個不斷嘗試和犯錯的過程。強(qiáng)化學(xué)習(xí)。EA的經(jīng)紀(jì)人以加速的速度玩了成百上千的戰(zhàn)場游戲,并隨著時間的推移而提高。它類似于DeepMind訓(xùn)練它的go -play AI的方法,盡管后者更注重戰(zhàn)略思維。
你可以看到機(jī)器人在下面的行動:
在對《邊緣》的采訪中,該機(jī)器學(xué)習(xí)部門的負(fù)責(zé)人馬格諾斯·諾丁說,人工智能的特工們被證明是很有能力的戰(zhàn)場玩家,但絕對沒有人類那么好。“我們確實(shí)對內(nèi)部骰子開發(fā)人員進(jìn)行了測試,他們是正派的,但不是專業(yè)人員。他們輕而易舉地?fù)魯×藱C(jī)器人,但這并不是一次徹底的失敗,”諾丁說。
在訓(xùn)練過程中,機(jī)器人學(xué)會了各種技能。例如,他們學(xué)會了如何調(diào)整瞄準(zhǔn)槍的目標(biāo),并且被證明非常擅長躲避子彈。“為了不被擊中,它們從一邊跳到另一邊,”諾丁說。
但他們的一些行動表明,在人工智能代理能夠像人類一樣自然地玩電子游戲之前,還有多遠(yuǎn)。諾丁解釋說,這些機(jī)器人開發(fā)了一種特殊的“掃描”行為,在那里他們會四處尋找與之互動的東西。這是因?yàn)樗麄兘邮芰藦?qiáng)化學(xué)習(xí)的訓(xùn)練,如果他們的成績提高了,或者他們獲得了多余的健康和彈藥,他們就會獎勵他們。后一種獎勵被加入,因?yàn)镋A的研究人員認(rèn)為它會鼓勵代理商探索地圖(以及幫助他們生存)。但它也有限制其野心的副作用。“當(dāng)他們沒有看到任何敵人時,他們就會開始搜尋一些事情來做,”Nordin說。你可以把它想象成一只狗在尋找食物,因?yàn)樗軣o聊。這不是不明智的行為,但也不是那么聰明。
“比賽越復(fù)雜,挑戰(zhàn)就越好。”
Unity的高級機(jī)器學(xué)習(xí)工程師Arthur Juliani說,EA的工作與之前在這個領(lǐng)域的研究相似,但仍然是可靠的。“結(jié)合這些方法,并證明它們可以用來訓(xùn)練可以在真正的游戲中部署的特工,這是一個令人興奮的前景,”Juliani告訴The Verge。他指出,OpenAI和DeepMind等機(jī)構(gòu)的研究人員正在致力于打造他們自己的機(jī)器人,比如《星際爭霸2》和《Dota 2》。“游戲越復(fù)雜,挑戰(zhàn)就越好,”Juliani說,不過他補(bǔ)充說,傳統(tǒng)游戲?qū)τ?xùn)練新類型的行為仍然非常有用,因?yàn)樗鼈冊谟?jì)算上的強(qiáng)度更小。
Nordin承認(rèn)在像國際象棋和圍棋這樣的游戲中所做的人工智能工作,強(qiáng)調(diào)了像戰(zhàn)場一樣的第一人稱射擊游戲的復(fù)雜性。在棋盤游戲中,你有一個完整的世界模型和有限數(shù)量的可能結(jié)果,這是一臺計(jì)算機(jī)可以詳盡地建模,然后選擇最好的選項(xiàng)。在射擊游戲中,玩家必須同時按下多個鍵——行走、奔跑、蹲起、開火、重裝、交換武器等等——以及所有這些可能的動作,以及試圖預(yù)測他人動作的組合,使得任務(wù)變得更加復(fù)雜。
對于EA來說,其目的不一定是要進(jìn)一步開發(fā)AI的一般領(lǐng)域,而是要了解這項(xiàng)技術(shù)如何為游戲開發(fā)者帶來好處。諾丁說,他不認(rèn)為我們會看到人工智能球員在一段時間內(nèi)對人類產(chǎn)生影響。“他們不會進(jìn)入下一個戰(zhàn)場,因?yàn)槟遣皇呛苓h(yuǎn)的地方,但可能是在那之后——作為傳統(tǒng)人工智能和神經(jīng)系統(tǒng)的混合體。”
請登錄以參與評論
現(xiàn)在登錄