?">

久久久免费观成人影院,日韩亚洲欧美综合,中文字幕av一区,日本欧美一区二区三区

首頁 > 科學(xué) > 科學(xué)探索

玩躲貓貓游戲 AI學(xué)會攻防術(shù)

2019-09-19 08:07:19

來源: 科技日報(bào)

??? 盡管機(jī)器學(xué)習(xí)在諸如圍棋和Dota?2等復(fù)雜游戲中取得了顯著進(jìn)步,但在這些領(lǐng)域掌握的技能并不一定能推廣到真實(shí)場景中實(shí)際應(yīng)用。越來越多的研究人員正在尋求建立一種機(jī)器智能,使其行為、學(xué)習(xí)和進(jìn)化更像人類。

????總部位于舊金山的OpenAI公司近日發(fā)表的一篇新論文提出,在兒童的“躲貓貓”游戲中訓(xùn)練模型,并在數(shù)以千萬計(jì)的競賽中使它們相互對抗,可導(dǎo)致模型自動發(fā)展出類似人類的行為,從而提高智力并改善后續(xù)行動的性能。

????為什么選擇躲貓貓?

????該論文的第一作者、OpenAI研究員博文·貝克認(rèn)為,躲貓貓被選為一個有趣的起點(diǎn),主要是因?yàn)槠湟?guī)則很簡單。所有游戲中的代理(Agent,也稱智能體,指能自主活動的軟件或硬件實(shí)體)都被模擬為球形對象,可執(zhí)行3種類型的操作:導(dǎo)航、抓住并移動物體、鎖定對象,且只能由該代理的隊(duì)友解鎖。

????研究人員在模擬的、物理接地的環(huán)境中放置了1—3個“躲藏者”和1—3個“尋找者”,房間的邊界是靜態(tài)墻。環(huán)境中還包括不同尺寸的可移動箱子和可移動坡道。

????研究人員使用強(qiáng)化學(xué)習(xí)來訓(xùn)練游戲代理,并遵循簡單的躲貓貓規(guī)則:隱藏者成功躲過尋找者的追逐,或是尋找者成功找到躲藏者。

????AI如何玩躲貓貓?

????在經(jīng)過數(shù)億次的游戲后,AI代理經(jīng)歷了幾個階段的策略發(fā)展過程。

????在初始階段,躲藏者(藍(lán)色)和尋找者(紅色)通過在空間中移動而不操縱任何物體,制定了非常粗糙的躲避和追逐策略。

????在經(jīng)歷2500萬個回合后,游戲變得更加復(fù)雜。躲藏者學(xué)會了移動和鎖定在環(huán)境中的箱子和路障,以在自己周圍建立堡壘,這樣尋找者就永遠(yuǎn)看不到它們了。不僅如此,他們還制定了協(xié)調(diào)戰(zhàn)略,例如相互傳遞物體,以加快建造堡壘的進(jìn)程。

????然而,在游戲進(jìn)行了7500萬回合之后,尋找者發(fā)現(xiàn)了一個反策略。他們學(xué)會了在躲藏者的要塞旁邊移動一個坡道,并用它來爬過墻壁。

????作為回應(yīng),躲藏者學(xué)會了將坡道移入他們的房間,因此尋找者無法用它來越過墻壁。

????隨著環(huán)境變得越來越復(fù)雜,躲藏者學(xué)會了使用細(xì)長箱子建造更強(qiáng)大的“堡壘”。雖然OpenAI認(rèn)為這將是最終的策略,但在游戲進(jìn)行到3.8億回合時,尋找者再次成功反擊,找出一種方法來跳到一個盒子上并利用動力在它上面“沖浪”,越過墻壁進(jìn)入堡壘。

????在最后階段,躲藏者學(xué)會在建造堡壘之前鎖定所有箱子,以防止“箱子沖浪”。

????研究人員將這些不同策略的演變稱為“來自多智能體自動課程的緊急技能進(jìn)展”。“自動課程”這一術(shù)語是今年由DeepMind創(chuàng)造的,適用于多個代理逐漸創(chuàng)造新任務(wù)以在特定環(huán)境中相互挑戰(zhàn)。OpenAI的研究人員認(rèn)為,這個過程在自然選擇方面具有相似之處。

????這項(xiàng)研究為啥很重要?

????鑒于躲貓貓相對簡單的目標(biāo),通過競爭性自我游戲訓(xùn)練的多個代理學(xué)會了使用工具,并采用人類相關(guān)技能來獲勝。OpenAI認(rèn)為,這為未來的智能代理開發(fā)和部署提供了一個有前景的研究方向。OpenAI正在開源其代碼和環(huán)境,以鼓勵在該領(lǐng)域進(jìn)一步研究。

????OpenAI的最終目標(biāo)是構(gòu)建能夠在一個通用系統(tǒng)中執(zhí)行多項(xiàng)任務(wù)的人工通用智能(AGI)。雖然可能會有不同的目標(biāo),但OpenAI正在大力投資由大規(guī)模計(jì)算能力實(shí)現(xiàn)的強(qiáng)化學(xué)習(xí)研究。OpenAI最近與微軟簽署了一份價值10億美元的為期10年的計(jì)算合同。

????躲貓貓游戲研究也激發(fā)了OpenAI,因?yàn)殡S著環(huán)境復(fù)雜性的增加,游戲中的代理不斷地通過新策略自我適應(yīng)新的挑戰(zhàn)。貝克表示:“如果擴(kuò)展像這樣的流程,并將其放入更復(fù)雜的環(huán)境中,那么你可能會得到足夠復(fù)雜的代理,以便為我們解決實(shí)際任務(wù)。”

????挑戰(zhàn)在哪里?

????游戲代理有時會表現(xiàn)出令人驚訝的行為。例如,躲藏者試圖完全逃離游戲區(qū)域,直到研究人員對此施加懲罰。

????其他挑戰(zhàn)可能歸因于模擬環(huán)境設(shè)計(jì)中的物理缺陷。例如,躲藏者了解到,如果他們在拐角處向墻壁推動斜坡,斜坡將由于某種原因穿過墻壁然后消失。這種“作弊”說明了算法的安全性如何在機(jī)器學(xué)習(xí)中發(fā)揮關(guān)鍵作用。研究人員說:“在它發(fā)生之前,你永遠(yuǎn)不會知道。這類系統(tǒng)總是存在缺陷。我們所做的基本上是觀察,以便我們可以看到這種奇怪的事情發(fā)生,然后試著修復(fù)物理缺陷。”

  • 相關(guān)閱讀
  • “70年科技成就展”亮相中國科技館

      由中國科協(xié)主辦、中國科技館承辦的“禮贊共和國——慶祝新中國成立70周年科技成就科普展”昨起在中國科技館開幕,展覽將對公眾免費(fèi)展出至12月。   北京青年報(bào)記者了解到,本次展覽以中華人民共和國成立70年...

    時間:09-27
  • 百度首批自動駕駛出租車隊(duì)開啟試運(yùn)營

      昨日,百度在長沙宣布,自動駕駛出租車隊(duì)Robotaxi試運(yùn)營正式開啟。首批45輛Apollo與一汽紅旗聯(lián)合研發(fā)的“紅旗EV”Robotaxi車隊(duì)在長沙部分已開放測試路段開始試運(yùn)營。   即日起,普通長沙市民即可登錄Apoll...

    時間:09-27
  • 長三角科技創(chuàng)新一體化發(fā)展加快推進(jìn)

      圍繞國家創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略,積極響應(yīng)長三角一體化發(fā)展國家重大戰(zhàn)略部署,在25日開幕的第二屆長三角科技交易博覽會上,上海嘉定、江蘇蘇州、浙江溫州和安徽蕪湖共同簽署《深化長三角地區(qū)科技創(chuàng)新一體化發(fā)展戰(zhàn)...

    時間:09-27
  • 共享衣櫥“租衣”市場穩(wěn)了沒?

      穿新衣不用剁手,隨心換穿還能免洗、包郵……最近幾年,共享衣櫥的模式憑借其便宜快捷、省時省力的特點(diǎn)逐漸被年輕人所接受。2017年,浪潮之下的共享經(jīng)濟(jì)在許多細(xì)分領(lǐng)域興起,共享衣櫥成為熱度僅次于共享單車...

    時間:09-27
  • 為世界經(jīng)濟(jì)注入中國動力

      在喜迎新中國成立70周年之際,中國擴(kuò)大開放的步伐格外鏗鏘有力——   8月18日,深圳獲批建設(shè)中國特色社會主義先行示范區(qū),被賦予了在更高起點(diǎn)、更高層次、更高目標(biāo)上推進(jìn)改革開放、努力創(chuàng)建社會主義現(xiàn)代化...

    時間:09-27
  • 百年文獻(xiàn)數(shù)據(jù)見證我國70年科研進(jìn)步路

      近日,科技日報(bào)社旗下中國科技網(wǎng)與全球領(lǐng)先的專業(yè)信息服務(wù)機(jī)構(gòu)科睿唯安,聯(lián)合發(fā)布了題為《筑夢七十載奮進(jìn)科研路》的報(bào)告,從科研活動的重要成果產(chǎn)出——學(xué)術(shù)文獻(xiàn)的計(jì)量學(xué)角度,呈現(xiàn)中國70年科研進(jìn)步及邁向國...

    時間:09-27
  • 中標(biāo)麒麟和華為桌面云聯(lián)合解決方案發(fā)布

      近日,在HUAWEI CONNECT 2019期間,華為攜手中標(biāo)軟件共同舉辦中標(biāo)麒麟和華為桌面云聯(lián)合解決方案發(fā)布儀式,推出了基于中標(biāo)麒麟桌面操作系統(tǒng)和華為桌面云的聯(lián)合解決方案,打造安全可信、便捷高效的辦公桌面云解...

    時間:09-26
  • 楊元慶:智能制造將釋放更大的紅利

      “在智能技術(shù)的賦能之下,制造業(yè)絕不是增長乏力的傳統(tǒng)產(chǎn)業(yè),而是驅(qū)動經(jīng)濟(jì)高質(zhì)量、可持續(xù)發(fā)展的火車頭。”在不久前舉行的2019年世界制造業(yè)大會上,聯(lián)想集團(tuán)董事長兼CEO楊元慶如是說道。   楊元慶表示,全球...

    時間:09-26
  • 北京去年每天新設(shè)創(chuàng)新型企業(yè)199家

      北京市首部《北京市產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展藍(lán)皮書(2018-2019)——聚焦高精尖》昨天發(fā)布。統(tǒng)計(jì)數(shù)字顯示,2018年,北京國家高新技術(shù)企業(yè)達(dá)到2.5萬家,增長25%,平均每天新設(shè)創(chuàng)新型企業(yè)199家。獨(dú)角獸企業(yè)80家,居全國首...

    時間:09-26
  • 直道超車,量子通信跑在世界前列

      高冷的量子物理和我們的生活有什么關(guān)系?   “其實(shí),過去的一百多年,量子力學(xué)的發(fā)展,所催生的各種技術(shù)已經(jīng)徹底改變了我們的生活。”中國科學(xué)技術(shù)大學(xué)陸朝陽教授告訴科技日報(bào)記者。   時鐘回?fù)苤寥昵?..

    時間:09-25
免責(zé)聲明:本網(wǎng)對文中陳述、觀點(diǎn)判斷保持中立,不對所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔(dān)全部責(zé)任。 本網(wǎng)站轉(zhuǎn)載圖片、文字之類版權(quán)申明,本網(wǎng)站無法鑒別所上傳圖片或文字的知識版權(quán),如果侵犯,請及時通知我們,本網(wǎng)站將在第一時間及時刪除。