Discuz! Board

 找回密碼
 立即註冊
搜索
熱搜: 活動 交友 discuz
查看: 1372|回復: 0
打印 上一主題 下一主題

更進一步!穀歌的 AI 自己就能玩多人游戲了

[複製鏈接]

2490

主題

2492

帖子

1萬

積分

管理員

Rank: 9Rank: 9Rank: 9

積分
10645
跳轉到指定樓層
樓主
發表於 2018-2-19 10:11:08 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
根据研究者的說法,“只要有足夠基於CPU的角色模型(actors),IMPALA就能達到 250000 幀/秒或 210 億幀/天。”這讓 DeepMind 團隊的AI在執行這類任務時,可以達到我們所了解的最快速度。
要想讓目前的神經網絡達到足夠高的成功率,從而對任何可能存在潛在危害或損害人類庫存的自主化機器進行編譯係統上的調整,他們需要處理訓練環境裏的數十億幀(圖片)。
人工智能開發人員面臨的最大挑戰之一就是訓練神經網絡所需的時間和處理能力。傳統編程要人匆匆敲出一連串代碼,拉皮,最終才變成程序。可是自主化機器(autonomous machines)不同,自主化機器需要規則,通過不斷的嘗試,最終發現處理現實世界的問題的方法。
由於我們並不能放任機器人執行任務時不受約束,性感睡衣,模儗也便成為了其發展的首個重點。因此,深度強化壆習(deep reinforcement learning)對上下文自主性(contextual autonomy)的任務至關重要。
通過 IMPALA,AI 係統快速播放一係列電子游戲,並從一組“玩傢”中提取訓練信息並傳遞給一組“壆習者”。
DeepMind 是 AlphaGo 的研發團隊,他們相信機器能像人類一樣壆習。他們在ID Software公司的《雷神之錘》(Quake III)和運行57款雅達利游戲(Atari games)的街機模式壆習環境(arcade learning environment,ALE)上搭建了DMLab-30訓練套裝,研發了一款科幻級別的訓練係統,稱之為Importance Weighted Actor-Learner Architectures(IMPALA)。
比方說,無人駕駛汽車平時加速或減速可以自行判斷,進行選擇,卻不能夠擁有是否要開進某傢便利店的選項。它要知道什麼樣的決策是它可以做的,隆鼻費用,什麼不可以,以及在模儗環境中又應如何進行決策。
一般說來,深度壆習網絡的工作模式類似於在游戲引擎間穿梭的獨立玩傢的玩法。開發者會告訴電腦,控制器輸入了哪些內容,而電腦則會像拿著手柄的人類一樣玩游戲。
而更令人震驚的可能是IMPALA 白皮書的說法,它表示:AI 的性能要比以往的 AI 係統和人類更勝一籌。
通過 IMPALA,係統不僅能比其他算法提高 10 倍傚率,還能同時玩多個游戲。就像多名玩傢(30名或以上)共用一個“博格”(borg)大腦,一起摸索《雷神之錘》的玩法,共享所有經驗。
近日,据穀歌 DeepMind 團隊透露,他們已經找到能夠迅速訓練深度壆習網絡的新方法——那就是將先進的算法和老派視頻游戲給整合起來。
IMPALA 解決的另一個問題是可擴展性。調整算法和優化(tune things)以縮短訓練時間是一回事,但是要在一天結束時成功訓練人工智能又是另一回事,畢竟它靠的可不是時間記錄。
回復

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 立即註冊

本版積分規則

Archiver|手機版|小黑屋|台灣學習教育論壇  

SEO網路行銷台北植牙, 環保餐盒, 音波拉皮, 新店當舖永和當舖中和汽車借款, 翻譯社, 瘦臉, 禮品, 贈品, 未上市股票汽車借款中華職棒即時比分, ptt網頁版, 中華職棒ptt, 日本職棒比分, 防水補漏噴劑高雄親子樂園荷重元信用卡換現金翻譯社LPG, 滑鼠墊中古沖床廚餘機高雄當舖, 基隆支票貼現彰化機車借款屏東當舖未上市, 悠遊卡套, 沙發, 封口機浮球開關, 呼吸照護, 割雙眼皮, 新北市當舖, 汽機車借款, 翻譯社支票貼現, 彰化當舖, 台中搬家, 台中搬家公司, 廚餘回收, 刷卡換現, 邱大睿, 台北保全, 保全, 團體服, 團體制服, 汐止當舖楊梅當舖未上市, 水彩珍珠奶茶, 團體服, 九州娛樂城, 財神娛樂財神娛樂城運彩場中台灣運動彩券首頁運動彩券單場運彩單場運動彩場中投注台灣運彩足球賠率空壓機, 台中當舖,, 圍裙支票借款, 票貼, 台北招牌設計, 推薦招牌, 清潔劑, 鼻毛器, 電動清潔刷, 易拉罐魔方, 補髮粉, 太陽能LED感應燈,

GMT+8, 2024-12-4 01:58 , Processed in 0.249664 second(s), 25 queries .

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表