Re: [心得] AI對戰人類心得(已補影片)

7月 16, 2018
作者x94fujo6 ()

看板StarCraft

標題Re: [心得] AI對戰人類心得(已補影片)

時間Sat Nov  4 08:02:45 2017

想說的有點多
如果版主覺得不適合發在本版可以刪除 沒意見

每次有AI相關的東西
就會發現很多人的觀念還停留在上個世紀
以為AI就是寫好寫死的固定程式

這次比賽的AI
前兩個應該是屬於上面這種
第三個AI很明顯有點類似AlphaGo
有一些比較"非人類"的動作

10年前跟你說AI可以打贏圍棋世界冠軍
99%的人都會笑著說怎麼可能
現在?

目前最好的AI
所做的各種判斷/應對
都不是由人類設計/輸入/寫好的
而是由AI自己不斷"演化"的結果
所以會有一些"非人類"操作是非常正常的事情

不懂的可以看看這影片
我下面會說明
只要幾分鐘你就能大概理解這種AI
https://www.youtube.com/watch?v=NHtsUls3AnY

這是一個超級簡單到不行的AI模擬

首先
所有AI都擁有一樣的 "身體"
但每個AI都有自己的移動方式
這個方法最一開始是隨機設定的
所以會有很多根本不知道在幹三小的AI 很正常

再來是這種AI的關鍵
演化的條件
要設定甚麼條件才能演化出更"好"的AI
在這個模擬中
要的是能夠盡可能的快速吃到 "食物"(紅點) 的AI

當一個AI能夠吃到食物就能產生基於自己的 "後代"
一直吃不到/搶不贏的...就是死亡/淘汰

"後代" 雖然大部分的移動方式和 "前代" 一樣
但會有一些小部分可以產生隨機的變化
(想成DNA複製錯誤產生的突變就懂了)
這個變化可能有好有壞

能更快的吃到食物→ 這個AI就能產生更多的"後代"
反而動作變慢→ 這不好的演化結果會慢慢被前者淘汰

最後
你會得到一群搶食物快得嚇人的AI

這跟大自然的物競天擇有87%像
"自然演化" 就是一個非常強大的演算法
可以想成類似暴力破解
嘗試近乎無數的可能性後找出好的解法

但

"演化" 和 "暴力破解" 最大的不同在於
演化並不需要每一次嘗試都 "從0開始"
而是建立在"前代"的成功之上逐漸改進
最後的結果可能不是真正最好的解決方法
但至少非常非常非常接近

這種AI的特性是
裡面到底發生了啥
就算是設計的人都得研究一下才能知道
而且也只是"當下"的情況
多跑幾次模擬後可能又不一樣了
對外界來說就是個 "黑箱"
就像電腦自己教會自己一樣 (基本上 真的是)

https://www.youtube.com/watch?v=op0bhZNUJFE

這個內部運作的程式
應該也是模擬出來的AI

四隻腳=同時協調大量元件運作
受到外力能自行恢復平衡
加上負載後重心變化後要怎麼應對
人寫的出來你敢信?
隨便一個動作就要花很多時間
而且87%無法動的和AI一樣完美

AI模擬連實機都不需要
直接在電腦上一次模擬數十數百個
不需要人介入(其實還是要 調整各種條件等等)
就能自己演化出來

參數設的好 → AlphaGo
參數設的不好 → 垃圾/改參數重來

只會4D的AI
很可能是因為天梯環境
天梯在幹嘛?
不就是以最高勝率的戰術獲得最多勝場?
當AI發現4D勝率很高然後只以這個戰術為基準的時候
整個訓練方向就錯了
如果訓練AI時用的是職業選手
那結果應該會很不一樣

https://www.youtube.com/watch?v=hx_bgoTF7bs

這個也是
初期看起來真的很好笑 (有如這次表演的AI)
但理論上演化夠多次後
AI會比 "你" 還懂得如何 "正確的" 走路...

純粹分享一些業餘的知識
如有錯誤歡迎討論

--
We live in a society exquisitely dependent on science and technology,
in which hardly anyone knows anything about science and technology.

--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.35.143.39
※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1509753780.A.2A5.html

推 capssan: 這算是類神經的概念嗎 好奇問一下而已 11/04 08:24

→ jayfrog: 演化計算是ai的一種沒錯，但是不是每種ai都是演化計算吧 11/04 08:26

推 jackfantasy: 1樓是的 現在大部分AI都有類神經網路在裡面 也就是常 11/04 08:29

→ jackfantasy: 聽到的neural network 11/04 08:29

→ jackfantasy: 其實對AI來說 所謂的學習 是去逼近 11/04 08:30

→ jackfantasy: 如果你願意相信 則其實世界上所有的事物都可以轉化對 11/04 08:31

→ jackfantasy: 應成一個數學函數 可能很複雜 可能很簡單y=ax+b 11/04 08:31

→ jackfantasy: AI的概念就是我不知道a,b但是我從一堆資料裡面去逼近 11/04 08:33

→ jackfantasy: 出a,b是什麼 學到這個f(x) 11/04 08:33

→ jackfantasy: 然後接下來你給我x我一定可以預測出y 11/04 08:33

→ jackfantasy: 所以才說訓練資料很重要 如果你的訓練資料有偏頗 或 11/04 08:35

→ jackfantasy: 是太少 他根本無法逼近出真正的那個f(x) 就會變成預 11/04 08:35

→ jackfantasy: 測很爛 很不准 或是打很爛 但這就是他從資料中學到的 11/04 08:35

→ jackfantasy: 類神經也就是neural network 做的就是我用一堆神經元 11/04 08:37

→ jackfantasy:  來讓AI可以逼近超複雜 不只是a b兩個參數 而是上萬 11/04 08:37

→ jackfantasy: 個參數的函數 11/04 08:37

推 sartan: Festo這是什麼公司阿？也太可怕，默默開放出這些可怕玩意 11/04 08:40

推 capssan: 如果是這樣 圍棋跟星海對他們來說資料量差太大了吧 11/04 09:02

→ capssan: 幾乎多個參數就多好幾倍的變化 11/04 09:03

推 jackfantasy: 星海跟AlphaGo用的呢是neural mdtwork的一個分支 叫 11/04 09:10

→ jackfantasy: 做reinforcement learning 強化學習 11/04 09:10

推 jackfantasy: 一樣是逼近找出數學函數 但是這個數學函數表示的是一 11/04 09:16

→ jackfantasy: 個叫做「決策」的條件機率 也就是AI「觀察」到現在這 11/04 09:16

→ jackfantasy: 個「狀態」 然後決定要做什麼「動作」 11/04 09:16

→ jackfantasy: 每一個「動作」會得到「獎勵」 目標是使得整局比賽獎 11/04 09:17

→ jackfantasy: 勵最大 11/04 09:17

→ jackfantasy: 對啊 這參數量真的很大 因此要在學習過程懂得刪減掉 11/04 09:19

→ jackfantasy: 機率太小的決策以減少計算 而且訓練過程需要的電腦數 11/04 09:19

→ jackfantasy: 量至少幾千幾萬台 時間也要四、五個月 11/04 09:19

推 Timba: 學習能力啦~ 還有邏輯判斷 能不能用現有的資訊預測其他狀況 11/04 10:17

推 kirimaru73: 參數量超超超超大 所以之前的年代這不是主流作法 11/04 10:33

→ kirimaru73: 現在因為GPU強到翻 大家發現它足以撐起這麼誇張的計算 11/04 10:34

→ kirimaru73: 量所以才一窩蜂開始發展 11/04 10:34

推 kirimaru73: 現在的這種作法 是真的相當於在開發一顆大腦出來 11/04 10:38

→ kirimaru73: 但這顆大腦確實只會做一種事情(然而也可以幹爆人類) 11/04 10:38

→ kirimaru73: 所以要說這是弱人工智慧並非真的智慧 也是有其道理 11/04 10:39

推 kirimaru73: 推文提到的ax+b就是類神經網路的 但十幾年前的技術 11/04 10:41

→ kirimaru73: 大概只會使用1024/2048這種量級的ax+b所以被當成玩具 11/04 10:42

→ kirimaru73: 現在則是約100x100x1000+4096+4096這種程度的數量 11/04 10:43

推 kirimaru73: 另外如果考慮AI競賽或人機大戰 沒人規定你不能用腳本 11/04 10:47

→ kirimaru73: 你有本事就用 只是現在用了會被業餘玩家幹爆而已 11/04 10:47

→ kirimaru73: (遊戲內腳本強是因為他作弊) 11/04 10:48

推 sampp1213205: 然而 依然一堆原始人在小看Ai 11/04 18:55

→ x61s: 樓上最好說清楚點，Sen應該不算原始人，AI行為搞笑自然會被 11/04 19:54

→ x61s: 放大檢視甚至輕視，現在輕視也不代表會一直輕視 11/04 19:55

推 win4104: 現在明明就還有很多問題待克服 11/04 20:33

→ win4104: 我不覺得把將來的可能性拿到現在來反對其他人對當前成果 11/04 20:34

→ win4104: 的批判 是什麼有意義的事 11/04 20:34

推 kirimaru73: 這一版AI被笑是完全合情合理的 4D+2這種戰術以玩家的 11/04 20:44

→ kirimaru73: 角度來看本來就該笑 當然會長成這種戰術確實有研究上 11/04 20:45

→ kirimaru73: 的原因和討論價值 不過SEN他播報是播給遊戲玩家看的 11/04 20:45

→ kirimaru73: 那當然要站在玩家的立場來解說 沒什麼好批評的 11/04 20:46

→ sampp1213205: 白痴 在講的是小看ai的可能性跟強大好爆zzz 11/04 20:48

推 kirimaru73: 嘩 不服氣就砲白癡 這點真的比AI強太多了 11/04 20:49

推 x61s: 我們已經進入網路時代，資訊交流是以秒為單位傳遞 11/04 20:54

→ x61s: 今天嘲笑AI的人 在AI蛻變後 往往也是最早讚揚AI的人 11/04 20:55

推 win4104: 再說 雖然在很多篇已經說過了 11/04 20:57

→ win4104: DeepMind最近發表的研究狀況是他們卡關了 11/04 20:57

→ win4104: 為什麼還是看到很多人講的好像 演算法問題都已經解決 11/04 20:57

→ win4104: 只需要給AI時間學習一樣 11/04 20:58

推 x61s: 無需以先知者的態度來諷刺，這個時代沒有先知，人人都是先知 11/04 20:58

推 Butcherdon: 好像以前摸過的基因演算法 11/04 21:01

→ Butcherdon: 不過那時候休課只是入門 沒接觸複雜度 設定好進化條件 11/04 21:03

→ Butcherdon: 和突變種類之類的東西 讓程式演化n代自動找出某種棋盤 11/04 21:04

→ Butcherdon: 排列 人很難排出的東西 電腦只要兩三秒 11/04 21:05

推 jackfantasy: 其實笑是正常的 如果身為懂AI的人更該高興 因為你正 11/04 23:13

→ jackfantasy: 在目睹市場被教育 11/04 23:13

→ jackfantasy: Google DeepMind比起征服圍棋有另一個更大的重點跟使 11/04 23:15

→ jackfantasy: 命-教育市場 為未來的AI產業開拓市場 越多人瞭解AI本 11/04 23:15

→ jackfantasy: 質 就越能接受他 使用他 為他付費 11/04 23:15

→ jackfantasy: Google更是在大家都不懂AI是什麼時 透過征服圍棋 讓 11/04 23:16

→ jackfantasy: 大家有了Google是AI產業領導品牌的形象 11/04 23:16

→ jackfantasy: 比起下圍棋 這是更大的一步棋 11/04 23:16

→ jackfantasy: 所以何必笑或是生氣外人看不懂AI 當你是第一個教育市 11/04 23:17

→ jackfantasy: 場的人 你就賺錢了 這也許是台灣產業和專家、工程師 11/04 23:17

→ jackfantasy: 該學的 11/04 23:17

→ x61s: 很簡單 因為說的人往往非產業中人 酸民很少是深度涉入者 11/05 00:13

→ x61s: ai是否被接受 這些酸民都只能旁觀 選擇當先知酸人相對實際 11/05 00:15

推 APM99: 不小看這次AI的  叫做對AI有太多幻想 11/05 06:12

→ APM99: 好久沒看到白癡這兩個字了  好猛 11/05 06:12

推 APM99: 3b1b 這幾天把AI的視頻也都給丟上youtube了  有興趣了解的 11/05 06:15

→ APM99: 這些AI天梯勝率有達到70%嗎  天梯有前十嗎  沒有嘛 11/05 06:25

→ APM99: 還有連單位都不用圈選的 根本作弊  就搞笑來的 11/05 06:26

→ APM99: 還請到司令出征wwwww 11/05 06:26

推 ernova831: 連新手都打不贏的採礦AI到底能幹嘛zzz 11/05 11:29

噓 jackace: 我覺得先弄懂MDP和POMDP的limit在哪裡再說吧 11/05 12:32

噓 iamten: 這ai打一人般勝率很高 4d戰術很強 一般人不會對應 11/05 15:59

→ iamten: 打職業就吃屎吧 11/05 15:59

→ iamten: 靠硬操作贏的那種也不叫AI 11/05 16:00

→ iamten: 還有AI演算法很早就有了 這幾年強是硬體進步了 11/05 16:01

→ iamten: 但是星海是動態 跟圍旗是靜態完全不一樣 11/05 16:02
推文自動更新已關閉
搜尋此網誌

Sing Fu = Sing For You

Re: [心得] AI對戰人類心得(已補影片)

留言

這個網誌中的熱門文章

[閒聊] 女生會觀察男生手上的手錶嗎？

[翻譯] Nosleep-一群變態鎖定觀看YouTube的孩童

[心得] 這是一篇勸世文