Re: [心得] AI對戰人類心得(已補影片)

想說的有點多 如果版主覺得不適合發在本版可以刪除 沒意見 每次有AI相關的東西 就會發現很多人的觀念還停留在上個世紀 以為AI就是寫好寫死的固定程式 這次比賽的AI 前兩個應該是屬於上面這種 第三個AI很明顯有點類似AlphaGo 有一些比較"非人類"的動作 10年前跟你說AI可以打贏圍棋世界冠軍 99%的人都會笑著說怎麼可能 現在? 目前最好的AI 所做的各種判斷/應對 都不是由人類設計/輸入/寫好的 而是由AI自己不斷"演化"的結果 所以會有一些"非人類"操作是非常正常的事情 不懂的可以看看這影片 我下面會說明 只要幾分鐘你就能大概理解這種AI https://www.youtube.com/watch?v=NHtsUls3AnY
這是一個超級簡單到不行的AI模擬 首先 所有AI都擁有一樣的 "身體" 但每個AI都有自己的移動方式 這個方法最一開始是隨機設定的 所以會有很多根本不知道在幹三小的AI 很正常 再來是這種AI的關鍵 演化的條件 要設定甚麼條件才能演化出更"好"的AI 在這個模擬中 要的是能夠盡可能的快速吃到 "食物"(紅點) 的AI 當一個AI能夠吃到食物就能產生基於自己的 "後代" 一直吃不到/搶不贏的...就是死亡/淘汰 "後代" 雖然大部分的移動方式和 "前代" 一樣 但會有一些小部分可以產生隨機的變化 (想成DNA複製錯誤產生的突變就懂了) 這個變化可能有好有壞 能更快的吃到食物→ 這個AI就能產生更多的"後代" 反而動作變慢→ 這不好的演化結果會慢慢被前者淘汰 最後 你會得到一群搶食物快得嚇人的AI 這跟大自然的物競天擇有87%像 "自然演化" 就是一個非常強大的演算法 可以想成類似暴力破解 嘗試近乎無數的可能性後找出好的解法 但 "演化" 和 "暴力破解" 最大的不同在於 演化並不需要每一次嘗試都 "從0開始" 而是建立在"前代"的成功之上逐漸改進 最後的結果可能不是真正最好的解決方法 但至少非常非常非常接近 這種AI的特性是 裡面到底發生了啥 就算是設計的人都得研究一下才能知道 而且也只是"當下"的情況 多跑幾次模擬後可能又不一樣了 對外界來說就是個 "黑箱" 就像電腦自己教會自己一樣 (基本上 真的是) https://www.youtube.com/watch?v=op0bhZNUJFE
這個內部運作的程式 應該也是模擬出來的AI 四隻腳=同時協調大量元件運作 受到外力能自行恢復平衡 加上負載後重心變化後要怎麼應對 人寫的出來你敢信? 隨便一個動作就要花很多時間 而且87%無法動的和AI一樣完美 AI模擬連實機都不需要 直接在電腦上一次模擬數十數百個 不需要人介入(其實還是要 調整各種條件等等) 就能自己演化出來 參數設的好 → AlphaGo 參數設的不好 → 垃圾/改參數重來 只會4D的AI 很可能是因為天梯環境 天梯在幹嘛? 不就是以最高勝率的戰術獲得最多勝場? 當AI發現4D勝率很高然後只以這個戰術為基準的時候 整個訓練方向就錯了 如果訓練AI時用的是職業選手 那結果應該會很不一樣 https://www.youtube.com/watch?v=hx_bgoTF7bs
這個也是 初期看起來真的很好笑 (有如這次表演的AI) 但理論上演化夠多次後 AI會比 "你" 還懂得如何 "正確的" 走路... 純粹分享一些業餘的知識 如有錯誤歡迎討論 -- We live in a society exquisitely dependent on science and technology, in which hardly anyone knows anything about science and technology. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.35.143.39 ※ 文章網址: https://www.ptt.cc/bbs/StarCraft/M.1509753780.A.2A5.html
capssan: 這算是類神經的概念嗎 好奇問一下而已 11/04 08:24
jayfrog: 演化計算是ai的一種沒錯,但是不是每種ai都是演化計算吧 11/04 08:26
jackfantasy: 1樓是的 現在大部分AI都有類神經網路在裡面 也就是常 11/04 08:29
jackfantasy: 聽到的neural network 11/04 08:29
jackfantasy: 其實對AI來說 所謂的學習 是去逼近 11/04 08:30
jackfantasy: 如果你願意相信 則其實世界上所有的事物都可以轉化對 11/04 08:31
jackfantasy: 應成一個數學函數 可能很複雜 可能很簡單y=ax+b 11/04 08:31
jackfantasy: AI的概念就是我不知道a,b但是我從一堆資料裡面去逼近 11/04 08:33
jackfantasy: 出a,b是什麼 學到這個f(x) 11/04 08:33
jackfantasy: 然後接下來你給我x我一定可以預測出y 11/04 08:33
jackfantasy: 所以才說訓練資料很重要 如果你的訓練資料有偏頗 或 11/04 08:35
jackfantasy: 是太少 他根本無法逼近出真正的那個f(x) 就會變成預 11/04 08:35
jackfantasy: 測很爛 很不准 或是打很爛 但這就是他從資料中學到的 11/04 08:35
jackfantasy: 類神經也就是neural network 做的就是我用一堆神經元 11/04 08:37
jackfantasy: 來讓AI可以逼近超複雜 不只是a b兩個參數 而是上萬 11/04 08:37
jackfantasy: 個參數的函數 11/04 08:37
sartan: Festo這是什麼公司阿?也太可怕,默默開放出這些可怕玩意 11/04 08:40
capssan: 如果是這樣 圍棋跟星海對他們來說資料量差太大了吧 11/04 09:02
capssan: 幾乎多個參數就多好幾倍的變化 11/04 09:03
jackfantasy: 星海跟AlphaGo用的呢是neural mdtwork的一個分支 叫 11/04 09:10
jackfantasy: 做reinforcement learning 強化學習 11/04 09:10
jackfantasy: 一樣是逼近找出數學函數 但是這個數學函數表示的是一 11/04 09:16
jackfantasy: 個叫做「決策」的條件機率 也就是AI「觀察」到現在這 11/04 09:16
jackfantasy: 個「狀態」 然後決定要做什麼「動作」 11/04 09:16
jackfantasy: 每一個「動作」會得到「獎勵」 目標是使得整局比賽獎 11/04 09:17
jackfantasy: 勵最大 11/04 09:17
jackfantasy: 對啊 這參數量真的很大 因此要在學習過程懂得刪減掉 11/04 09:19
jackfantasy: 機率太小的決策以減少計算 而且訓練過程需要的電腦數 11/04 09:19
jackfantasy: 量至少幾千幾萬台 時間也要四、五個月 11/04 09:19
Timba: 學習能力啦~ 還有邏輯判斷 能不能用現有的資訊預測其他狀況 11/04 10:17
kirimaru73: 參數量超超超超大 所以之前的年代這不是主流作法 11/04 10:33
kirimaru73: 現在因為GPU強到翻 大家發現它足以撐起這麼誇張的計算 11/04 10:34
kirimaru73: 量所以才一窩蜂開始發展 11/04 10:34
kirimaru73: 現在的這種作法 是真的相當於在開發一顆大腦出來 11/04 10:38
kirimaru73: 但這顆大腦確實只會做一種事情(然而也可以幹爆人類) 11/04 10:38
kirimaru73: 所以要說這是弱人工智慧並非真的智慧 也是有其道理 11/04 10:39
kirimaru73: 推文提到的ax+b就是類神經網路的 但十幾年前的技術 11/04 10:41
kirimaru73: 大概只會使用1024/2048這種量級的ax+b所以被當成玩具 11/04 10:42
kirimaru73: 現在則是約100x100x1000+4096+4096這種程度的數量 11/04 10:43
kirimaru73: 另外如果考慮AI競賽或人機大戰 沒人規定你不能用腳本 11/04 10:47
kirimaru73: 你有本事就用 只是現在用了會被業餘玩家幹爆而已 11/04 10:47
kirimaru73: (遊戲內腳本強是因為他作弊) 11/04 10:48
sampp1213205: 然而 依然一堆原始人在小看Ai 11/04 18:55
x61s: 樓上最好說清楚點,Sen應該不算原始人,AI行為搞笑自然會被 11/04 19:54
x61s: 放大檢視甚至輕視,現在輕視也不代表會一直輕視 11/04 19:55
win4104: 現在明明就還有很多問題待克服 11/04 20:33
win4104: 我不覺得把將來的可能性拿到現在來反對其他人對當前成果 11/04 20:34
win4104: 的批判 是什麼有意義的事 11/04 20:34
kirimaru73: 這一版AI被笑是完全合情合理的 4D+2這種戰術以玩家的 11/04 20:44
kirimaru73: 角度來看本來就該笑 當然會長成這種戰術確實有研究上 11/04 20:45
kirimaru73: 的原因和討論價值 不過SEN他播報是播給遊戲玩家看的 11/04 20:45
kirimaru73: 那當然要站在玩家的立場來解說 沒什麼好批評的 11/04 20:46
sampp1213205: 白痴 在講的是小看ai的可能性跟強大好爆zzz 11/04 20:48
kirimaru73: 嘩 不服氣就砲白癡 這點真的比AI強太多了 11/04 20:49
x61s: 我們已經進入網路時代,資訊交流是以秒為單位傳遞 11/04 20:54
x61s: 今天嘲笑AI的人 在AI蛻變後 往往也是最早讚揚AI的人 11/04 20:55
win4104: 再說 雖然在很多篇已經說過了 11/04 20:57
win4104: DeepMind最近發表的研究狀況是他們卡關了 11/04 20:57
win4104: 為什麼還是看到很多人講的好像 演算法問題都已經解決 11/04 20:57
win4104: 只需要給AI時間學習一樣 11/04 20:58
x61s: 無需以先知者的態度來諷刺,這個時代沒有先知,人人都是先知 11/04 20:58
Butcherdon: 好像以前摸過的基因演算法 11/04 21:01
Butcherdon: 不過那時候休課只是入門 沒接觸複雜度 設定好進化條件 11/04 21:03
Butcherdon: 和突變種類之類的東西 讓程式演化n代自動找出某種棋盤 11/04 21:04
Butcherdon: 排列 人很難排出的東西 電腦只要兩三秒 11/04 21:05
jackfantasy: 其實笑是正常的 如果身為懂AI的人更該高興 因為你正 11/04 23:13
jackfantasy: 在目睹市場被教育 11/04 23:13
jackfantasy: Google DeepMind比起征服圍棋有另一個更大的重點跟使 11/04 23:15
jackfantasy: 命-教育市場 為未來的AI產業開拓市場 越多人瞭解AI本 11/04 23:15
jackfantasy: 質 就越能接受他 使用他 為他付費 11/04 23:15
jackfantasy: Google更是在大家都不懂AI是什麼時 透過征服圍棋 讓 11/04 23:16
jackfantasy: 大家有了Google是AI產業領導品牌的形象 11/04 23:16
jackfantasy: 比起下圍棋 這是更大的一步棋 11/04 23:16
jackfantasy: 所以何必笑或是生氣外人看不懂AI 當你是第一個教育市 11/04 23:17
jackfantasy: 場的人 你就賺錢了 這也許是台灣產業和專家、工程師 11/04 23:17
jackfantasy: 該學的 11/04 23:17
x61s: 很簡單 因為說的人往往非產業中人 酸民很少是深度涉入者 11/05 00:13
x61s: ai是否被接受 這些酸民都只能旁觀 選擇當先知酸人相對實際 11/05 00:15
APM99: 不小看這次AI的 叫做對AI有太多幻想 11/05 06:12
APM99: 好久沒看到白癡這兩個字了 好猛 11/05 06:12
APM99: 3b1b 這幾天把AI的視頻也都給丟上youtube了 有興趣了解的 11/05 06:15
APM99: 這些AI天梯勝率有達到70%嗎 天梯有前十嗎 沒有嘛 11/05 06:25
APM99: 還有連單位都不用圈選的 根本作弊 就搞笑來的 11/05 06:26
APM99: 還請到司令出征wwwww 11/05 06:26
ernova831: 連新手都打不贏的採礦AI到底能幹嘛zzz 11/05 11:29
jackace: 我覺得先弄懂MDP和POMDP的limit在哪裡再說吧 11/05 12:32
iamten: 這ai打一人般勝率很高 4d戰術很強 一般人不會對應 11/05 15:59
iamten: 打職業就吃屎吧 11/05 15:59
iamten: 靠硬操作贏的那種也不叫AI 11/05 16:00
iamten: 還有AI演算法很早就有了 這幾年強是硬體進步了 11/05 16:01
iamten: 但是星海是動態 跟圍旗是靜態完全不一樣 11/05 16:02
推文自動更新已關閉

留言

這個網誌中的熱門文章

[閒聊] 女生會觀察男生手上的手錶嗎?

[翻譯] Nosleep-一群變態鎖定觀看YouTube的孩童

[心得] 這是一篇勸世文