[#新聞分享]電腦超越人腦? 圍棋五連戰第二回合電腦勝
AlphaGo 與圍棋世界棋王李世乭對弈第二戰落幕,由 AlphaGo 人工智慧再次獲得勝利!下一場對決將於本周五舉行。這場全球矚目的人工智慧對決世界棋王的大戰將在下周二前將陸續舉行5局比賽,優勝者獎金超過新台幣 3000 萬。
第三戰將於 12 日中午 12 點進行,有興趣的讀者亦可直接收看現場直播。
為什麼要關注這個比賽?人工智慧不是早就有了嗎?
之所以受到關注是因為演算法的改變,google人工智慧AlphaGo 能做到的並不僅僅只是以既有的資訊持續推斷最佳結果,而是能真正因應棋局而做出適當的下一步。不像以往的人工智慧。
另外在AlphaGo中還借鑒了一種名為深度強化學習(Deep Q-Learning,DQN)的技巧。和蒙地卡羅樹狀搜尋演算法(Monte Carlo Tree Search),在判斷下一步的策略上有著非常好的表現,遠超過上一個能夠和人類棋手旗鼓相當的圍棋程式。
新聞連結:
http://technews.tw/…/why-is-alphago-so-great-and-what-is-d…/
http://3c.ltn.com.tw/news/23329
蒙 地 卡 羅 強化學習 在 强化学习蒙特卡洛方法离轨策略的MC策略评估 - YouTube 的八卦

强化学习 Reinforcement Learning蒙特 卡 洛方法Monte Carlo Method离轨策略的策略评估Policy Evaluation based on Off-PolicyBook: ... ... <看更多>
蒙 地 卡 羅 強化學習 在 强化学习蒙特卡洛方法同轨策略的MC控制- YouTube 的八卦

强化学习 Reinforcement Learning蒙特 卡 洛方法Monte Carlo Method同轨策略的蒙特 卡 洛方法MC control based on On-PolicyBook: ... ... <看更多>
蒙 地 卡 羅 強化學習 在 强化学习蒙特卡洛方法策略评估 - YouTube 的八卦
强化学习 Reinforcement Learning蒙特 卡 洛方法Monte Carlo Method策略评估Policy EvaluationBook: ... ... <看更多>