人工智慧超級比一比!!麻將AI和圍棋AI誰比較厲害?(下)

人工智慧超級比一比!!麻將AI和圍棋AI誰比較厲害?(下)
人工智慧超級比一比!!麻將AI和圍棋AI誰比較厲害?(下)

人工智慧也會下棋打麻將!!但哪一種AI比較聰明比較厲害呢?答案就在文章裡~(下)

為何我們會想寫這篇文章?

讀者看到了這篇文章:AI人工智慧又贏了!微軟Suphx突破日本麻將最高紀錄,打敗人類頂尖玩家時,可能會立即聯想到 Google 開發的圍棋人工智慧 Alpha Go 於兩年前以近乎完美姿態打敗人類選手李世乭和柯潔的新聞。根據微軟所說:研發麻將 AI 人工智慧的技術門檻可說是比研發圍棋、德州撲克等棋牌、博弈類的遊戲難多了!是真的嗎?這篇取材自微軟亞洲研究院的新聞稿,解釋為何同樣是人工智慧,為何研發AI  麻將技術門檻就是比 Alpha Go 等棋類 AI 高的還多!

「全新機制、教練先知、全面預測」對付麻將AI研發瓶頸

全新機制應對「巨大的狀態空間」

比如說,為了應對「巨大的狀態空間」,研究團隊引入了全新的機制:對探索過程的多樣性,進行動態調控,讓 Suphx 可以比傳統算法,更加充分地試探牌局狀態的多種可能。另一方面,一旦某一輪的底牌給定,其狀態子空間會大幅縮小;所以研究團隊讓Suphx 在推理階段根據本輪的牌局,來動態調整策略,對縮小了的狀態子空間進行更有針對性的探索,從而更好地根據本輪牌局的演進做出自適應的決策。

「先知教練技術」應對「非完美資訊」

其次,針對「非完美訊息」博弈的挑戰,Suphx 創新性地嘗試了先知教練技術來提升強化學習的效果。其基本思想是在自我博弈的訓練階段,利用不可見的一些隱藏訊息,來引導 AI人工智慧 模型的訓練方向,使其學習路徑更加清晰、更加接近完美資訊意義下的最佳路徑,從而倒逼 AI人工智慧 模型更加深入地理解可見信息,從中找到有效的決策依據。

「全盤預測技術」理解「復雜的獎勵機制」

另外,對於麻將復雜的牌面表達和計分機制,研究團隊還利用全盤預測技術搭建起每輪比賽和8輪過後的終盤結果之間的橋樑。這個預測器通過精巧的設計,可以理解每輪比賽對終盤的不同貢獻,從而將終盤的獎勵信號合理地分配回每一輪比賽之中,以便對自我博弈的過程進行更加直接而有效的指導,並使得Suphx可以學會一些具有大局觀的高級技巧。

得益於以上新技術和其他方面的創新,自今年 3 月進入天鳳平台以來,Suphx 在與人類玩家的對局中,學得非常快。目前,在平衡攻擊和防禦方面,Suphx 表現出了比許多頂尖人類玩家更明智的策略,能夠戰略性地完成短期損失與長期收益之間的權衡,並根據已有的模糊信息進行快速決策。

Suphx 一直在不斷學習與進步,研究團隊也一直在對 Suphx 背後核心算法的價值進行評估、反思和重複回饋過程,從而實現進一步的改進和提升。劉鐵岩表示「 雖然 Suphx 根據麻將的獨特挑戰,進行了針對性的設計,也取得了不錯的戰績,但我們的創新從未停止。我們期待在不久的將來發明出更新穎、更強大的AI人工智慧 技術,使得Suphx 的能力有更大幅度的提升。縱觀歷史、遊戲AI人工智慧 的進化始終與AI人工智慧 研究進展相生相伴,很多關於人工智能的研究都起源於研究如何構建能夠完成遊戲的智能體。我們希望通過對 Suphx 的研究來探索及擴展已有AI人工智慧技術的邊界,不斷推動人工智慧領域的進步。」

 

想閱讀更多關於人工智慧的文章嗎?快到部落格首頁搜尋吧!!

 

 

 

其他閱讀:

人工智慧超級比一比!!麻將AI和圍棋AI誰比較厲害?(上)

醫院攜手和AI人工智慧系統合作,快速偵測敗血症提高病患存活率!!

在煩惱你的台灣國語手機聽不懂嗎? 讓人工智慧雅婷來幫你搞定一切吧!!

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

重新學習UI UX Python課程 打好基礎輕鬆領高薪

有一個傳說 來上Java課程還能任高薪職缺 媒合率竟高達百分之90

人工智慧讓你看清肥胖的原因 讓Python課程教你如何做到

人工智慧超級比一比!!麻將AI和圍棋AI誰比較厲害?(上)

人工智慧超級比一比!!麻將AI和圍棋AI誰比較厲害?(上)
人工智慧超級比一比!!麻將AI和圍棋AI誰比較厲害?(上)

人工智慧也會下棋打麻將!!但哪一種AI比較聰明比較厲害呢?答案就在文章裡~(上)

為何我們會想寫這篇文章?

讀者看到了這篇文章:AI人工智慧又贏了!微軟Suphx突破日本麻將最高紀錄,打敗人類頂尖玩家時,可能會立即聯想到 Google 開發的圍棋人工智慧 Alpha Go 於兩年前以近乎完美姿態打敗人類選手李世乭和柯潔的新聞。根據微軟所說:研發麻將 AI 人工智慧的技術門檻可說是比研發圍棋、德州撲克等棋牌、博弈類的遊戲難多了!是真的嗎?這篇取材自微軟亞洲研究院的新聞稿,解釋為何同樣是人工智慧,為何研發 AI 麻將技術門檻就是比 Alpha Go 等棋類 AI 高的還多!

微軟:麻將變動度,更勝圍棋德州撲克等

微軟的新聞稿上提到了開發麻將 AI 人工智慧「Sphix」難度與象棋、圍棋、德州撲克等棋牌類遊戲相比,麻將具有更復雜的隱藏信息和更高的難度。總言而之,麻將 AI 人工智慧主要面臨以下挑戰:

巨大的狀態空間:

與只有 52 張牌的德州撲克相比,136 張麻將牌的排列組合擁有更多的可能性。同時,麻將中同一個玩家在兩次出牌之間,夾雜了其他 3 個玩家的出牌和自己摸的底牌,可能出現的不同局面數目非常巨大。值得提出的是,在麻將中,4 位玩家的出牌順序是不固定的,任意一位玩家的「吃」、「碰」、「槓」都可能改變出牌順序,導致遊戲順序的不規則和莫大的變化。這些變動使麻將很難直接利用 AlphaGo 等棋盤遊戲 人工智慧 常用的蒙特卡洛樹搜索算法。

非完美資訊遊戲:

賽局理論中,資訊集合是指對於特定的參與者,建立基於其所觀察到的所有賽局中可能發生的行動的集合。如果賽局是完美資訊的,每個資訊集合只能有一個參與者,並顯示賽局所處的階段。否則,有的參與者可能就不知道賽局的狀態,以及自己周圍的形勢。

象棋和圍棋屬於完美資訊遊戲,玩家可以看到棋局中對方玩家的落子。麻將則存在大量的隱藏資訊。具體而言,麻將中每個玩家可以有 13 張手牌,另外還有 84 張底牌。對於一個玩家而言,他只知道自己手裏的 13 張牌和之前已經打出來的牌,卻無法知道別人的手牌和沒有翻出來的底牌,所以最多可以有超過 120 張未知的牌。這麽多的未知資訊,使得麻將的難度非常高。一方面,由於隨機性太大,玩家即便在出牌決策中估計對方玩家手牌、底牌等不可見的牌,也無法避免不確定性對於遊戲走向的影響。這將對 AI人工智慧 模型的訓練帶來很大挑戰:AI人工智慧 模型很難發現已知牌面信息和最優打法之間的邏輯鏈路。另一方面,豐富的隱藏信息導致遊戲樹的寬度非常大,對樹搜索算法的可行性提出了進一步的挑戰。

復雜的獎勵機制:

日本麻將的規則是「無役不能和牌」,多樣又特殊的牌面,構成了復雜的「役種」和番數計算規則。一輪遊戲共包含 8 局,單局得分與役種和番數相關,最後根據 8 局的得分總和進行排名,來形成最終影響段位的點數獎懲。因此有時麻將高手會策略性輸牌,例如,在第 8 輪時如果 A 玩家已經大比分領先第二名,他可能會故意放炮給排名第四的玩家,來防止總分被排名第二的玩家反超,保證自己在最終結算時獲得最大的點數獎勵。這為構建高超的麻將 AI人工智慧 策略帶來了額外的挑戰,AI人工智慧 需要審時度勢,把握進攻與防守的時機。

「面對麻將遊戲的巨大挑戰,AI人工智慧 僅靠強大的計算能力,無法從根本上解決問題,而需要更強的直覺、預測、推理和模糊決策能力」微軟亞洲研究院副院長、機器學習領域負責人劉鐵巖博士表示。

為了讓 Suphx 高效地學習麻將的複雜狀態和策略,微軟亞洲研究院針對麻將的特點與困難度,嘗試了一系列的「基於強化學習」的新式演算法,希望通過技術面的創新,讓 Suphx 具備強大有效的「狀態表達」和「策略學習」能力,同時具有「大局意識」,能從遊戲的全局角度做出策略性的判斷,確保統計意義上總分的領先地位。

 

想閱讀更多關於人工智慧的文章嗎?快到部落格首頁搜尋吧!!

 

 

 

其他閱讀:

人工智慧超級比一比!!麻將AI和圍棋AI誰比較厲害?(下)

醫院攜手和AI人工智慧系統合作,快速偵測敗血症提高病患存活率!!

在煩惱你的台灣國語手機聽不懂嗎? 讓人工智慧雅婷來幫你搞定一切吧!!

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

重新學習UI UX Python課程 打好基礎輕鬆領高薪

有一個傳說 來上Java課程還能任高薪職缺 媒合率竟高達百分之90

人工智慧讓你看清肥胖的原因 讓Python課程教你如何做到

人工智慧Suphx和AlphaGo誰更誰更高超?微軟這麼說…(下)

人工智慧Suphx和AlphaGo誰更誰更高超?微軟這麼說...(下)
人工智慧Suphx和AlphaGo誰更誰更高超?微軟這麼說…(下)

超狂人工智慧麻將AI和圍棋AI要來大PK了嗎?誰比較厲害呢?微軟的答案是…?(上)

為何我們會想寫這篇文章?

讀者看到了這篇文章:AI人工智慧又贏了!微軟Suphx突破日本麻將最高紀錄,打敗人類頂尖玩家時,可能會立即聯想到 Google 開發的圍棋人工智慧 Alpha Go 於兩年前以近乎完美姿態打敗人類選手李世乭和柯潔的新聞。根據微軟所說:研發麻將 AI 人工智慧的技術門檻可說是比研發圍棋、德州撲克等棋牌、博弈類的遊戲難多了!是真的嗎?這篇取材自微軟亞洲研究院的新聞稿,解釋為何同樣是人工智慧,為何研發AI 麻將技術門檻就是比 Alpha Go 等棋類 AI 高的還多!

「全新機制、教練先知、全面預測」對付麻將AI研發瓶頸

全新機制應對「巨大的狀態空間」

比如說,為了應對「巨大的狀態空間」,研究團隊引入了全新的機制:對探索過程的多樣性,進行動態調控,讓 Suphx 可以比傳統算法,更加充分地試探牌局狀態的多種可能。另一方面,一旦某一輪的底牌給定,其狀態子空間會大幅縮小;所以研究團隊讓Suphx 在推理階段根據本輪的牌局,來動態調整策略,對縮小了的狀態子空間進行更有針對性的探索,從而更好地根據本輪牌局的演進做出自適應的決策。

「先知教練技術」應對「非完美資訊」

其次,針對「非完美訊息」博弈的挑戰,Suphx 創新性地嘗試了先知教練技術來提升強化學習的效果。其基本思想是在自我博弈的訓練階段,利用不可見的一些隱藏訊息,來引導 AI人工智慧 模型的訓練方向,使其學習路徑更加清晰、更加接近完美資訊意義下的最佳路徑,從而倒逼 AI人工智慧 模型更加深入地理解可見信息,從中找到有效的決策依據。

「全盤預測技術」理解「復雜的獎勵機制」

另外,對於麻將復雜的牌面表達和計分機制,研究團隊還利用全盤預測技術搭建起每輪比賽和8輪過後的終盤結果之間的橋樑。這個預測器通過精巧的設計,可以理解每輪比賽對終盤的不同貢獻,從而將終盤的獎勵信號合理地分配回每一輪比賽之中,以便對自我博弈的過程進行更加直接而有效的指導,並使得Suphx可以學會一些具有大局觀的高級技巧。

得益於以上新技術和其他方面的創新,自今年 3 月進入天鳳平台以來,Suphx 在與人類玩家的對局中,學得非常快。目前,在平衡攻擊和防禦方面,Suphx 表現出了比許多頂尖人類玩家更明智的策略,能夠戰略性地完成短期損失與長期收益之間的權衡,並根據已有的模糊信息進行快速決策。

Suphx 一直在不斷學習與進步,研究團隊也一直在對 Suphx 背後核心算法的價值進行評估、反思和重複回饋過程,從而實現進一步的改進和提升。劉鐵岩表示「 雖然 Suphx 根據麻將的獨特挑戰,進行了針對性的設計,也取得了不錯的戰績,但我們的創新從未停止。我們期待在不久的將來發明出更新穎、更強大的AI人工智慧 技術,使得Suphx 的能力有更大幅度的提升。縱觀歷史、遊戲AI人工智慧 的進化始終與AI人工智慧 研究進展相生相伴,很多關於人工智能的研究都起源於研究如何構建能夠完成遊戲的智能體。我們希望通過對 Suphx 的研究來探索及擴展已有AI人工智慧技術的邊界,不斷推動人工智慧領域的進步。」

 

想閱讀更多關於人工智慧的文章嗎?快到部落格首頁搜尋吧!!

 

 

 

其他閱讀:

人工智慧Suphx和AlphaGo誰更誰更高超?微軟這麼說…(上)

醫院攜手和AI人工智慧系統合作,快速偵測敗血症提高病患存活率!!

在煩惱你的台灣國語手機聽不懂嗎? 讓人工智慧雅婷來幫你搞定一切吧!!

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

重新學習UI UX Python課程 打好基礎輕鬆領高薪

有一個傳說 來上Java課程還能任高薪職缺 媒合率竟高達百分之90

人工智慧讓你看清肥胖的原因 讓Python課程教你如何做到

人工智慧Suphx和AlphaGo誰更誰更高超?微軟這麼說…(上)

人工智慧Suphx和AlphaGo誰更誰更高超?微軟這麼說...(上)
人工智慧Suphx和AlphaGo誰更誰更高超?微軟這麼說…(上)

超狂人工智慧麻將AI和圍棋AI要來大PK了嗎?誰比較厲害呢?微軟的答案是…?(上)

為何我們會想寫這篇文章?

讀者看到了這篇文章:AI人工智慧又贏了!微軟Suphx突破日本麻將最高紀錄,打敗人類頂尖玩家時,可能會立即聯想到 Google 開發的圍棋人工智慧 Alpha Go 於兩年前以近乎完美姿態打敗人類選手李世乭和柯潔的新聞。根據微軟所說:研發麻將 AI 人工智慧的技術門檻可說是比研發圍棋、德州撲克等棋牌、博弈類的遊戲難多了!是真的嗎?這篇取材自微軟亞洲研究院的新聞稿,解釋為何同樣是人工智慧,為何研發AI 麻將技術門檻就是比 Alpha Go 等棋類 AI 高的還多!

微軟:麻將變動度,更勝圍棋德州撲克等

微軟的新聞稿上提到了開發麻將 AI 人工智慧「Sphix」難度與象棋、圍棋、德州撲克等棋牌類遊戲相比,麻將具有更復雜的隱藏信息和更高的難度。總言而之,麻將 AI 人工智慧主要面臨以下挑戰:

巨大的狀態空間:

與只有 52 張牌的德州撲克相比,136 張麻將牌的排列組合擁有更多的可能性。同時,麻將中同一個玩家在兩次出牌之間,夾雜了其他 3 個玩家的出牌和自己摸的底牌,可能出現的不同局面數目非常巨大。值得提出的是,在麻將中,4 位玩家的出牌順序是不固定的,任意一位玩家的「吃」、「碰」、「槓」都可能改變出牌順序,導致遊戲順序的不規則和莫大的變化。這些變動使麻將很難直接利用 AlphaGo 等棋盤遊戲 人工智慧 常用的蒙特卡洛樹搜索算法。

非完美資訊遊戲:

賽局理論中,資訊集合是指對於特定的參與者,建立基於其所觀察到的所有賽局中可能發生的行動的集合。如果賽局是完美資訊的,每個資訊集合只能有一個參與者,並顯示賽局所處的階段。否則,有的參與者可能就不知道賽局的狀態,以及自己周圍的形勢。

象棋和圍棋屬於完美資訊遊戲,玩家可以看到棋局中對方玩家的落子。麻將則存在大量的隱藏資訊。具體而言,麻將中每個玩家可以有 13 張手牌,另外還有 84 張底牌。對於一個玩家而言,他只知道自己手裏的 13 張牌和之前已經打出來的牌,卻無法知道別人的手牌和沒有翻出來的底牌,所以最多可以有超過 120 張未知的牌。這麽多的未知資訊,使得麻將的難度非常高。一方面,由於隨機性太大,玩家即便在出牌決策中估計對方玩家手牌、底牌等不可見的牌,也無法避免不確定性對於遊戲走向的影響。這將對 AI人工智慧 模型的訓練帶來很大挑戰:AI人工智慧 模型很難發現已知牌面信息和最優打法之間的邏輯鏈路。另一方面,豐富的隱藏信息導致遊戲樹的寬度非常大,對樹搜索算法的可行性提出了進一步的挑戰。

復雜的獎勵機制:

日本麻將的規則是「無役不能和牌」,多樣又特殊的牌面,構成了復雜的「役種」和番數計算規則。一輪遊戲共包含 8 局,單局得分與役種和番數相關,最後根據 8 局的得分總和進行排名,來形成最終影響段位的點數獎懲。因此有時麻將高手會策略性輸牌,例如,在第 8 輪時如果 A 玩家已經大比分領先第二名,他可能會故意放炮給排名第四的玩家,來防止總分被排名第二的玩家反超,保證自己在最終結算時獲得最大的點數獎勵。這為構建高超的麻將 AI人工智慧 策略帶來了額外的挑戰,AI人工智慧 需要審時度勢,把握進攻與防守的時機。

「面對麻將遊戲的巨大挑戰,AI人工智慧 僅靠強大的計算能力,無法從根本上解決問題,而需要更強的直覺、預測、推理和模糊決策能力」微軟亞洲研究院副院長、機器學習領域負責人劉鐵巖博士表示。

為了讓 Suphx 高效地學習麻將的複雜狀態和策略,微軟亞洲研究院針對麻將的特點與困難度,嘗試了一系列的「基於強化學習」的新式演算法,希望通過技術面的創新,讓 Suphx 具備強大有效的「狀態表達」和「策略學習」能力,同時具有「大局意識」,能從遊戲的全局角度做出策略性的判斷,確保統計意義上總分的領先地位。

 

想閱讀更多關於人工智慧的文章嗎?快到部落格首頁搜尋吧!!

 

 

 

其他閱讀:

人工智慧Suphx和AlphaGo誰更誰更高超?微軟這麼說…(下)

醫院攜手和AI人工智慧系統合作,快速偵測敗血症提高病患存活率!!

在煩惱你的台灣國語手機聽不懂嗎? 讓人工智慧雅婷來幫你搞定一切吧!!

暑假快到了!與其讓兒子盲目拚學測,我寧可讓他先選擇人生方向~

重新學習UI UX Python課程 打好基礎輕鬆領高薪

有一個傳說 來上Java課程還能任高薪職缺 媒合率竟高達百分之90

人工智慧讓你看清肥胖的原因 讓Python課程教你如何做到

人工智慧麻將玩家天鳳打敗天下無敵手?!!(四)

人工智慧麻將玩家天鳳打敗天下無敵手?!!(四)
人工智慧麻將玩家天鳳打敗天下無敵手?!!(四)

你聽過人工智慧下象棋,但你聽過人工智慧打麻將嗎?超強的天鳳人工智慧系統絕對超乎你的想像!!(四)

為何我們會想寫這篇文章?

AI人工智慧「Microsoft Suphx」(Super Phoenix) 被微軟發表之前,日本麻將平台「天鳳」可說是人類麻將高手雲集的地方,且沒有一個 AI 能在此平台上晉升10段。

這些 AI 包含東大碩士生水上直紀開發的「爆打」、株式会社ドワンゴ (多玩國公司) 開發的「NAGA25」等。

目前該平台有 33 萬玩家,但是有達到 10 段的玩家只有 180 位,比例只有 0.0054%。目前這個平台採用日本麻將規則,有 3 人麻將與 4 人麻將,擁有段位、級數等制度來替玩家分等級。而微軟的麻將 AI 「Suphx」,自今年 3 月起在該平台上出沒,強悍的打敗許多麻將玩家。微軟亞洲研究院在這個月正式發表麻將 AI 「Suphx」,並宣佈「她」取得晉升 10 段的頂尖成果⋯⋯

Suphx 的強大,獲日本雀士界名人讚嘆

日本麻將玩家中家喻戶曉的知名玩家朝倉康心(天鳳 ID 為「ASAPIN」)為天鳳玩家中率先到達「天鳳位」的第一人,是公認的天鳳位中的最強玩家之一。他同樣也對 Suphx這人工智慧系統 甘拜下風,在社交媒體上表示:「我看了 Suphx 的比賽,我感覺它好像比我更強大!」;他甚至還說到:「⋯⋯有種《獵人》漫畫尼特羅會長看到尼飛彼多的感覺。」

今年 6 月,「太くないお」 成為世界上第 15 名取得三人麻將天鳳位的玩家,他也是第一位在四人麻將和三人麻將中均取得天鳳位的頂級玩家。他說:「我已經看了300 多場 Suphx 的比賽,我甚至不再觀看人類玩家的比賽了。我從Suphx 身上學到非常多新的技術,它們對於我的三人麻將打法有著非常大的幫助和啟發意義。」

Suphx人工智慧的傑出表現也獲得了天鳳平臺官方的認可與青睞:「毫無疑問,Suphx 是迄今為止段位最高的麻將 AI。我們在考慮將 Suphx 的所有比賽錄影歸檔,以分享給全平臺的其他麻將玩家參考、學習。我們也正在和麻將社區中的眾多玩家討論:是否可以破例允許 Suphx 進入只有人類玩家才能參與的「鳳凰房」進行比賽。這樣,我們將有機會欣賞到更加激烈和精彩紛呈的比賽。」

天鳳平臺開發公司 C-EGG 的 CEO 角田真吾表示:「這是一項巨大的突破,Suphx 不僅僅幫助我們用更智能的方式發展傳統文化,更顯示出擴張AI能力極限的可能性,我想這對天鳳平臺、麻將社區乃至社會都是一個令人振奮的事情。」

直至八月底,微軟在記者會過後發出新聞稿,講述 Suphx人工智慧的核心技術、研究成果等等。

至於微軟在研發 Suphx 有遇到什麼樣的挑戰呢?請看這篇:人工智慧麻將Suphx研發難度更勝AlphaGo?看看微軟怎麼說!

 

 

 

其他閱讀

 

 

 

人工智慧麻將玩家天鳳打敗天下無敵手?!!(三)

人工智慧麻將玩家天鳳打敗天下無敵手?!!(三)
人工智慧麻將玩家天鳳打敗天下無敵手?!!(三)

你聽過人工智慧下象棋,但你聽過人工智慧打麻將嗎?超強的天鳳人工智慧系統絕對超乎你的想像!!(三)

為何我們會想寫這篇文章?

AI人工智慧「Microsoft Suphx」(Super Phoenix) 被微軟發表之前,日本麻將平台「天鳳」可說是人類麻將高手雲集的地方,且沒有一個 AI 能在此平台上晉升10段。

這些 AI 包含東大碩士生水上直紀開發的「爆打」、株式会社ドワンゴ (多玩國公司) 開發的「NAGA25」等。

目前該平台有 33 萬玩家,但是有達到 10 段的玩家只有 180 位,比例只有 0.0054%。目前這個平台採用日本麻將規則,有 3 人麻將與 4 人麻將,擁有段位、級數等制度來替玩家分等級。而微軟的麻將AI 「Suphx」,自今年 3 月起在該平台上出沒,強悍的打敗許多麻將玩家。微軟亞洲研究院在這個月正式發表麻將 AI 「Suphx」,並宣佈「她」取得晉升 10 段的頂尖成果⋯⋯

強勢竄升到天鳳十級的人工智慧「 Suphx 」

今年 6 月,由微軟亞洲研究院所開發的麻將 AI人工智慧 系統 Suphx 成為首個在國際知名專業麻將平臺「天鳳」上榮升至十段的 AI人工智慧 系統,這是目前 AI人工智慧 系統在麻將領域取得的最好成績,這個人工智慧系統的實力超越該平臺公開房間頂級人類選手的平均水平。

Suphx,據「天鳳」官方解釋是Super Phoenix 之意。

本麻將平台「天鳳」管制嚴格,使用 AI 在其平台上打牌一率算為違規。若真的要使用 AI 打牌,必須獲得官方的批准。在 33 萬玩家中,目前被批准的 AI 人工智慧只有三個:前面提過的「爆打」、「NAGA25」以及在這次要介紹的主角——今天三月被批准的「Suphx」。這些 AI 人工智慧都是基於深度學習 (deep learning) 的模式如下:
透過深度學習該平台上程度較高「天鳳鳳凰桌」的牌局,研究、分析並找出 AI 自己的思考方式。在分析的過程中,邏輯、細節與會依照其開發工程師的不同,而有所差異。到底哪種方法最好,就由牌局的結果來反應。

AI 人工智慧可以日以繼夜地 24 小時進行 PK,因此這三個人工智慧 AI 都可以累積大量的對局經驗,以下是三個 AI 在天鳳平台上第二高等級的「特上桌」(註:天鳳會根據玩家的段位及 Rate 值把玩家們劃分成四個部分,由高至低分別為:鳳凰桌、特上桌、上級桌以及一般桌,以隔開不同水平的玩家。)半莊戰的成績:

人工智慧「暴打」AI 對戰 30516 次、穩定段位 6597、最高段位九段;

人工智慧「NAGA25」AI 對戰 9557 次、穩定段位 6644 、最高段位八段;

人工智慧「Suphx」AI 對戰 5760 次、穩定段位 8748、最高段位十段。

由以上的數值可知,Suphx 大勝其他另外兩個 AI 人工智慧。取樣樣本很大,在統計學上亦被採信。

Suphx 三月加入天鳳戰局,至六月底短短四個月內,就壓倒性的到達天鳳十段,可說是一名驚人。不過當時微軟尚未正式發表 Suphx,吸引許多「鍵盤柯南」爭相找出其開發者。開發方式仍是個謎。

請看本系列文章下一篇:Suphx 的強大,獲日本雀士界名人讚嘆

 

 

 

其他閱讀

 

 

人工智慧麻將玩家天鳳打敗天下無敵手?!!(二)

人工智慧麻將玩家天鳳打敗天下無敵手?!!(二)
人工智慧麻將玩家天鳳打敗天下無敵手?!!(二)

你聽過人工智慧下象棋,但你聽過人工智慧打麻將嗎?超強的天鳳人工智慧系統絕對超乎你的想像!!(二)

為何我們會想寫這篇文章?

AI人工智慧「Microsoft Suphx」(Super Phoenix) 被微軟發表之前,日本麻將平台「天鳳」可說是人類麻將高手雲集的地方,且沒有一個 AI 能在此平台上晉升10段。

這些 AI 包含東大碩士生水上直紀開發的「爆打」、株式会社ドワンゴ (多玩國公司) 開發的「NAGA25」等。

目前該平台有 33 萬玩家,但是有達到 10 段的玩家只有 180 位,比例只有 0.0054%。目前這個平台採用日本麻將規則,有 3 人麻將與 4 人麻將,擁有段位、級數等制度來替玩家分等級。而微軟的麻將AI 「Suphx」,自今年 3 月起在該平台上出沒,強悍的打敗許多麻將玩家。微軟亞洲研究院在這個月正式發表麻將 AI 「Suphx」,並宣佈「她」取得晉升 10 段的頂尖成果⋯⋯

強勢竄升到天鳳十級的人工智慧「 Suphx 」

今年 6 月,由微軟亞洲研究院所開發的麻將 AI人工智慧 系統 Suphx 成為首個在國際知名專業麻將平臺「天鳳」上榮升至十段的 AI人工智慧 系統,這是目前 AI人工智慧 系統在麻將領域取得的最好成績,這個人工智慧系統的實力超越該平臺公開房間頂級人類選手的平均水平。

Suphx,據「天鳳」官方解釋是Super Phoenix 之意。

本麻將平台「天鳳」管制嚴格,使用 AI 在其平台上打牌一率算為違規。若真的要使用 AI 打牌,必須獲得官方的批准。在 33 萬玩家中,目前被批准的 AI 人工智慧只有三個:前面提過的「爆打」、「NAGA25」以及在這次要介紹的主角——今天三月被批准的「Suphx」。這些 AI 人工智慧都是基於深度學習 (deep learning) 的模式如下:
透過深度學習該平台上程度較高「天鳳鳳凰桌」的牌局,研究、分析並找出 AI 自己的思考方式。在分析的過程中,邏輯、細節與會依照其開發工程師的不同,而有所差異。到底哪種方法最好,就由牌局的結果來反應。

AI 人工智慧可以日以繼夜地 24 小時進行 PK,因此這三個人工智慧 AI 都可以累積大量的對局經驗,以下是三個 AI 在天鳳平台上第二高等級的「特上桌」(註:天鳳會根據玩家的段位及 Rate 值把玩家們劃分成四個部分,由高至低分別為:鳳凰桌、特上桌、上級桌以及一般桌,以隔開不同水平的玩家。)半莊戰的成績:

人工智慧「暴打」AI 對戰 30516 次、穩定段位 6597、最高段位九段;

人工智慧「NAGA25」AI 對戰 9557 次、穩定段位 6644 、最高段位八段;

人工智慧「Suphx」AI 對戰 5760 次、穩定段位 8748、最高段位十段。

由以上的數值可知,Suphx 大勝其他另外兩個 AI 人工智慧。取樣樣本很大,在統計學上亦被採信。

Suphx 三月加入天鳳戰局,至六月底短短四個月內,就壓倒性的到達天鳳十段,可說是一名驚人。不過當時微軟尚未正式發表 Suphx,吸引許多「鍵盤柯南」爭相找出其開發者。開發方式仍是個謎。

強勢竄升到天鳳十級的人工智慧「 Suphx 」請看本系列文章下一篇:

 

 

 

其他閱讀

 

 

 

人工智慧麻將玩家天鳳打敗天下無敵手?!!(一)

人工智慧麻將玩家天鳳打敗天下無敵手?!!(一)
人工智慧麻將玩家天鳳打敗天下無敵手?!!(一)

你聽過人工智慧下象棋,但你聽過人工智慧打麻將嗎?超強的天鳳人工智慧系統絕對超乎你的想像!!(一)

為何我們會想寫這篇文章?

AI人工智慧「Microsoft Suphx」(Super Phoenix) 被微軟發表之前,日本麻將平台「天鳳」可說是人類麻將高手雲集的地方,且沒有一個 AI 能在此平台上晉升10段。

這些 AI 包含東大碩士生水上直紀開發的「爆打」、株式会社ドワンゴ (多玩國公司) 開發的「NAGA25」等。

目前該平台有 33 萬玩家,但是有達到 10 段的玩家只有 180 位,比例只有 0.0054%。目前這個平台採用日本麻將規則,有 3 人麻將與 4 人麻將,擁有段位、級數等制度來替玩家分等級。而微軟的麻將AI「Suphx」,自今年 3 月起在該平台上出沒,強悍的打敗許多麻將玩家。微軟亞洲研究院在這個月正式發表麻將 AI 「Suphx」,並宣佈「她」取得晉升 10 段的頂尖成果⋯⋯

關於職業麻將高手齊聚的平台「天鳳」

由於麻將長期在中華地區民間流傳,自古以來,隨著地區、玩家的不同而有不同的玩法和規則,缺乏統一的規則標準和評價體系。日本線上麻將競技平臺「天鳳」,以完善的競技規則、專業的段位體系,成為了業界首屈一指的專業麻將平臺,受到職業麻將界玩家的認可。「天鳳」吸引了全球近 33 萬名麻將愛好玩家,其中不乏大量的專業麻將選手。

天鳳平臺為高水平麻將玩家提供兩種競技房間:「特上房」對四段以上所有玩家免費開放,允許 AI人工智慧 參與遊戲,目前所有玩家在此房間的最高段位是十段;「鳳凰房」僅對七段以上的人類付費玩家開放,目前不允許 AI人工智慧 參與遊戲,在該房間能夠達到的最高段位是十一段,稱為「天鳳位」。自天鳳平臺在 2006 年推出以來,全平臺達到四人麻將天鳳位的麻將高手僅有13位,曾經達到過十段的選手約有 180 位,而現役十段的人類選手也僅有十幾位。

由於單局麻將的輸贏,不僅僅取決於玩家的實力。從發牌到抽牌,4 位玩家的所拿到的牌均充滿了不確定性,運氣也會大大的影響結果。唯有大量的麻將對局數,才能真實反應玩家的平均水平。天鳳平臺通過計算穩定段位(Stable Rank)來衡量玩家的真實實力水平。玩家的段位越高,在比賽中排位第四受到的點數懲罰也越多,點數扣除到一定程度會導致降段,因此取得一個高而穩定的穩定段位是非常不易的。

關於職業麻將高手齊聚的平台「天鳳」請看本系列文章下一篇:

 

 

 

其他閱讀

 

 

人工智慧天鳳的誕生讓許多麻將玩家嚇到吃手手!!(4)

人工智慧天鳳的誕生讓許多麻將玩家嚇到吃手手!!(4)
人工智慧天鳳的誕生讓許多麻將玩家嚇到吃手手!!(4)

人工智慧系統也會打麻將!!你沒看錯~ 還不知道天鳳有多厲害嗎? 往下讀就對了!! (4)

為何我們會想寫這篇文章?

AI人工智慧「Microsoft Suphx」(Super Phoenix) 被微軟發表之前,日本麻將平台「天鳳」可說是人類麻將高手雲集的地方,且沒有一個 AI 能在此平台上晉升10段。

這些 AI 包含東大碩士生水上直紀開發的「爆打」、株式会社ドワンゴ (多玩國公司) 開發的「NAGA25」等。

目前該平台有 33 萬玩家,但是有達到 10 段的玩家只有 180 位,比例只有 0.0054%。目前這個平台採用日本麻將規則,有 3 人麻將與 4 人麻將,擁有段位、級數等制度來替玩家分等級。而微軟的麻將 AI 「Suphx」,自今年 3 月起在該平台上出沒,強悍的打敗許多麻將玩家。微軟亞洲研究院在這個月正式發表麻將 AI 「Suphx」,並宣佈「她」取得晉升 10 段的頂尖成果⋯⋯

Suphx 的強大,獲日本雀士界名人讚嘆

日本麻將玩家中家喻戶曉的知名玩家朝倉康心(天鳳 ID 為「ASAPIN」)為天鳳玩家中率先到達「天鳳位」的第一人,是公認的天鳳位中的最強玩家之一。他同樣也對 Suphx這人工智慧系統 甘拜下風,在社交媒體上表示:「我看了 Suphx 的比賽,我感覺它好像比我更強大!」;他甚至還說到:「⋯⋯有種《獵人》漫畫尼特羅會長看到尼飛彼多的感覺。」

今年 6 月,「太くないお」 成為世界上第 15 名取得三人麻將天鳳位的玩家,他也是第一位在四人麻將和三人麻將中均取得天鳳位的頂級玩家。他說:「我已經看了300 多場 Suphx 的比賽,我甚至不再觀看人類玩家的比賽了。我從Suphx 身上學到非常多新的技術,它們對於我的三人麻將打法有著非常大的幫助和啟發意義。」

Suphx人工智慧的傑出表現也獲得了天鳳平臺官方的認可與青睞:「毫無疑問,Suphx 是迄今為止段位最高的麻將 AI。我們在考慮將 Suphx 的所有比賽錄影歸檔,以分享給全平臺的其他麻將玩家參考、學習。我們也正在和麻將社區中的眾多玩家討論:是否可以破例允許 Suphx 進入只有人類玩家才能參與的「鳳凰房」進行比賽。這樣,我們將有機會欣賞到更加激烈和精彩紛呈的比賽。」

天鳳平臺開發公司 C-EGG 的 CEO 角田真吾表示:「這是一項巨大的突破,Suphx 不僅僅幫助我們用更智能的方式發展傳統文化,更顯示出擴張AI能力極限的可能性,我想這對天鳳平臺、麻將社區乃至社會都是一個令人振奮的事情。」

直至八月底,微軟在記者會過後發出新聞稿,講述 Suphx人工智慧的核心技術、研究成果等等。

至於微軟在研發 Suphx 有遇到什麼樣的挑戰呢?請看這篇:人工智慧麻將Suphx研發難度更勝AlphaGo?看看微軟怎麼說!

 

 

 

其他閱讀

 

 

 

 

人工智慧天鳳的誕生讓許多麻將玩家嚇到吃手手!!(3)

人工智慧天鳳的誕生讓許多麻將玩家嚇到吃手手!!(3)
人工智慧天鳳的誕生讓許多麻將玩家嚇到吃手手!!(3)

人工智慧系統也會打麻將!!你沒看錯~ 還不知道天鳳有多厲害嗎? 往下讀就對了!! (3)

為何我們會想寫這篇文章?

AI人工智慧「Microsoft Suphx」(Super Phoenix) 被微軟發表之前,日本麻將平台「天鳳」可說是人類麻將高手雲集的地方,且沒有一個 AI 能在此平台上晉升10段。

這些 AI 包含東大碩士生水上直紀開發的「爆打」、株式会社ドワンゴ (多玩國公司) 開發的「NAGA25」等。

目前該平台有 33 萬玩家,但是有達到 10 段的玩家只有 180 位,比例只有 0.0054%。目前這個平台採用日本麻將規則,有 3 人麻將與 4 人麻將,擁有段位、級數等制度來替玩家分等級。而微軟的麻將AI 「Suphx」,自今年 3 月起在該平台上出沒,強悍的打敗許多麻將玩家。微軟亞洲研究院在這個月正式發表麻將 AI 「Suphx」,並宣佈「她」取得晉升 10 段的頂尖成果⋯⋯

強勢竄升到天鳳十級的人工智慧「 Suphx 」

今年 6 月,由微軟亞洲研究院所開發的麻將 AI人工智慧 系統 Suphx 成為首個在國際知名專業麻將平臺「天鳳」上榮升至十段的 AI人工智慧 系統,這是目前 AI人工智慧 系統在麻將領域取得的最好成績,這個人工智慧系統的實力超越該平臺公開房間頂級人類選手的平均水平。

Suphx,據「天鳳」官方解釋是Super Phoenix 之意。

本麻將平台「天鳳」管制嚴格,使用 AI 在其平台上打牌一率算為違規。若真的要使用 AI 打牌,必須獲得官方的批准。在 33 萬玩家中,目前被批准的 AI 人工智慧只有三個:前面提過的「爆打」、「NAGA25」以及在這次要介紹的主角——今天三月被批准的「Suphx」。這些 AI 人工智慧都是基於深度學習 (deep learning) 的模式如下:
透過深度學習該平台上程度較高「天鳳鳳凰桌」的牌局,研究、分析並找出 AI 自己的思考方式。在分析的過程中,邏輯、細節與會依照其開發工程師的不同,而有所差異。到底哪種方法最好,就由牌局的結果來反應。

AI 人工智慧可以日以繼夜地 24 小時進行 PK,因此這三個人工智慧 AI 都可以累積大量的對局經驗,以下是三個 AI 在天鳳平台上第二高等級的「特上桌」(註:天鳳會根據玩家的段位及 Rate 值把玩家們劃分成四個部分,由高至低分別為:鳳凰桌、特上桌、上級桌以及一般桌,以隔開不同水平的玩家。)半莊戰的成績:

人工智慧「暴打」AI 對戰 30516 次、穩定段位 6597、最高段位九段;

人工智慧「NAGA25」AI 對戰 9557 次、穩定段位 6644 、最高段位八段;

人工智慧「Suphx」AI 對戰 5760 次、穩定段位 8748、最高段位十段。

由以上的數值可知,Suphx 大勝其他另外兩個 AI 人工智慧。取樣樣本很大,在統計學上亦被採信。

Suphx 三月加入天鳳戰局,至六月底短短四個月內,就壓倒性的到達天鳳十段,可說是一名驚人。不過當時微軟尚未正式發表 Suphx,吸引許多「鍵盤柯南」爭相找出其開發者。開發方式仍是個謎。

請看本系列文章下一篇:Suphx 的強大,獲日本雀士界名人讚嘆

 

 

 

其他閱讀