有了元宇宙痛覺模擬器就能版分之百模擬痛覺?!

有了元宇宙痛覺模擬器就能版分之百模擬痛覺?!
有了元宇宙痛覺模擬器就能版分之百模擬痛覺?!

你聽過在虛擬的元宇宙裡也能體驗到觸覺和痛覺嗎?日本的最新發明最近推出了能讓你感受到痛覺的產品喔~好奇的話快往下看吧!!

看過電影《駭客任務》、《一級玩家》的讀者應該都有印象,電影中的主角們只要在虛擬世界中受傷或死亡,現實肉體也會跟著受創。雖然目前的科技已經慢慢打造出元宇宙的雛型以及相關應用,但是還不能完全做到像電影一般真實。不過日本一家新創,日前推出了一項讓用戶在元宇宙中也能感受到「痛覺」的產品。

元宇宙受傷,現實世界也會痛?

日本新創公司 H2L 發明了一種腕帶,讓用戶在虛擬世界中四處走動時,也能感受到疼痛和物體重量等感覺。這項產品可檢測人體肌肉彎曲,讓用戶在虛擬世界中的角色模仿身體運動,並透過電流刺激佩戴者,讓用戶能夠感受物體的存在和重量,甚至能感覺到皮膚被捏住或被鳥啄皮膚。

公司的聯合創始人兼執行長 Emi Tamaki 認為,痛苦的體驗能將虛擬世界轉變為真實的環境,並增加臨場感和沈浸感。

Emi Tamaki 在十幾歲的時候因為心臟病而有過一次瀕死體驗。這樣的經驗讓她產生了一個想法:如果可以複製物理上的體驗並將其與電腦聯繫起來呢?

身為一名專注於觸覺技術的研究員,Tamaki 希望到 2029 年能「將人類從身體、時間和空間等限制中完全解放出來。」

不過,Tamaki 也相信,這項技術將來能讓世上所有像她這樣患有慢性疾病的人都能夠隨時隨地自由旅行。

推薦閱讀:「超能力」具現化?臉書推手腕 AR 感測器 讓你隔空操縱介面

祖克柏開發觸覺手套,在元宇宙也能玩疊疊樂

其實 Tamaki 並不是唯一一個想讓人們在虛擬世界中感受事物的人,祖克柏也在研究觸覺手套

藉由手套可以確定人的手在虛擬場景中的位置,以及如何與虛擬物體接觸。然後手套會模擬壓力、紋理和振動等感覺,以在虛擬現實中重現物體的感覺。這些技術的概念就是讓用戶能更加沉浸在虛擬現實中。透過觸覺手套,用戶也可以在虛擬世界 metaverse 中直接進行擲骰子、玩積木和國際象棋、握手和碰拳等動作。

去年 Meta 開啟了元宇宙的序章,並宣佈人類將很快生活在元宇宙中。雖然這對於一般人來說,聽起來相當科幻又具有未來感,但我們其實早就已經生活在一個數位生態系統中了。現在的我們透過小小的螢幕,24 小時全年無休都可以收到各種訊息和新聞。未來在元宇宙的世界中來去自如,對人類的影響是什麼,只有時間能證明一切。

推薦閱讀:AI 是否毀滅人除了聽覺視覺,人工智慧也有觸覺了!祖克柏推ReSkin進軍元宇宙


本文轉載自科技報橘(原標題:日本新創推元宇宙痛覺模擬器,不只有感覺,連痛覺都完美複製!,僅反映專家作者意見,不代表本站立場。首圖為示意圖,與本文無關,來源:Unsplash

責任編輯/Steve

更多元宇宙或人工智慧相關文章請點閱下方連結

其他閱讀

【機器學習懶人包】 10種演算法圖解-從監督式到非監督式學習

AI 人工智慧、ML 機器學習、深度學習、Python 是什麼? 看這一篇就對了!

元宇宙也吃得到大麥克!麥當勞申請「McMetaverse」等10項虛擬餐廳商標

「超能力」具現化?臉書推手腕 AR 感測器 讓你隔空操縱介面

人工智慧科技氾濫?!AI真的有必要和軍武結合嗎?

人工智慧已能成功控制核融合反應?!關鍵就在這兒~

我的腿呢?在Meta世界裡沒有下半身的原因原來是這樣~

不用出聲也能使用人工智慧語音助理?!只需要這麼做!!

不用出聲也能使用人工智慧語音助理?!只需要這麼做!!
不用出聲也能使用人工智慧語音助理?!只需要這麼做!!

你聽過不用出聲的人工智慧語音助理嗎?最新Speechin項鍊讓你不用出聲~靠下巴就能使用語音助理服務喔!!

圖書館內喊「嗨 SIRI」 太尷尬?讓無聲人工智慧語音助理幫助你

直接開口詢問、指示 SIRI,進而解決己身需求,已是 3C 智慧產品廣泛使用的日常風景。然而,若是在安靜的環境中呢?想像一下,如果你在靜謐的圖書館或是針落有聲的會議室裡,開口詢問:「嘿 Siri,明天天氣如何?」似乎有點尷尬。

當你亟需向你的人工智慧助理下指令,卻遇到上述需要保持安靜、無法說話的情況怎麼辦?

拯救你的無聲尷尬!透過下巴動作就能辨識的語音助理項鍊 SpeeChin

不用擔心!為了拯救你的無聲尷尬,康乃爾大學資訊科學助理教授 Cheng Zhang 和博士生  Ruidong Zhang,發明了一款項鍊型的人工智慧語音助理「SpeeChin」。這款項鍊配備了紅外線鏡頭、微處理器、電池和藍牙模組,項鍊外盒配有可提高穩定性的機翼造型平衡器,亦於項鍊盒底部配置了一枚硬幣以平衡配重。

SpeeChin 特性如同一般項鍊,使用銀鍊掛在脖子上,其紅外線鏡頭裝置於 3D 列印的項鍊盒上方,使鏡頭穩定指向佩戴者的下巴。SpeeChin 能夠基於下巴運動軌跡,捕捉「頸部和臉部皮膚變形圖像」,進而辨識無聲語言。目前的實驗結果顯示,SpeeChin 已能辨識簡單的英文和中文單詞。

已可辨識中英文!移動偵測問題仍待解決

在最初的實驗裡,研究人員測量了 10 名英文使用者及 10 名中文使用者,共 20 位參與者的下巴基線,接著使用差分圖像訓練 SpeeChin 辨識簡單指令,應用機器學習演算法將辨識結果傳到配對的智慧型手機,就像用另一種方式溝通的 Siri。隱私問題也不必擔憂,SpeeChin 只會對準佩戴者的下巴,不會拍到使用者的臉。

實驗方式為:10 位英文使用者無聲說出 54 條指令,包括數字、互動、呼叫語音助理、標點和導航,10 位中文參與者的 44 條指令也一樣。最後實驗結果顯示,SpeeChin 的英文/中文命令辨識能力平均準確率分別為 90.5% 和 91.6%。

此外,研究人員還要求其中 6 名參與者在行走時默念 10 個中文和英文片語,然而因為參與者頭部以不可預測的方式移動,所以最後成功率較低。顯示移動偵測的準確度是尚待解決的問題。

為什麼無聲語音辨識要做成項鍊的形式呢?研究人員認為:項鍊是人們習慣的裝飾品,至於耳掛式設備則可能會有不太舒服的佩戴體驗。雖然人們可能會想「我的手機就是語音辨識設備了啊」,但難免還是會遇到無法出聲的人或場合,此時無聲語音辨識的研究就能派上用場

更多人工智慧相關文章請點閱下方連結

其他閱讀

 

元宇宙也有翻譯蒟蒻了!Meta推全球語言都可翻譯的人工智慧

Google提出Android隱私沙盒,標榜保護用戶資料安全

白帽SEO、黑帽SEO,到底差在哪?

RWD AWD 的差異與優缺點

麥當勞正式註冊十個虛擬餐廳商標!!大舉進攻元宇宙?

義大利廠Brembo幫你實現人工智慧自動煞車的夢想()

Spotify研發人工智慧技術抓住客戶!穩坐串流音樂龍頭!

 

超接地氣Line人工智慧功能登台!!快來試試!!

超接地氣Line人工智慧功能登台!!快來試試!!
超接地氣Line人工智慧功能登台!!快來試試!!

Line也有人工智慧雲端助理啦!!最新功能不僅超好用~也超接地氣!!想更完整運用這些功能嗎?快一起往下看吧!

人工智慧「接地氣」!雲端助理 LINE Clova 立足台灣,發展在地化應用

Line在台灣推出兩項人工智慧服務

LINE 看好 Fintech 與 AI 領域的發展,近年來積極投入研發人工智慧應用、區塊鏈等雲端技術,亦陸續將研發結果整合至通訊服務中。

過去在 LINE 開發者大會「LINE TAIWAN TECHPULSE」中,LINE 台灣就宣布引進 LINE Clova,完成 Clova 服務的在地化目標,並完整介紹其人工智慧技術與企業解決方案。而目前即將在地化的中文 CLOVA 人工智能服務有哪些?答案包含「Clova Note」及「Clova Chatbot」兩大產品線,特別引人矚目!

不怕會議開太久!落落長發言,Clova Note 全都轉換成文字

Clova Note 可以應用在聽打逐字稿、製作會議記錄,以及將語音訊息轉換成文字訊息等較消磨耐心的工作上,其具備的語音辨識技術(Speech Recognition)和說話者辨別技術(Speaker Diarization)能夠精準將聲音轉換成文字檔案。

過去 LINE Clova 的研發主力多為日文、韓文,如今 LINE 廣招中文工程師,將集聲學模型、發音模型、語音模型三項技術與機器學習於一身的 NEST 模型應用於人工智慧解決方案 Clova Note,不但擅長辨識日常對話與長篇幅的語句,還有在噪音環境中精準優秀的辨識能力。Clova Note 預計今年就會在台灣市場推出。

不怕不會寫程式!不需代碼就能架構的 Clover Chatbot 對話機器人

許多企業會使用 LINE 官方帳號作為品牌客服服務的主要平台。LINE 台灣服務企劃部平台事業發展負責人吳元豪表示,訓練人機對話系統工程浩大且過程繁複,因此 LINE 為需要大量降低人工作業的用戶,開發出「Chatbot Builder」平台,用以架構對話機器人架構。用戶只需要準備機器人需要回答的問題、答案與訓練資料就可以製作專屬的 Clova Chatbot 對話機器人模型來應用於 LINE 官方帳號,它最大的優勢,就是應用人工智慧技術來訓練模型,從而省略撰寫程式碼的過程與成本。

LINE 更計劃於 2022 年第一季推出「帳號移動健檢」功能,運用 Clova Chatbot 的人工智慧方案,串接官方帳號後端系統,自動比對使用者個資與用戶資訊,以求快速精準地幫助用戶解決問題。

更多人工智慧相關文章請點閱下方連結

其他閱讀

Google 為保護隱私,棄Cookie 卻改用人工智慧?

FLoC取代Cookie4大爭議,Google提出新解「主題取代群組」

人工智慧導入 LINE 服務:LINE BRAIN 計劃 2020 在台啟動

Line Clova 登台確定!讓人工智慧幫你接電話、訂餐廳

以色列就是靠這款人工智慧裝置大大提升戰鬥力?!()

只要動動嘴~寫程式最枯燥乏味的地方由人工智慧幫你完成!()

UI,UX設計師非收不可的年度12個超狂網頁設計工具!!(1)

能否赴死由人工智慧幫你決定?澳洲醫生新開發顛覆三觀!(下)

能否赴死由人工智慧幫你決定?澳洲醫生新開發顛覆三觀!(下)
能否赴死由人工智慧幫你決定?澳洲醫生新開發顛覆三觀!(下)

澳洲醫生開發人工智慧 赴死科技,只要通過評估就能赴死?這到底是怎麼運作的?一起來了解一下!(2)

本篇為下篇,上篇請點能否赴死由人工智慧幫你決定?澳洲醫生新開發顛覆三觀!(上)

AI自殺艙會帶來哪些影響?技術、倫理、法律界各持不同觀點

尼奇克會把石棺計畫印在自行創辦的非營利組織「解脫國際」(Exit International)發行的刊物中,並免費提供,只要年滿 50 歲就可取得設計圖、自行用 3D 列印出該自殺機器,如此輕易就可取得「死亡門票」的方式,各界如何看待?

演算法觀察機構:AI 恐削弱人類決定的自主權

讓人工智慧來決定人類的生死,只會削弱、不會增加人類對於 AI 的自主權

對此,關注人工智慧倫理議題的非營利組織「演算法觀察(Algorithmwatch)」政策及倡議團隊負責人穆勒(Angela Müller)指出:科技最終為人類開發,而人工智慧也是倚賴過去所學習的資料累積來做決定,而這兩者隱含的偏見和歧視,無形中都會影響 AI 的決定,「我擔心依賴它(AI)只會削弱、而不是增加我們的自主權」。

對此,尼奇克也只好承認當前的人工智慧應用與技術仍存者取多限制,上有無法解決的問題。但是他也沒有放棄,打算在「石棺」剛推行時與瑞士的醫師合作,確保每位石棺的用戶都經過醫界的專業判斷,以避免爭議;待此 AI 發展完成後,就採用人工智慧與醫師並行的「雙軌制」,消弭外界疑慮之餘也不斷優化 AI 的判斷力。

倫理研究所主任:過度美化自殺、恐引發自殺率

「像石棺這樣的機器會美化自殺,並增加心靈較脆弱或是心理疾病患者的自殺率。」美國喬治城大學(Georgetown University)甘迺迪倫理研究所(Kennedy Institute of Ethics)的主任 Daniel Sulmasy 認為如此集結最新人工智慧科技、富有設計感外觀的 AI 自殺機器根本就是「美化自殺」,恐引發自殺風潮。

法律專家們各持不同看法

尼奇克委託的法律顧問——瑞士聖加侖大學(University of St Gallen)的法律教授赫里曼(Daniel Huerlimann)表示:石棺在瑞士並無違法疑慮。

赫里曼教授指出此石棺並不在瑞士法律所定義的「醫療器材」之內,因此並不會受到《瑞士醫療器材法》(Swiss Therapeutic Products Act)的規範。除此之外,它也沒有違反氮氣、危險化學物質或武器等相關法律的嫌疑。面對這樣的結果,尼奇克沾沾自喜地表示:「這樣的結果,讓我們確認沒有遺漏任何法律問題……這表示在瑞士的法律下,無論是安樂死診所想要引入石棺、或瑞士人民想自產自用,都沒有問題。」

畢竟赫里曼是尼奇克所委託的法律顧問,看法可能受制於此。看看第三方的法律、醫學專家如何解釋:

維金格(Kerstin Noelle Vkinger)教授身兼醫師、律師及瑞士蘇黎世大學 (University of Zurich)的法學院教授。她的看法是:「醫療器材會受管制,是因為他們必須要比其他產品更安全⋯⋯一項產品不會因為無異於健康,就可以免於受這些安全要求的規範⋯⋯」

儘管外界的風聲不一,尼奇克仍硬著心,計畫要在瑞士的一間安樂死診所中開始做實驗,且已有 6 位志願者要參與實驗。尼奇克信心滿滿說實驗過程不會有任何意外:「等到我們看到幾個成功案例後,大家就會感到舒服多了。」關於法律問題與爭議的部分,尼奇克則說:等到有人用過石棺並提起訴訟後,這些爭議才可能有解有解。

石棺帶領你「優雅邁向理想之地」?答案只有用戶清楚、且幾無反悔機會

尼奇克誇下海口說:用戶可隨著石棺到心目中的理想之地「優雅地邁向死亡」。

但是尼奇克是否能保證:死後真的會去到他口中的「理想之地」?一時的自殺,或許可暫時解脫;但是死後會去哪裡,恐怕才是最大問題。

一時的自殺,或許可暫時解脫;但是死後會去哪裡,恐怕才是最大問題

珍惜生命,自殺不能解決問題,生命一定可以找到出路。若須諮商或相關協助,可撥衛福部專線「1925」、生命線專線「1995」或張老師服務專線「1980」。

更多人工智慧相關文章請點閱下方連結

其他閱讀

臉書聊天AI再進化!牢記你說過的話、還會主動找答案

FB 用十億張照片讓 AISEER」自主學習!自監督學習大躍進

「超能力」具現化?臉書推手腕 AR 感測器 讓你隔空操縱介面

Google 開發編舞用人工智慧「FACT」,任何音樂都能生成對應舞蹈!

以人工智慧代替洗錢防制人力好輕鬆?!()

人工智慧醫療再進化!!有了這個大腸癌有救了!?

只要說說話~人工智慧就能自動幫你寫程式?()

能否赴死由人工智慧幫你決定?澳洲醫生新開發顛覆三觀!(上)

能否赴死由人工智慧幫你決定?澳洲醫生新開發顛覆三觀!(上)
能否赴死由人工智慧幫你決定?澳洲醫生新開發顛覆三觀!(上)

澳洲醫生開發人工智慧 赴死科技,只要通過評估就能赴死?這到底是怎麼運作的?一起來了解一下!(1)

當醫療用人工智慧助人恢復健康時⋯⋯這位醫生卻開發自殺用AI!

截至目前,許多醫療界與 AI 工程師聯手推出各式各樣的人工智慧應用,目的都是為了要救活病人、降低死亡率,像是日前獲 FDA 批准的內視鏡 AI ,可及早預防與醫治大腸癌、還有 PTT 創辦人杜奕瑾因逝母遺憾,而打造的人工智慧敗血症即時預測 AI

當眾多醫用 AI 在為人類解決問題時⋯⋯有「死亡醫師」之稱的澳洲醫師尼奇克(Philip Nitschke)卻反其道而行,開發了讓人工智能「鑑定」用戶是否該安樂死,並搭配可自行 3D 列印的輔助自殺(assisted suicides)裝置——「石棺(Sarco)」,介紹如以下影片所示:

瑞士安樂死條件太龜毛?他竟讓 AI 來定義你是否「該死」

人工智慧 自殺裝置「石棺(Sarco)」的樣品 ,首次公開於 2018 年荷蘭的阿姆斯特丹喪葬展上,引發不小爭議。之後經過三年的研發,他打算帶著「進化版」的石棺 AI 輔助自殺系統前進瑞士,期待可在第一個通過安樂死合法的國家派上用場。

安樂死原因有哪些?瑞士接受輔助自殺的死者中「25%無罹患絕症」

而瑞士當前的法律僅允許人們在「特定條件」下接受輔助自殺,執行前亦需經過心理狀態評估等程序,才有機會拿到處方箋、並由醫生或醫療單位協助自殺。

當然心理狀態的評估標準見仁見智,在瑞士,每年通過協助自殺而過世的人群當中,有四分之一的人其實並沒有罹患絕症,純粹只是「厭倦了生活」。像是 2014 年通過安樂死而過世的英國退休藝術教師,選擇自殺的原因竟只是「厭倦了充斥著電子郵件、電視、電腦和超市快餐的現代世界」

他讓 AI 取代醫師決定你生死,讓「找死」的過程更民主?

即便如此,尼奇克仍主觀地認為,瑞士有很多醫師不願意開「死亡處方箋」給無病痛的人:例如對活著感到厭倦的長輩等,而他發明的石棺可解決問題,宣稱可「讓死亡的過程更加『民主化』(democratising)⋯⋯」尼奇克說道:「所有理性的成年人都應享有決定要在何時結束生命的權利,不該是被掌握在其他人手上⋯⋯」

只要 AI 說「yes」,你就可一鍵墜入陰間

所以尼奇克在一開始研發「石棺」時,就沒有打算要讓其他醫護人員參與;他把評估用戶心理狀態的重責大任交給冷冰冰的機器:用戶只要通過人工智慧給的測驗後,就能拿到啟用石棺(自殺)的啟動碼、藉此躺入石棺。

躺入石棺後,用戶可輕易按按鈕、或是比手勢等來啟動自殺程序。啟動後石棺就開始調整艙內氮氣、氧氣比例,用戶就會漸漸失去意識而死亡。他也指出:用戶在啟動石棺後若反悔,可按下緊急停止鈕以獲得重生機會。但是若反悔時,意識已薄弱到失去按下按鈕的力氣呢?

本篇為上篇,下篇請點能否赴死由人工智慧幫你決定?澳洲醫生新開發顛覆三觀!(下)

更多人工智慧相關文章請點閱下方連結

其他閱讀

臉書聊天AI再進化!牢記你說過的話、還會主動找答案

FB 用十億張照片讓 AISEER」自主學習!自監督學習大躍進

「超能力」具現化?臉書推手腕 AR 感測器 讓你隔空操縱介面

Google 開發編舞用人工智慧「FACT」,任何音樂都能生成對應舞蹈!

以人工智慧代替洗錢防制人力好輕鬆?!()

人工智慧醫療再進化!!有了這個大腸癌有救了!?

只要說說話~人工智慧就能自動幫你寫程式?()

人工智慧也能自動編舞?什麼音樂都不是問題!?(3)

人工智慧也能自動編舞?什麼音樂都不是問題!?(3)
人工智慧也能自動編舞?什麼音樂都不是問題!?(3)

人工智慧自動編舞系統誕生!除了能駕馭各種音樂以外,舞蹈動作還不含糊喔!有興趣的同學快往下看!(3)

本篇為系列文章,上一篇請點人工智慧也能自動編舞?什麼音樂都不是問題!?(2)

與其他人工智慧應用相比:FACT編舞能力一流

將 FACT 的性能,針對各個指標,與其他的人工智慧應用進行比較:

如上表所示,FACT 與三種最先進的編舞人工智慧應用(Li et alDancenet 和 Dance Revolution)相比,FACT 模型生成的動作更逼真,與輸入音樂的相關性更好,並且在以不同的音樂為條件時更多樣化。*注意的是 Li et al生成的運動是不連續的,使得平均運動特徵距離異常高。

Google 還透過使用者研究,評估音樂與動作的相關性:讓每位使用者觀看 10 個影片,片中有一個 FACT 模型與一個隨機對照模型所生成的編舞結果然後讓使用者選擇哪個模型生成的舞步比較能夠與音樂同步。使用者共有 30 名,包含專業舞者以及很少跳舞的人。

結果顯示:81% 的使用者喜歡 FACT 模型生成的結果勝於 「Li et al.」的;跟 Dancenet 相比,71% 的人喜歡 FACT 勝過 Dancenet;跟 Dance Revolution 比較, 77% 的人也更喜歡 FACT。。有趣的是,75% 的參與者喜歡 AIST++ 未配對的舞蹈動作勝於透過 FACT 所生成的。這並不奇怪,因為最初的舞蹈紀錄具有很強的表現力。

定性結果

如下圖所示,與先前 DanceNet(左)與 Li et. al.(中)相較之下,使用 FACT 模型(右)生成的 3D 舞蹈更逼真,並且與音樂的相關性更好。

使用 FACT 人工智慧模型生成更多 3D 舞蹈:

人工智慧發展下一步:為每首歌生成逼真舞蹈

Google 開發了一個人工智慧模型,可以學習音頻與動作對應的關係,還可以基於音樂,生成的高質量 3D 動作序列。由於從音樂生成 3D 動作是一個新興的研究領域,Google 希望此項研究成果能為未來跨模組「音頻-3D 動作」的生成鋪道。

透過這項研究,Google 還發布了迄今為止最大的 3D 人類舞蹈資料庫「AIST++」——具有多視角、多種舞蹈形式、跨模態的 3D 動作數據集,不僅對 3D 動作生成研究有幫助,一般來說,也對人類理解研究幫助。Google 將在 GitHub 中發布代碼,並在此處發布經過訓練的模型。

雖然此項結果給了這個「基於音樂來生成 3D 動作」的議題一個有希望的方向,但還有更多的東西需要探索:像是Google 所使用的方法是基於運動學的、並沒有將舞者和地板間的身體互動考慮進去。因此,若進行全局平移的話,會導致如腳滑動和浮動的假影。因此,接下來的方向是要探索如何為每首音樂來生成多個逼真的舞蹈。

更多人工智慧相關文章請點閱下方連結~

其他閱讀

油價漲免驚!Google Maps 用人工智慧規劃「最省油路線」

人類又輸了?工程師需花數月設計出IC晶片,AI六小時就搞定!

人工智慧幫你診斷皮膚疾病!Google AI鏡頭變身皮膚科幫手

生物學最大謎團被人工智慧 破解!DeepMind 攻克「蛋白質折疊」奧秘

以色列就是靠這款人工智慧裝置大大提升戰鬥力?!()

只要動動嘴~寫程式最枯燥乏味的地方由人工智慧幫你完成!()

半夜情緒不對?人工智慧心理治療APP伴你身邊!!()

人工智慧也能自動編舞?什麼音樂都不是問題!?(2)

人工智慧也能自動編舞?什麼音樂都不是問題!?(2)
人工智慧也能自動編舞?什麼音樂都不是問題!?(2)

人工智慧自動編舞系統誕生!除了能駕馭各種音樂以外,舞蹈動作還不含糊喔!有興趣的同學快往下看!(2)

本篇為系列文章,上一篇請點人工智慧也能自動編舞?什麼音樂都不是問題!?(1)

人工智慧編舞一把罩:FACT 模型

Google 使用上述的 AIST 資料庫,訓練 FACT 模型從音樂生成 3D 舞蹈。該模型先使用動作轉換器與音頻轉換器,分別對一段音樂與一個短的(2 秒)種子動作(seed motion)進行編碼。之後再將嵌入碼連接、發送到跨模型轉換器,該轉換器學習兩種模型之間的對應關係,並生成 N 個未來的動作序列。

然後使用這些序列以自我監督的方式訓練模型。在測試時,Google 將此模型用於自回歸框架,其中所預測的動作則作為下一個生成步驟的輸入。因此,FACT 模型能夠一個框架接著一個框架地,生成長時間的舞蹈動作。

FACT 網絡接收音樂片段 (Y) 和 2 秒的種子運動序列 (X),然後生成與輸入音樂相關的長期未來動作。|圖片出處:Google AI Blog

Google 用三指標評估 FACT 的性能

Google 依據以下所述之三個指標,評估人工智慧 FACT 的性能:

動作品質:我們計算 AIST++ 資料庫中的「真實舞蹈動作序列」與 40 個「模型生成的動作序列」之間的 Frechet 起始距離(FID),每個序列具有 1200 幀鏡頭(20 秒)。我們將基於幾何和動力學特徵的 FID 分別表示為 FID和 FIDk

生成多樣性:之前的工作(指深度慣性姿勢捕捉」:從少許的慣性量測中學習而重建人體姿勢)類似:Google 從 AIST++ 測試集中的 40 個「模型生成動作特徵空間」中,計算平均歐氏距離,用以評估模型生成各式舞蹈動作的能力。,接著再比較幾何特徵空間 (Dist g ) 和動力學特徵空間 (Dist k )。

Google 使用不同的音樂,來生成四個不同的編舞版本:Break、Ballet Jazz、Krump 和 Middle Hip-hop(右),但有兩秒是相同的 Hip-hop 舞蹈動作(左),這些相同的動作被稱為「種子動作」。|圖片出處:Google AI Blog

運動-音樂相關:由於沒有合適的指標來衡量輸入音樂(音樂節拍)與所生成的 3D 動作(動作節拍)之間的相關性。所以 Google 提出了一種新的「節拍對齊分數 (BeatAlign)」作為指標。

人工智慧也能自動編舞?什麼音樂都不是問題!?(1)

人工智慧也能自動編舞?什麼音樂都不是問題!?(1)
人工智慧也能自動編舞?什麼音樂都不是問題!?(1)

 

人工智慧自動編舞系統誕生!除了能駕馭各種音樂以外,舞蹈動作還不含糊喔!有興趣的同學快往下看!(1)

人工智慧學編舞,動作搭配音樂複雜度高

Google 正進行一項人工智慧研究,開發稱為「FACT (Full-Attention Cross-modal Transformer)」的模型,可以模仿、理解舞蹈動作,甚至可提高個人的編舞能力。Google 研究團隊為了訓練該模型,也隨之發布一個大規模、多模態的 3D 舞蹈動作資料庫「AIST++」,包含長達 5.2 小時的 1408 個 3D 舞蹈動作序列,涵蓋 10 種舞蹈類型。都包含了已知相機位置的多視角影片,可生成逼真流暢的 3D 舞蹈動作。

Google 提到:雖然隨著音樂節拍編排出動作,是人類的本能;然而舞蹈是「需要練習」的藝術形式。專業的舞者都需要經過大量的、包含各式各樣舞步的曲目來訓練,才有編舞能力。這樣的訓練,對人類來說已不容易;對 ML(Maching Learning,機器學習)來說更是難上加難。因為要使用人工智慧來實現編舞,需要生成動力複雜度高的連續動作,同時還要捕捉動作與配樂間的非線性關係。

人工智慧如何學舞?Google修正AIST舞蹈資料庫成教材

Google 從現有的 AIST 舞蹈影片資料庫(一組帶有音樂伴奏的舞蹈影片,但無任何 3D 信息)生成 3D 動作資料庫。AIST 包含 10 種舞蹈類型:Old School(地板舞 Breaking、機械舞 Popping、鎖舞 Locking 和 Waack)以及 New School(Middle Hip-Hop、LA-style Hip-Hop、House、Krump、Street Jazz 和 Ballet Jazz),雖然包含了許多舞者的多視角影片,但鏡頭都沒有經過校準。 Google 依研究人員的需求,根據常用的 SMPL 3D模型參數,修復 AIST 影片的拍攝校準正後的數值和 3D 人體動作,重建為「AIST++ 數位資料庫」,包含與音樂搭配的各種 3D 動作,並將上述十種舞蹈均勻地呈現在動作中、以每分鐘節拍 (BPM) 為單位涵蓋各種音樂節奏。每種舞蹈類型都含 85% 的基本動作和 15% 的進階動作(舞者自由設計的更長編舞)。

未經修正的 AIST 舞蹈影片資料庫如下所示:

Google 依研究人員的需求,根據常用的 SMPL 3D 模型參數,修復 AIST 影片的拍攝校準正後的數值,以及 3D 人體動作,重建為「AIST++」數位資料庫。重建後的「AIST++」包含與音樂搭配的各種 3D 動作,並將上述十種舞蹈均勻地呈現在動作中、以每分鐘節拍 (BPM) 為單位涵蓋各種音樂節奏。每種舞蹈類型都含 85% 的基本動作和 15% 的進階動作(舞者自由設計的更長編舞)。

AIST++ 數位資料庫還包括多視角同步圖片資訊,以便於應用在其他研究(如 2D/3D人體姿勢評估)。就我們所知,含有 1408 個序列、30 個主題和 10 個舞蹈流派的 AIST++ 是當前最大的 3D 人類舞蹈資料庫。

Google 使用 SMPL 3D 模型參數,將 AIST 舞蹈影片資料庫(上圖左)重建為具有 3D 動作的「AIST++」數位資料庫(上圖右)

AIST 資料庫原作為教學使用,記錄了多個真人舞者以相同的編舞搭配不同配樂的舞蹈影片——這是舞蹈中的常見作法。由於模型需要學習音樂和動作間的一對多布局,因此在跨模型序列到序列生成(cross-modal sequence-to-sequence generation)中,斷定是獨一無二的挑戰!Google 在 AIST++ 上仔細構建了非重疊訓練(non-overlapping train)和測試子集,以確保在子集間既不共享編舞、也不共享音樂。

本篇為系列文章,下一篇請點人工智慧也能自動編舞?什麼音樂都不是問題!?(2)

更多人工智慧相關文章請點閱下方連結~

其他閱讀

油價漲免驚!Google Maps 用人工智慧規劃「最省油路線」

人類又輸了?工程師需花數月設計出IC晶片,AI六小時就搞定!

人工智慧幫你診斷皮膚疾病!Google AI鏡頭變身皮膚科幫手

生物學最大謎團被人工智慧 破解!DeepMind 攻克「蛋白質折疊」奧秘

以色列就是靠這款人工智慧裝置大大提升戰鬥力?!()

只要動動嘴~寫程式最枯燥乏味的地方由人工智慧幫你完成!()

半夜情緒不對?人工智慧心理治療APP伴你身邊!!()

寫程式超簡單?只要會說英文,剩下的人工智慧幫你搞定!!(下)

寫程式超簡單?只要會說英文,剩下的人工智慧幫你搞定!!(下)
寫程式超簡單?只要會說英文,剩下的人工智慧幫你搞定!!(下)

有了這項人工智慧技術再也不會嫌寫程式麻煩了!!只要說幾句英文~人工智慧幫你搞定!!是不是很不可思議!!(下)

本篇為下篇,上篇請點寫程式超簡單?只要會說英文,剩下的人工智慧幫你搞定!!(上)

OpenAI:共同維持單純生態讓程式社群「產生更高價值」

當被問及這些抱怨時,Greg Brockman回答:「新技術即將到來,確實需要這場辯論,即使會有別於過往社群的意見,我們將接受反饋並以不同的方式做事。」他認為人工智慧社群始終受益於Open AI的工作。「這會對生態系統有很大的價值,歸根結底,這些技術可以重塑我們的經濟,為所有人創造一個更美好的世界。」Brockman解釋道。

Codex 也肯定會為 OpenAI 及其投資者創造價值。2015年公司以非營利實驗室的身份起步,為了吸引外部資金,它在 2019 年轉為「利潤上限」 (capped-profit)模式,儘管Codex最初是作為免費API發布的,但 OpenAI 預期未來將對使用者收費。

OpenAI表示它不想使用Codex構建自己的工具,因為它更適合改進人工智慧核心模型。Brockman說:「我們意識到如果追求成為任何一項工具,就會切斷任何其他路線。作為一家初創公司,可選擇最擅長一件事。毫無疑問,此系統正為所有模型製作更好的版本。」

從 Codex 展示案例中猜測語言喜好

雖然 Codex 聽起來非常令人興奮,但在真正的工程師掌握之前很難判斷它的全部功能。但即使在不是工程師的情況下,確實看到 Codex 的運行情況,並且對人工智慧有一些想法。

OpenAI 的 Brockman 和 Codex 負責人 Wojciech Zaremba 線上展示使用 Codex 創建網站遊戲,Brockman 在 Google 圖片上找到一個人的剪影,告訴 Codex 在貼上 URL 前「從頁面添加這個人的圖像」,剪影隨後出現在視窗上,然後 Brockman 修改它的大小,說道:「讓這個人變大了一點」、「現在可以用左右箭頭鍵控制它」。

OpenAI 的 Brockman 使用 Codex 創建網站遊戲
OpenAI 的 Brockman 使用 Codex 創建網站遊戲 ,使用口語來「使喚」Codex 寫出相應代碼。

人工智慧藝術與科學般的對 Codex 下達指令

這一切都非常順利。人影開始在視窗上晃來晃去,但很快就遇到一個問題:它一直在視窗外消失。為了阻止這情況,Brockman額外下達指令:「不斷檢查這個人是否離開頁面,如果是就把它放回頁面上。」這阻止它移出視線,但很好奇指令需要多麼精確。我建議嘗試不同的方法:「確保此人無法退出頁面。」這這也有效,由於 Brockman 和 Zaremba 無法解釋的原因,它還改變圖形的寬度,將其壓扁在視窗上。

雖然此人工智慧應用實例很好的展現出來,同時也說明程式的侷限性。OpenAI 沒有聲稱它依定完全可讀懂人的大腦、完美的執行每個指令。相反,它需要深思熟慮和反覆的嘗試。Codex不會在一夜之間將不會撰寫程式碼的人變成專家工程師,但它肯定比任何其他程式語言更容易明白與學習。

更多人工智慧文章請點閱下方連結~

 

 

 

其他閱讀

自家的人工智慧太會寫假新聞!馬斯克嚇到離開OpenAI

給人工智慧幾它給你完整文章!奇幻、科普、假新聞任你挑

人工智慧寫文太療癒,奪排行榜冠軍!學霸敲碗求更新

人工智慧寫「不想消滅人類」登《衛報》……記者將被 AI 取代?

深夜情緒潰堤?讓人工智慧心理治療APP陪伴安撫你!!()

奧運即將要用人工智慧參與評分?!這樣的標準會變得更公正嗎?

蘋果為了守護兒童遠離色情開發最新AI卻惹來隱私爭議?!()

寫程式超簡單?只要會說英文,剩下的人工智慧幫你搞定!!(上)

寫程式超簡單?只要會說英文,剩下的人工智慧幫你搞定!!(上)
寫程式超簡單?只要會說英文,剩下的人工智慧幫你搞定!!(上)

有了這項人工智慧技術再也不會嫌寫程式麻煩了!!只要說幾句英文~人工智慧幫你搞定!!是不是很不可思議!!(上)

人工智慧發展太快!Codex可將英文翻譯成程式碼

你還在苦於不會寫程式碼,落後於其他人嗎?隨著人工智慧技術越來越強,未來程式設計不再是需要編寫複雜的代碼,甚至會說英文就能 coding!

馬斯克創辦、致力於人工智慧的研發公司 OpenAI 日前發佈一款新的機器學習系統「Codex」,可將英語直譯成程式語言。期望這樣的人工智慧應用,能讓程式設計變得更簡單便利,讓更多人能共同參與。

Codex:能將人話翻成Python等10多種程式碼的人工智慧應用

OpenAI 的 CTO 兼聯合創辦人 Greg Brockman 和 Codex 負責人 Wojciech Zaremba 線上展示 Codex 的各式用途,揭開它神秘的面紗:簡約的介面、能將自然語言翻譯成 Python、JavaScript、Go、Perl、PHP、Ruby、Swift 和 Shell 等 10 多種主流程式語言的能力。

Codex 就像是一位資料科學家,可將資料下載、歸納後予以分析、製作圖表。還可以把人話翻譯成電腦程式碼,實現多種程式語言之間的互譯,更進一步建構出基礎的網站和遊戲。

舉例來說:使用者在指令欄中,使用英文「寫」出一個上方有大標、側邊有導覽列的網頁後,Codex 便會將此指令翻譯為完整的程式碼。雖然此系統並非萬無一失,操作執行時仍需要耐心,但已證明可為不同領域帶來更佳效率與價值。

程式設計中「最乏味」的關鍵步驟,人工智慧一把罩!

OpenAI 的 CTO 兼聯合創始人 Greg Brockman 說他們將 Codex 這項人工智慧定義為「增加工程師的人數」。他說:「編寫程式語言有兩個部分:首先,你必須認真思考、理解一個問題;之後將這些需要執行的片段——無論是函數還是API——轉譯成現有程式語言。」而後者的「轉譯」步驟是最乏味、但也是最關鍵的,這時就只能請出人工智能「Codex」為工程師消除繁重的工作。

Codex 恐延續 Copilot 的代碼版權爭議

OpenAI 使用早期版本的 Codex 為 GitHub 構建了一個名為 Copilot 的工具,這是一個微軟的原始碼儲存庫(因為微軟本身就是 OpenAI 的密切合作夥伴)。Copilot 類似 Gmail 中輸入內容時修正拼字和文法錯誤的工具,能夠提供開發者整行或整個函式的程式碼編寫、修正建議。不過 OpenAI 的新版 Codex 更加先進靈活,除了 coding 外,甚至可以自行創建程式碼。

Codex 建立在 OpenAI 的語言生成,延伸 GPT-3 的模型,訓練資料包含自然語言,以及數十億的開放原始碼。GPT-3 本身就擁有閱讀、生成人類自然語言的能力,而 Codex 更是近一步地優化 GPT-3 原有的能力,甚至可從網路上抓取開放原始碼儲存庫並且進行培訓。

這樣的人工智慧應用與技術,卻有從工程師們的成果中謀利之嫌,讓 OpenAI 飽受爭議。例如過去的 Copilot 工具最受質疑的地方,就是對原代碼的版權侵犯問題。

有開發者表示:「我不同意 GitHub 在未經授權和未經許可的情況下,使用受版權保護的程式碼作爲機器學習產品『Copilot』的訓練資料庫 。Copilot 在未聲明原始碼所有權的狀況下,將這些受版權保護的原始碼放入用戶的軟體中⋯⋯這是對版權擁有者們的作品的的未經授權、未經許可的不當使用。」而 Python Flask 框架的創辦者 Armin Ronacher 更是因為 Copilot 的緣故而退出 GitHub。

同樣批評可能也將會針對 Codex,儘管 OpenAI 表示受到法律合理的保護使用。

本篇為上篇,下篇請點寫程式超簡單?只要會說英文,剩下的人工智慧幫你搞定!!(下)

更多人工智慧文章請點閱下方連結~

 

 

 

其他閱讀

自家的人工智慧太會寫假新聞!馬斯克嚇到離開OpenAI

給人工智慧幾它給你完整文章!奇幻、科普、假新聞任你挑

人工智慧寫文太療癒,奪排行榜冠軍!學霸敲碗求更新

人工智慧寫「不想消滅人類」登《衛報》……記者將被 AI 取代?

深夜情緒潰堤?讓人工智慧心理治療APP陪伴安撫你!!()

奧運即將要用人工智慧參與評分?!這樣的標準會變得更公正嗎?

蘋果為了守護兒童遠離色情開發最新AI卻惹來隱私爭議?!()