CNML格式】 【 】 【打 印】 
【 第1頁 第2頁 第3頁 第4頁 第5頁 第6頁 第7頁 第8頁 第9頁 第10頁 第11頁 】 
麻省理工發布2018年全球十大突破性技術 
http://www.CRNTT.com   2018-09-18 14:04:21


 
  人工智能識別物體的能力已經越來越強了:給它看一百萬張圖片,它就可以用驚人的準確度來告訴你究竟哪張裡面有個行人在過馬路。但是AI幾乎不可能獨自生成行人的圖片。

  如果它可以實現這一點,它將可以創造大量看似真實的合成圖片,把行人放在各種環境下。而自動駕駛系統或許足不出戶就能使用這些圖片進行訓練。

  但問題在於,從無到有創造一個東西需要想象力,而這正是人工智能技術一直難以實現的能力。

  直到2014年,當時還是蒙特利爾大學博士生的Ian Goodfellow在酒吧裡與友人進行學術辯論時,他突然想到了這個問題的答案。這種名為“對抗式生成網絡”(GAN)的手段會使用兩個神經網絡(一種簡化人腦數學模型,是現代機器學習基石),然後讓這兩者在數字版的“貓捉老鼠”遊戲中相互拼殺。

  這兩個網絡會使用同一個數據集進行訓練。其中一個神經網絡叫生成網絡,它的任務就是依照所見過的圖片來生成新的圖片,比如一個多長一條手臂的行人。而另外那個神經網絡叫判別網絡,它的任務則是判斷它所見得圖片是否與訓練時的圖片相似,還是由生成模型創造出來的“假貨”,比如,判斷那個長著三個手臂的人有沒有可能是真的? 

  慢慢的,生成網絡創造圖片的能力會強到無法被判別網絡識破的程度。基本上,經過訓練之後,生成網絡學會了識別並創造看起來十分真實的行人圖片。項技術已經成為了在過去十年最具潛力的人工智能突破,幫助機器產生甚至可以欺騙人類的成果。目前,GAN 已被用於創造聽起來十分真實的語音,以及非常逼真的假圖片。就拿一個很有名的例子來說,來自芯片公司英偉達的研究人員們用明星照片訓練出了一個GAN系統,而這個系統則生成了數百張根本不存在、但看起來十分真實的人臉照片。另外一個研究團隊則生成了看起來十分逼真的梵高油畫。在進一步訓練後,GAN可以對圖片進行各種修改,比如在乾淨的馬路上蓋上一層雪,或者把馬變成斑馬。

  但是GAN的成果並非完美:它們可能生成有兩套把手的自行車,或者眉毛錯位的臉。但由於有些圖片與聲音實在太逼真了,一些專家相信,GAN在某種程度上已經開始理解它們所見到,所聽到的世界的底層結構。

  而這意味著,隨著人工智能開始獲得想象力,它們也可能開始理解它在這世界上所看到的東西。Ian Goodfellow發明出GAN後,獲得Facebook首席科學家Yann LeCun、NVIDIA創辦人黃仁勛、Landing.ai創辦人吳恩達等大牛的讚賞,吸引了諸多的機構及企業開始研究。

  在中國部分,學術機構致力於研究GAN理論的近一步改良及優化,像是中科院自動化所研究人員受人類視覺識別過程啟發,提出了雙路徑GAN(TP-GAN),用於正面人臉圖像合成,而商湯-香港中大聯合實驗室在國際學術大會上發表多項GAN相關研究成果。

  中國企業界則是更傾向於把技術應用在服務中,相關案例不勝枚舉,比如,百度使用GAN構建語音識別框架,科大訊飛通過GAN與傳統深度學習框架的結合在語音合成領域獲得了很大的進展。

  06 

  共享AI 

  入選理由:將機器學習工具搬上雲端,將有助於人工智能更廣泛的傳播 

  技術突破:基於雲端的人工智能正在降低這項技術的使用難度和價格 

  重大意義:目前,人工智能的應用是受到少數幾家公司統治的。但其一旦與雲技術相結合,那它將可以對許多人變得觸手可及,從而實現經濟的爆發式增長 

  主要研究者包括:亞馬遜、谷歌、微軟、百度、騰訊、阿里巴巴、科大訊飛、第四範式等 

  成熟期:現在 
 


 【 第1頁 第2頁 第3頁 第4頁 第5頁 第6頁 第7頁 第8頁 第9頁 第10頁 第11頁 】 


掃描二維碼訪問中評網移動版 CNML格式】 【 】 【打 印掃描二維碼訪問中評社微信