close

近來科技界對機器學習、深度學習的討論越來越多,其實這並不是未來願景,而是現在進行式的技術,機器學習已經運用在我們每天必點的Google搜尋、Gmail、Google翻譯、Google Photo...等產品上了,雖然使用時感覺不到,但我們每一次搜尋,或同步信件時,機器學習系統都在背後快速而賣力運算中,推送出正確的結果,我們的每一次使用,也都成為機器學習的經驗值,讓背後那些看不見的神經網路,一直在修正或學習,越使用,越準確。




Google開放機器學習原始碼 人人可用




Google在昨天晚上開放全新的機器學習標準系統TensorFlow,今天在東京舉行的亞太區活動裡,Google機器學習研究員Greg Corrado博士也宣布了這件事。
這代表各開發者、工程師、寫程式的、研究人員、學生學者....等跟機器學習有關的人,都可以取得Google機器學習原始碼,放在自己的產品或研究裡使用。

Google認為機器學習應該要有個標準,開放TensorFlow,可以讓科學家使用Google的技術標準來溝通。
而且開放TensorFlow,能讓上述群眾運用程式碼快速交流想法,如此就可以加速機器學習的發展,比方開發者可以將這技術導入自己的產品,產品就有越準確的預測能力;研究人員也可以此分析複雜的數據,更多聰明人就會提出更多知識及發現,開放原始碼,對機器學習的發展來說是很重要的。

Google的這套機器學習系統有幾個特點,一是它和Google使用在Inbox自動回覆(Smart Reply)、語音識別及Google Photo上的是同一套,二是它可以在CPU、GPU及行動裝置上執行,於是大到資料中心,小到手機都能運行。






大量案例就像燃料,推進機器學習


今年Google的亞太區活動,以「The Magic in the Machine」為主題,Greg Corrado博士也在活動的第一場演說裡,就跟大家分享Google在機器學習領域裡做了哪些事,這也是Google第一次公開這麼多這方面的訊息。

 

 

很多人認為機器學習就是人工智慧(AI),其實兩者是有差別的,Greg Corrado提到人工智慧是讓機器變得更聰明,因時因地做反應,機器學習則是讓機器從經驗數據當中學習,Google認為後者比較可行,因為透過手動編程讓機器更聰明,難度很高,不如讓機器自己有學習能力,
但機器如何學習呢?透過大量的樣本、案例和數據,不斷重複來學習。

至於機器學習的原理...扯到數學方程式本人頭腦就打結了..@@
簡單說是輸入的指令/參數,經過機器設定的模型(Model)做轉換,得到一個預測的結果,所以模型很重要,如果模型的設定太單一固定,那做出的預測就很不準,所以得用更多的變數來設定模型,而且讓機器反覆、多次產出預測,將預測結果跟真實結果作比對後,再一次次糾正模型,參數越多,比對越多,機器的學習效果也越好。

這個過程是漸進式的,而且緩慢,Greg Corrado提到在Google產品上使用機器學習,也是要千萬、億萬甚至十億次的案例訓練,每次取得一點進步而成,這裡也指出非常重要的一點:機器學習需要大量的案例。

電腦不像人腦,人腦可能只需要幾次的經驗就學得起來,但電腦需要很多很多的樣本來建立模型,Greg Corrado在講解機器學習如何運作時,將機器學習比喻為火箭的推進器,而大量的案例跟數據就是燃料,驅動機器學習,是很貼切的比喻。

而提到機器學習,就不能不提深度學習,深度學習是機器學習裡的一個分支,透過深度學習可以建立很有力的模型,其實60、70年代科學家就在談論深度學習了,但到現在才熱門起來,它算是人工神經網路的體現,深度學習層疊了很多模型,每一層辨識不同的東西,再互相聯繫,形成的更複雜的學習方式。

比方要機器自己辨識出照片裡有沒有貓,
第一層模型辨認像素,辨認出的結果再分組讓第二層分析形狀,形狀分析完又會得到幾組結果,這些再分別進行一下層的分析...以此類推,經過多層的特徵分析,最後機器就能辨認出是狗還是貓。





Gmail、相簿...等已經運用機器學習了


所以Google的哪些產品用上了機器學習及深度學習呢?
Google搜尋(排行排序)、Gmail、Google語音辨識、Google Photos、Google翻譯..等都有,都是我們早早在用的功能。
比方Gmail裡的過濾垃圾信,就用了深度學習的方法,自動判斷信件裡有哪些字眼,所以被歸到垃圾信,目前判斷準確率可以到99%。

前幾天Google也推出Smart Reply自動回覆的功能,一樣利用深度學習偵測信件內容後,自動生成一些相關的回覆短句讓你用。
不過這個目前限英文信,試了一下,真的不同內容會有對應的自動回覆句。
 

Google語音識別也是,不同語言、不同口音,或各種吵雜環境音...這些都會影響辨識,透過深度學習,機器自己可以客服這些,辨別哪些是要取樣的,讓辨識準確率越來越高,據Google透露,採用機器學習後,語音辨識的錯誤率已經減少了20%。這個中文語音輸入相信大家也用得很開心了~

 

 

新的Google相簿有自動分類的功能。
透過影像辨識技術,Google相簿會自動辨識照片裡有什麼,並自動加入標籤,不用手動加Tag,只要輸入貓、早餐、海洋...等,就可以搜尋到照片。也是屬於機器學習的一種,在這次的Google亞太區活動上也有特別把Google相簿的技術拉出來說,我們另一篇再來看。(咦?把哈姆太郎辨識成貓了...如果辨認錯誤,其實可以手動把它從搜尋結果刪除來學習)
 

在查Google翻譯時,我們會輸入一整串句子,同一件事情,表達的句子可能有百百種,這裡也運用深度學習技術,讓語音輸入,以及自然句翻譯結果都能立即辨認出來,錯誤率也從23%降到了18%。

 

 

來源:http://www.mobile01.com/newsdetail.php?id=17610

arrow
arrow

    聊聊數位 發表在 痞客邦 留言(0) 人氣()