? 1449期七星彩图规:百度開源的Warp-CTC人工智能技術到底是什么鬼? - 七星彩新人王17103|七星彩2183期(猛将头)信息
您的當前位置: 七星彩新人王17103 > 科技新聞 > 百度開源的Warp-CTC人工智能技術到底是什么鬼?

1449期七星彩图规:百度開源的Warp-CTC人工智能技術到底是什么鬼?

發布時間:2019-11-21 18:46    來源: 未知  未經授權 不得轉載

七星彩新人王17103 www.pcxde.com   百度硅谷AI實驗室(SVAIL)近日宣布,百度已開源關鍵人工智能Warp-CTC的關鍵代碼,并且已向GitHub上傳了Warp-CTC的C語言代碼庫,共享給了開發者,引起了美國業內的廣泛關注。

  如何讓人工智能模仿人類大腦的思考,一直是科學家在努力的事情,而深度神經網絡就是模仿人類思考的方式,人類的思考方式是有深度加工的。

  20世紀50年代,計算機科學家就設計出了神經網絡,并經歷了幾十年的變化,機器可以通過一層又一層的判斷,最后識別出對應的預測結果。在2006年Hinton對這個方法做出關鍵改進,對每一個層的數據結果進行數學優化,進而加快了學習速度,被稱之為“深度學習”。

  隨后,“深度學習”獲得了巨大成功,它是IBM沃森、DeepMind、谷歌、Facebook的基本算法。

  語音識別自然這個人工智能領域也自然會使用到深度學習,但是傳統的深度學習語音識別采用RNN循環神經網絡(Recurrent Neural Network,)方案,即:

  對比這兩種方案,CTC的方案是較優的,RNN的機器學習系統存在一定的標準損失,例如均方差和負數函數并不適合,而CTC方案之下則可以解決。

  百度的SVAIL工程師在打造端對端語音識別系統時開發了Warp-CTC,目的是要改善培訓模型的可擴展性和效率。因為當前可用的CTC應用通常需要更大的內存,并且速度慢了數十數百倍不止。而經過百度方面的優化之后的Warp-CTC可以提高原來CTC運算效率10到400倍。

  百度此次發布的Warp-CTC屬于C語言類型,并為Torch框架做了集成化處理。此外,Nervana系統自帶的機器學習框架Neon也正在集成Warp-CTC。Warp-CTC可用于解決繪制輸入序列到輸出序列圖譜過程中的監督問題,如語音識別。第三方開發者可直接將Warp-CTC嵌入到自己的開發系統中,直接實現更為高效的開發過程。

  縱觀國際,谷歌于2015年11月開源了TensorFlow系統,而Facebook也于2015年12月公開Big Sur人工智能硬件架構。而百度于2015年5月開源了其深度學習平臺,又在此次開源了Warp-CTC系統,有著很好的榜樣作用。

  百度將Warp-CTC核心代碼公布無疑是對行業大利好的事情。在開源之前,Warp-CTC就已經被行業大量應用,已經幫助百度數億用戶的服務獲取,百度的兩大語音應用入口為“百度地圖”、“手機百度”,“百度地圖”的市場份額為70%日請求破50億次,而“手機百度”也一直長期盤踞在各大應用商店TOP10,占42%。因此該系統的學習能力已經成熟,開發者可以直接使用遷移到自己的大數據產品中。

  將錄音轉換為準確的文字以及圖像,相當于機器通過音頻得到圖像等多個目標,這是更為復雜的事情,這也是機器“自我學習”不得不做的事情,Warp-CTC技術的應用將有效改善現有CTC對內存等硬件的龐大需求,并提升運算速度數十甚至數百倍。

  目前巨頭紛紛開源人工智能技術,將迅速降低開發者部署深度學習系統的難度,人工智能的整個行業將會得到巨大發展,而企業方面也可以利用第三方提供的底層基礎設施去搶占紅利,這有點像安卓系統給了全世界智能手機的生產商帶來的巨大機會,當前的人工智能開源技術也與此類似,未來是大數據的時代,馬云也說過未來是從“IT”到“DT”的時代,而我們要做出的思考則是如何利用好這些數據,讓這些數據發揮出最大的價值,這同時有賴于當前對大數據的利用能力。而小米的雷軍也說過,如果小米最后無法成為一家大數據公司,那么小米離破產就不遠了,因為小米的大數據已經大到公司難以承受的地步。

  因此,大數據中蘊藏的大價值,有待于更高的技術,而這些技術也必須依賴于強技術的公司,并且他們的開源將會為小公司帶來更快更好的進步,找到大數據中的大價值。

  
聯系我們| 網站聲明| 網站律師| 網站制作| 在線投稿 |泰國試管嬰兒 |保研人論壇 |恩施網

七星彩新人王17103 | 任何建議和意見E-mail: 電話:

主辦單位:上海群樂徽標制作有限公司、上海群樂徽標制作有限公司日報社、上海群樂徽標制作有限公司總臺 | 互聯網新聞信息服務許可證:

增值電信業務經營許可證: 備案號: