語言教學者
自學&親子

Hey Siri及Ok Google原理:AI語音辨識專案真應用開發

Hey Siri及Ok Google原理:AI語音辨識專案真應用開發

$880

ISBN:9786267146484
出版日期:2022/09/22
尺寸:230x170x0mm

庫存=0
運送方式:

下單後立即採購,需5-7個工作天。

☆★☆★【語音辨識專案應用開發!】★☆★☆
了解語音辨識概要,讓你對WebRTC及Kaldi瞭若指掌!


隨著AI時代的來臨,人類語言的處理在硬體高度平民化之後,你我也可以開發出類似的產品,事實上語音服務早在1950年代就開始研究了。這些應用早就存在於智慧喇叭、手機語音助理、車載智慧座艙、語音輸入法與翻譯機等;企業級應用包括智慧客服、語音品管、智慧教育、智慧醫療等。本書是難得少見的中文語音高階技術的教材,用簡單的Kaldi、WebRTC、gRPC等專案,就可以開發出企業等級的語音服務應用,這些下放至平民百姓家的技術,在搭配本書之後,立即成為你可以立刻上手的工具,充份應用人工智慧時代深度學習技術帶來的福利。

本書特色

✪語音前端處理,語音辨識
✪語者自動分段標記演算法原理
✪基於WebRTC,Kaldi和gRPC,從零建構穩定、高性能、可商用的語音服務
✪前端演算法完整介紹
✪語音活動檢測、語音降噪、回聲消除、波束形成
✪WebRTC和Kaldi最佳化處理流程
✪形成語音演算法SDK
✪微服務建構的RPC遠端呼叫框架和SDK

楊學銳

大疆創新語音交互演算法負責人,復旦大學及Turku大學碩士,長期從事語音演算法、深度學習、人工智慧等領域的研究與商業落地,在相關領域發表多篇論文及專利。

晏超

北京郵電大學碩士,曾任職於HP Labs, Cisco, Technicolor等公司。 現為雲從科技語音演算法負責人,從事語音辨識、聲紋識別、說話人日誌、語音合成等方向的演算法研發工作,構建了雲從科技整套語音演算法引擎與應用服務平臺。

劉雪松

OPPO音訊演算法專家,復旦大學碩士,曾任職於美國國家儀器、聲網、雲從科技等公司。 在信號處理、音訊演算法和語音演算法等領域有豐富的實戰經驗,在相關領域發表多篇論文及專利。

Hey Siri及Ok Google原理:AI語音辨識專案真應用開發

$880
瀏覽紀錄
瀏覽紀錄