商品編號:DJAA2V-A900ITO32

Hey Siri及Ok Google原理:AI語音辨識專案真應用開發

驚喜優惠
折扣價
$583
網路價
$880
  • 登記送

    【全家】單筆滿$350之【全家】純取貨/取貨付款訂單 登記送熱經典拿鐵(中杯)兌換券乙張(限量)

  • 登記送

    【加碼翻倍送】APP限定-全站指定品單筆滿$10,000登記送1,000P幣(使用效期30天)

  • 登記送

    【加碼翻倍送】APP限定-全站指定品單筆滿$1萬登記送總額4,000折價券禮包(使用效期60天)

  • 登記抽

    【11月24力】APP限定-全站指定品單筆滿$2424登記抽愛馬仕大地淡香水100ml

  • 登記抽

    【11月24力】APP限定-全站指定品下單登記抽每朝健康 每朝EX黑咖啡188ml(24入/箱)

  • 登記送

    【11月24力_第2波】APP限定-全站指定品單筆滿$1124登記送100P幣(限量/效期30天)

付款方式
配送資訊
  • PChome 倉庫出貨,24小時到貨
  • 可宅配到府,滿 $490 免運
  • 可超商取貨,滿 $350 免運
  • 可 i 郵箱取貨,滿 $290 免運
商品詳情
作者:
ISBN:
9786267569795
出版社:
出版日期:
2025/05/19
  • 內文簡介

  • <內容簡介> ╲\好評再版/╱ ★語音前端處理,語音辨識 ★語者自動分段標記演算法原理 ★基於WebRTC,Kaldi和gRPC,從零建構穩定、高性能、可商用的語音服務 ★前端演算法完整介紹 ★語音活動檢測、語音降噪、回聲消除、波束形成 ★WebRTC和Kaldi最佳化處理流程 ★形成語音演算法SDK ★微服務建構的RPC遠端呼叫框架和SDK 本書從語音辨識的概要談起,並且介紹了目前市場概況及常用的工具包括WebRTC及技術人最愛的Kaldi。接下來說明了語音訊號的聲學基和數位化、時頻變換的原理。語音技術中最重要的演算法也有說明,包括了各種VAD、單通道降噪、回聲消除等濾波器、波束形成的介紹。重點部分包括了語音辨識中最重要的特徵提取和聲學模型,如傳統及神經網路基礎的實作法。 在了解原理之後,即開始建立真正專案,包括使用Kaldi實作一個國語的模型。最近流行的語者自動分段標記在本書中也有實作,大量應用了深度學習的模型及音訊庫、函數庫等。如使用了CNCeleb的聲紋資料當作訓練集。在Kaldi的進階應用方面,也實作了其SDK的音訊特徵提取及WebRTC的語音活動檢測。 本書的收尾之作就是使用了gRPC進行一個完整的語音識別服務實作,使用了現在最好用的ProtoBuf的協定進行運作,完成了伺服器/客戶端應用開發,可以說是目前市面上最完整的語音辨識中文圖書。 <作者簡介> 楊學銳 大疆創新語音交互演算法負責人,復旦大學及Turku大學碩士,長期從事語音演算法、深度學習、人工智慧等領域的研究與商業落地,在相關領域發表多篇論文及專利。 晏超 北京郵電大學碩士,曾任職於HP Labs, Cisco, Technicolor等公司。 現為雲從科技語音演算法負責人,從事語音辨識、聲紋識別、說話人日誌、語音合成等方向的演算法研發工作,構建了雲從科技整套語音演算法引擎與應用服務平臺。 劉雪松 OPPO音訊演算法專家,復旦大學碩士,曾任職於美國國家儀器、聲網、雲從科技等公司。 在信號處理、音訊演算法和語音演算法等領域有豐富的實戰經驗,在相關領域發表多篇論文及專利。

購物須知