Google更新雲端語音API(Google Cloud Speech API),除了新增時間標記功能,可辨識的語音檔案長度也從80分鐘增加到3小時,並一口氣新增30種可辨識語言,讓第三方開發商能在更多類型的服務中應用Google的語音辨識技術。
可在錄音檔中搜尋關鍵字、直接跳到關鍵字出現的段落
「語音」很可能是繼打字之後,未來人類和電腦溝通的主要方式,其不僅解放我們的雙手,互動速度也更快。Google在去年發佈這款能將語音轉成文字的雲端語音API,並將該功能整合進多款自家服務中,如語音助理、語音搜尋、翻譯、聽寫輸入等功能。
而這次更新的其中一個新功能,對常聽錄音檔的人相當必備。過去只有文字檔才能搜尋特定字詞,現在,在Google雲端語音API新增「以字為單位的時間標記」的功能後,語音檔也能做到相同的事,即可在語音檔中搜尋特定字詞出現的位置、直接跳到該段落,且錄音檔播放的同時也能立即顯示已辨識的文字。
支援檔案長度增加到3小時,可用於客服中心和自動產生影片字幕
此外,Google雲端語音API可支援的語音檔案長度,也從原本的80分鐘增加到3小時。Google產品經理Dan Aharon表示,支援更長時間的語音檔案,也能拓展該技術能應用的場景,例如客服中心可用此分析客服電話內容,或是用於自動生成影片字幕。
語音轉文字支援「表情符號」
在支援語言方面,這次Google更一口氣新增30個語言,迄今共支援119種語言。Google表示,他們和母語人士合作,請他們念常用的句子,訓練機器學習模型辨識新語言的單字和音調。
特別的是,Google雲端語音API不只能辨識說話的「內容」,還能辨識出「表情符號」。例如,只要念出「眨眼表情符號」或「微笑表情符號」,就會出現和。不過,該功能目前僅支援英語,其他語言將在未來陸續開放。
資料來源:Google、ZDNet、TechCrunch
網頁設計.RWD響應式網站.企業形象網站 / 教育人文類
網站技術:PHP . Javascript/MySql
當學員完成課程,後續可以登入網站選擇自己的班級與課程再做複習或是進行親子互動。網站也會定期更新課程、相關商品與最新消息。 會員的申請方式需要學員並購買課程,由課程老師建立資料後就可以登入網站練習喔!
精選專案.網頁設計.RWD響應式網站.行動版網站 / 其他類
網站技術:Javascript
網頁設計.RWD響應式網站.活動網站 / 電子科技類
網站技術:PHP . Javascript/MySql
響應式(RWD)網頁設計,設計UI/UX使用者體驗,可於各種裝置進行網頁瀏覽(PC、平板、手機)。
一式多用的網頁,可隨著網頁內容需求的不同,動態調整網頁呈現的資料,包含影片、表單、輪播效果等,企業自行發佈新活動。
電話:(02)2739-9096 | 傳真:(02)2739-6637 | 客服:[email protected] | 臺北市信義區和平東路3段257號6樓map
© 2019 傑立資訊 All rights reserved.| 網站隱私政策