支持中文普通話、多國英語以及法語、意大利語、葡萄牙語等多種拉丁語系語種
北京2021年8月3日 /美通社/ -- 日前,亞馬遜云科技宣布通過與光環(huán)新網(wǎng)和西云數(shù)據(jù)的緊密合作,在北京區(qū)域和寧夏區(qū)域正式上線Amazon Transcribe Streaming實(shí)時(shí)流式語音轉(zhuǎn)錄功能。Amazon Transcribe是一項(xiàng)自動(dòng)語音識(shí)別(ASR)服務(wù),可為用戶提供方便快捷的語音轉(zhuǎn)文本服務(wù),使用場(chǎng)景包括轉(zhuǎn)錄客服電話、自動(dòng)添加字幕、生成會(huì)議紀(jì)要,以及為媒體資產(chǎn)生成元數(shù)據(jù)、創(chuàng)建完全可搜索的存檔等。Amazon Transcribe根據(jù)轉(zhuǎn)錄的音頻時(shí)長、按實(shí)際使用量付費(fèi),客戶無需花費(fèi)昂貴的轉(zhuǎn)錄費(fèi)用,便能讓開發(fā)人員輕松地為其應(yīng)用程序添加語音轉(zhuǎn)文本功能。
Amazon Transcribe能夠快速準(zhǔn)確地將語音轉(zhuǎn)換為文本,用戶只需投入很少的時(shí)間和費(fèi)用,便可以達(dá)到幾乎與手動(dòng)轉(zhuǎn)錄相媲美的轉(zhuǎn)錄效果。用戶可以將它應(yīng)用于實(shí)時(shí)音頻流或批量音頻內(nèi)容,創(chuàng)建包含音頻文件內(nèi)容的應(yīng)用程序。Amazon Transcribe采用深度學(xué)習(xí)功能自動(dòng)添加標(biāo)點(diǎn)符號(hào)和格式,生成時(shí)間戳;并且,用戶可以通過轉(zhuǎn)錄控制臺(tái)自定義詞匯列表和語言模型,從而為特定領(lǐng)域的詞和詞組生成更準(zhǔn)確的轉(zhuǎn)錄,例如產(chǎn)品名稱、技術(shù)術(shù)語等。此外,Amazon Transcribe可以識(shí)別和修訂敏感的個(gè)人身份信息來保護(hù)用戶隱私安全,并通過詞匯表篩選掩蔽或刪除轉(zhuǎn)錄結(jié)果中不文明用語,為客戶提供更好的轉(zhuǎn)錄效果和用戶體驗(yàn)。
目前,Amazon Transcribe支持多種語言,在批量音頻內(nèi)容處理中支持多達(dá)31種語言,在實(shí)時(shí)流失轉(zhuǎn)錄場(chǎng)景下支持包括中文普通話、澳大利亞英語、英國英語、美國英語、法語、加拿大法語、德語、意大利語、日語、韓語、巴西葡萄牙語和美國西班牙語等在內(nèi)的12種語言。
首汽約車是首汽集團(tuán)為推動(dòng)傳統(tǒng)出租車行業(yè)轉(zhuǎn)型升級(jí)而打造的網(wǎng)約車出行平臺(tái)。在首汽約車的“智能語音解決方案”項(xiàng)目中,亞馬遜云科技幫助客戶一起建立了語音降噪和導(dǎo)航音分離算法模型,先是利用Amazon SageMaker機(jī)器學(xué)習(xí)服務(wù)進(jìn)行模型構(gòu)建、訓(xùn)練、調(diào)優(yōu)和部署,再利用Amazon Transcribe人工智能語音服務(wù)將行程錄音自動(dòng)轉(zhuǎn)化為文字,從而實(shí)現(xiàn)通過場(chǎng)景化的關(guān)鍵詞識(shí)別分析觸發(fā)安全預(yù)警,結(jié)合后臺(tái)安全監(jiān)控人員的人工判斷,讓實(shí)時(shí)的行程安全監(jiān)控從“可能”變成“現(xiàn)實(shí)”。首汽約車副總裁閆磊表示“我們與亞馬遜云科技技術(shù)團(tuán)隊(duì)緊密合作,利用Amazon SageMaker、Amazon Transcribe等服務(wù),實(shí)現(xiàn)了智能語音解決方案,將客服人工審核工作量降低了35%、客服人工聽音審核時(shí)長縮短了20%,且智能客戶投訴處理的準(zhǔn)確率達(dá)90%以上,改善了司乘體驗(yàn)和滿意度,提高了企業(yè)運(yùn)營效率。”
美國全國運(yùn)動(dòng)汽車競賽協(xié)會(huì) (NASCAR) 是一家美國汽車競賽審批和運(yùn)營公司,以賽車而聞名。NASCAR 發(fā)展部高級(jí)總監(jiān)Patrick Carroll表示:“我們選擇使用 Amazon Transcribe,在我們覆蓋195個(gè)國家或地區(qū)以及29 種語言的多站點(diǎn)網(wǎng)站上為 NASCAR 的點(diǎn)播內(nèi)容提供字幕。利用 Amazon Transcribe,我們建立了一個(gè)自動(dòng)化的系統(tǒng),這個(gè)系統(tǒng)幾乎不需要我們的團(tuán)隊(duì)進(jìn)行操作,同時(shí)讓我們能夠自定義自己需要的語音識(shí)別功能。應(yīng)用了 Amazon Transcribe 之后,我們?yōu)?99% 的點(diǎn)播內(nèi)容自動(dòng)添加了字幕,并且費(fèi)用比我們最初的估計(jì)少97%。”
Audioburst 是一家擁有超前思維,極富創(chuàng)新力的技術(shù)提供商,他們讓談話音頻的發(fā)現(xiàn)、分發(fā)和個(gè)性化發(fā)生了轉(zhuǎn)變,Audioburst 聯(lián)合創(chuàng)始人兼首席技術(shù)官Gal Klein說:“每天,我們分析225,000 分鐘的實(shí)時(shí)電臺(tái)訪談,以形成數(shù)以千計(jì)的關(guān)于播放列表和搜索的短主題片段。我們選擇 Amazon Transcribe 是因?yàn)樗鳛槌錾恼Z音識(shí)別引擎,可幫助我們轉(zhuǎn)錄實(shí)時(shí)視頻內(nèi)容,用于下游內(nèi)容制作工作流。”