omniture

網(wǎng)易汪源:網(wǎng)易產(chǎn)品體驗好,離不開AI驅(qū)動

2019-04-26 19:32 8312
4月26日,2019華為智能計算大會杭州站如約而來,網(wǎng)易副總裁、網(wǎng)易杭州研究院執(zhí)行院長汪源受邀參加本次大會,分享網(wǎng)易在人工智能方面的探索與實踐。

杭州2019年4月26日 /美通社/ -- 4月26日,2019華為智能計算大會杭州站如約而來,網(wǎng)易副總裁、網(wǎng)易杭州研究院執(zhí)行院長汪源受邀參加本次大會,分享網(wǎng)易在人工智能方面的探索與實踐。汪源表示,人工智能已經(jīng)成為網(wǎng)易業(yè)務(wù)發(fā)展的一個核心引擎,而這得益于網(wǎng)易獨特的產(chǎn)品設(shè)計,以及強勁的智能計算平臺。

網(wǎng)易副總裁、網(wǎng)易杭州研究院執(zhí)行院長汪源
網(wǎng)易副總裁、網(wǎng)易杭州研究院執(zhí)行院長汪源

AI驅(qū)動的網(wǎng)易業(yè)務(wù)創(chuàng)新

一直以來,網(wǎng)易被認為是一家信奉產(chǎn)品為王的公司,并致力于通過技術(shù)進步不斷優(yōu)化產(chǎn)品體驗和服務(wù)質(zhì)量。2006年成立的網(wǎng)易杭州研究院,正是承擔了業(yè)務(wù)孵化和技術(shù)創(chuàng)新的職責。汪源介紹,網(wǎng)易對AI技術(shù)的系統(tǒng)探索,至今已經(jīng)有10余年歷史 -- 2009年,網(wǎng)易開始借助大規(guī)模機器學習的方式來對抗日益泛濫的垃圾郵件,而這正是日后網(wǎng)易易盾內(nèi)容安全產(chǎn)品的萌芽。

到了今天,人工智能與云計算、大數(shù)據(jù)一起,已經(jīng)成為驅(qū)動網(wǎng)易業(yè)務(wù)創(chuàng)新的三駕馬車,廣泛應(yīng)用于網(wǎng)易郵箱、傳媒、云音樂、考拉、嚴選、易信等業(yè)務(wù)。人工智能方面的積累,匯集成了網(wǎng)易AI平臺,為網(wǎng)易內(nèi)部業(yè)務(wù)和外部客戶提供AI技術(shù)和解決方案。網(wǎng)易AI平臺包括基礎(chǔ)平臺層、技術(shù)能力層和業(yè)務(wù)應(yīng)用層三個層面。

基礎(chǔ)平臺層暫且不表。技術(shù)能力層包括計算機視覺、智能語音語言和推薦搜索三類能力。計算機視覺包括OCR、視頻分析、人臉識別、圖像處理、人臉美化等。2012年,人臉識別、認證算法及系統(tǒng)在網(wǎng)易郵箱產(chǎn)品中上線,這是中國第一家在互聯(lián)網(wǎng)產(chǎn)品中應(yīng)用人臉技術(shù)的案例。智能語音語言包括語音識別、機器翻譯、語言處理基礎(chǔ)技術(shù)、語音合成等。第三是推薦搜索,2012年,伴隨著網(wǎng)易云音樂的成長,網(wǎng)易正式開啟了智能個性化推薦的探索。此外,在傳媒、電商、教育等業(yè)務(wù)中,推薦和搜索也成為必備的核心能力。

業(yè)務(wù)應(yīng)用層則是基于上述核心技術(shù)構(gòu)建的視頻分析、視頻翻譯、智慧課堂、智能機器人等能力。2016年,基于智能語音語言、計算機視覺的反垃圾云服務(wù)(網(wǎng)易易盾的核心能力之一)、全智能云客服(網(wǎng)易七魚的核心能力之一)在成功服務(wù)網(wǎng)易傳媒、教育、音樂、電商等團隊之后正式對外開放。時至今日,網(wǎng)易易盾服務(wù)超過1000家互聯(lián)網(wǎng)公司,每日過濾有害信息量超過10億條,網(wǎng)易七魚注冊企業(yè)超過20萬。這標志著人工智能成為網(wǎng)易業(yè)務(wù)的新增長點。

AI成功邏輯之一:面向AI推薦的產(chǎn)品設(shè)計

以音樂推薦為例,網(wǎng)易云音樂APP首頁實現(xiàn)全部個性化推薦,30%聽歌行為來自推薦,知乎上超過兩萬五千人對網(wǎng)易云音樂推薦算法的關(guān)注,“聽不完的歌”的用戶評論,充分說明了這個推薦系統(tǒng)的成功。

網(wǎng)易云音樂是國內(nèi)首個以“歌單”作為核心架構(gòu)的音樂APP,通過這些歌單俘獲超過6億用戶的心,這背后離不開“智能推薦”,比如基于上下文場景推薦,采用深度神經(jīng)網(wǎng)絡(luò)優(yōu)化排序算法,結(jié)合消費心理學建立用戶興趣模型,根據(jù)反饋優(yōu)化用戶興趣模型……但反過來,這些推薦策略與算法的成功,也建立在網(wǎng)易云音樂的產(chǎn)品設(shè)計與數(shù)據(jù)收集之上。

首先,擁有數(shù)億的“歌單”庫,這為合乎用戶興趣的歌曲相關(guān)性提供了數(shù)據(jù)來源。其次,數(shù)十億評論成為了歌曲內(nèi)容特征的重要數(shù)據(jù)來源。第三,數(shù)百億社交關(guān)系,成為基于關(guān)系的推薦與召回策略的基礎(chǔ)。此外,根據(jù)用戶拖垃圾桶、紅心的反饋操作抽象出用戶不喜歡的藝人、風格、語種、推薦源,這也需要產(chǎn)品設(shè)計的配合。

AI成功邏輯之二:智能計算平臺

回頭來看網(wǎng)易AI基礎(chǔ)平臺層,包括了網(wǎng)易猛犸大數(shù)據(jù)平臺和分布式深度學習平臺。來自數(shù)據(jù)科學團隊、基于Hadoop的猛犸,提供了一站式的大數(shù)據(jù)管理和應(yīng)用開發(fā)服務(wù),包括數(shù)據(jù)集成、數(shù)據(jù)存儲、數(shù)據(jù)計算、數(shù)據(jù)安全等能力,為人工智能應(yīng)用提供了數(shù)據(jù)處理的基礎(chǔ)。猛犸的設(shè)計特點之一是簡化工作流程,此外還提供了數(shù)據(jù)質(zhì)量控制能力,這對保證數(shù)據(jù)挖掘效果帶來了保障。

分布式深度學習平臺則以TensorFlow、Caffe、PyTorch等主流深度學習框架為基礎(chǔ),加入了多機分布式計算的優(yōu)化,為業(yè)務(wù)方提供快速托管深度學習模型訓練服務(wù)和模型推理服務(wù)。該平臺消除了底層基礎(chǔ)結(jié)構(gòu)服務(wù)的環(huán)境安裝部署、性能調(diào)優(yōu)的成本和資源管理復雜性,并且自2017年開始支持任何標準化GPU Docker推理計算服務(wù),這些能力讓業(yè)務(wù)方不必關(guān)注基礎(chǔ)架構(gòu)的管理,只需要專注業(yè)務(wù)算法邏輯應(yīng)用。

另一方面,不管推薦還是視覺、語音語言,都需要處理海量的數(shù)據(jù),這就需要強勁的硬件平臺,包括高性能計算、集群高速互聯(lián)以及海量共享存儲的能力。

汪源還表示,未來的人工智能,需要解決如何形成跨越不同類型媒體數(shù)據(jù)而進行更泛化推理的模型、方法和技術(shù)的問題,而機器要實現(xiàn)不同媒體語義的融合計算,像人類那樣以極低功耗來高效地表達外部世界的復雜結(jié)構(gòu),唯有采用類腦的神經(jīng)計算系統(tǒng)。

所以說,不管著眼于當前還是未來,實現(xiàn)智能計算平臺的升級,對于AI的成功都是不可或缺的。

消息來源:網(wǎng)易
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection