omniture

澳鵬中國(guó)上半年?duì)I收1.83億人民幣,在AI和大模型數(shù)據(jù)賽道勇攀高峰

上海2024年9月3日 /美通社/ -- 過去5年,整個(gè)社會(huì)對(duì)于數(shù)據(jù)的觀念和認(rèn)知,發(fā)生了天翻地覆的改變。這要?dú)w功于OpenAI與預(yù)訓(xùn)練大語(yǔ)言模型(以下簡(jiǎn)稱大模型)的問世以及橫掃全球的ChatGPT。從2020年1月OpenAI發(fā)表《自然語(yǔ)言模型的"摩爾定律"(Scaling Law for Neural Language Models)》論文到2023年的"百模"大戰(zhàn),數(shù)據(jù)成為了與算力和模型參數(shù)并駕齊驅(qū)的三駕馬車之一。

澳鵬Appen獲評(píng)2024全球數(shù)據(jù)標(biāo)注領(lǐng)域Top領(lǐng)軍者
澳鵬Appen獲評(píng)2024全球數(shù)據(jù)標(biāo)注領(lǐng)域Top領(lǐng)軍者

在AI與大模型數(shù)據(jù)服務(wù)這條賽道上,澳鵬Appen位于Everest Group 2024 AI/ML數(shù)據(jù)標(biāo)注解決方案Peak Matrix領(lǐng)導(dǎo)者象限第一。2019年,澳鵬(中國(guó))正式成立了,作為獨(dú)立于澳鵬Appen全球而在中國(guó)市場(chǎng)"白手起家"的澳鵬(中國(guó)),5年來(lái)闖過了中國(guó)AI數(shù)據(jù)"江湖",實(shí)現(xiàn)了在中國(guó)市場(chǎng)遙遙領(lǐng)先——從 2020 年到 2023 年,5年來(lái)澳鵬的復(fù)合營(yíng)收增長(zhǎng)率是 90+%以上,2023年澳鵬(中國(guó))實(shí)現(xiàn)了近2.5億人民幣營(yíng)收,剛剛發(fā)布的2024年上半年實(shí)現(xiàn)了1.83億人民幣(2540萬(wàn)美元)營(yíng)收,遠(yuǎn)超業(yè)界頭部友商。預(yù)計(jì)2024年將實(shí)現(xiàn)3.5~4億人民幣營(yíng)收,YOY 的收入增長(zhǎng)率 50%~60%以上,2029年將跨入年?duì)I收10億人民幣大關(guān)。澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示:“過去5年澳鵬(中國(guó))的成功,可以總結(jié)為五大因素:順勢(shì)而為、創(chuàng)新為要、資源多樣化、洞察客戶需求、員工滿意與數(shù)據(jù)合規(guī)。

數(shù)據(jù)來(lái)源:澳鵬Appen全球2024上半年財(cái)報(bào)
數(shù)據(jù)來(lái)源:澳鵬Appen全球2024上半年財(cái)報(bào)

AI數(shù)據(jù)三維度爆發(fā)式裂變

所謂AI數(shù)據(jù),即經(jīng)過人工或機(jī)器方式標(biāo)注過的數(shù)據(jù)。澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,澳鵬(中國(guó))在近五年經(jīng)歷了三大AI浪潮,同時(shí)收獲了AI數(shù)據(jù)在三個(gè)維度的爆發(fā)式裂變?cè)鲩L(zhǎng)紅利:即從深度學(xué)習(xí)和機(jī)器學(xué)習(xí)浪潮、到自動(dòng)駕駛浪潮、再到大模型的"滔天巨浪";相應(yīng)帶來(lái)AI數(shù)據(jù)在數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量和數(shù)據(jù)復(fù)雜度等三個(gè)維度的裂變?cè)鲩L(zhǎng)。

在數(shù)據(jù)規(guī)模方面,傳統(tǒng)深度學(xué)習(xí)模型訓(xùn)練數(shù)據(jù)規(guī)模在GB級(jí)到TB級(jí),自動(dòng)駕駛模型和大模型訓(xùn)練數(shù)據(jù)進(jìn)一步上升至PB級(jí)。一輛智能汽車真實(shí)路況采集視頻數(shù)據(jù)可達(dá)PB到數(shù)十PB,而通用大模型訓(xùn)練甚至已經(jīng)耗盡了互聯(lián)網(wǎng)數(shù)據(jù),并向更廣闊的私域數(shù)據(jù)高速拓展。

在數(shù)據(jù)質(zhì)量方面,由于自動(dòng)駕駛模型對(duì)于真實(shí)路況安全的重要性等,要求數(shù)據(jù)標(biāo)注的準(zhǔn)確性從之前的95%或96%進(jìn)一步提升到99.5%甚至100%,這就意味著極大提高了數(shù)據(jù)標(biāo)注的要求。而對(duì)于大模型訓(xùn)練來(lái)說,高質(zhì)量數(shù)據(jù)則意味著更高水平的人工標(biāo)注,例如需要量子力學(xué)等小眾專業(yè)知識(shí)以及醫(yī)療、音樂、科技、金融、制造等垂直行業(yè)知識(shí)。

數(shù)據(jù)復(fù)雜度更在近年來(lái)急劇上升。在自動(dòng)駕駛、VR/MR、機(jī)器人等領(lǐng)域,此前主要為2D、3D和 2D&3D融合標(biāo)注,這兩年進(jìn)一步發(fā)展到4D標(biāo)注,也就是將時(shí)間作為新增維度,而4D標(biāo)注對(duì)技術(shù)和復(fù)雜度要求非常高。此外,由于大量AI模型訓(xùn)練和多頻次模型迭代的需求,數(shù)據(jù)流轉(zhuǎn)越來(lái)越復(fù)雜,數(shù)據(jù)處理的專業(yè)性要求越來(lái)越高,既有短周期甚至臨時(shí)性項(xiàng)目、高頻次數(shù)據(jù)標(biāo)注需求,也有臨時(shí)數(shù)據(jù)耗盡而項(xiàng)目掛起的需求,還有要求安全可控?cái)?shù)據(jù)標(biāo)注環(huán)境、專業(yè)數(shù)據(jù)人才能力等等。

整體而言,經(jīng)過了2019年到2024年的飛速發(fā)展,從深度學(xué)習(xí)/機(jī)器學(xué)習(xí)的精品式小模型訓(xùn)練,到自動(dòng)駕駛的規(guī)模化模型訓(xùn)練和高頻次迭代,再到"百大"大模型和生成式 AI的規(guī)模化生產(chǎn),引發(fā)了AI數(shù)據(jù)在規(guī)模、質(zhì)量和復(fù)雜度三個(gè)維度的同時(shí)爆發(fā)式裂變,這對(duì)于AI數(shù)據(jù)服務(wù)商來(lái)說,既是機(jī)遇更是挑戰(zhàn)。

"押注"技術(shù)平臺(tái)產(chǎn)品,打造核心競(jìng)爭(zhēng)力

技術(shù)能力是傳統(tǒng)數(shù)據(jù)標(biāo)注服務(wù)商長(zhǎng)期缺失的核心能力。隨著AI數(shù)據(jù)在三個(gè)維度的爆發(fā)式裂變,單純依靠手工方式進(jìn)行數(shù)據(jù)標(biāo)注已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足需求,更無(wú)法持續(xù)降低數(shù)據(jù)標(biāo)注項(xiàng)目的成本、提高數(shù)據(jù)標(biāo)注的質(zhì)量、加快數(shù)據(jù)的有效流轉(zhuǎn)。

在數(shù)據(jù)標(biāo)注技術(shù)工程平臺(tái)方面,特斯拉為整個(gè)行業(yè)立了一面旗幟。從2018到2021年,特斯拉的數(shù)據(jù)工程平臺(tái)經(jīng)歷了3次迭代,通過自動(dòng)標(biāo)注與多種技術(shù)手段配合,一個(gè)clip(即最小標(biāo)注單位,通常特斯拉的一個(gè)clip包括45秒到1分鐘的路段數(shù)據(jù))的標(biāo)注僅需0.5小時(shí)算力+0.1小時(shí)人工,效率較2018年提升了800倍之多。

在全球市場(chǎng),2019年的時(shí)候也僅有包括澳鵬Appen在內(nèi)的少數(shù)頂級(jí)AI數(shù)據(jù)標(biāo)注服務(wù)商投資了自有的數(shù)據(jù)標(biāo)注工程平臺(tái)。在2019年澳鵬(中國(guó))成立的時(shí)候,當(dāng)時(shí)除了從IBM等世界一流IT公司出來(lái)的幾位核心主創(chuàng)人員以及澳鵬Appen全球?qū)χ袊?guó)團(tuán)隊(duì)的初始投資外,可以說"一窮二白"。

與其它全球公司的中國(guó)分公司不同,由于數(shù)據(jù)行業(yè)的高度安全合規(guī)要求,澳鵬(中國(guó))必須要獨(dú)立自主地在中國(guó)市場(chǎng)重建所有的資源、系統(tǒng)和流程。擯棄了"拿來(lái)主義",擺在澳鵬(中國(guó))創(chuàng)始團(tuán)隊(duì)面前的就是一張白紙,而團(tuán)隊(duì)決定對(duì)技術(shù)進(jìn)行"押注"式投入:目前公司有60余名全職資深研發(fā)技術(shù)工程師,其中一半專門聚焦于公司的技術(shù)平臺(tái)產(chǎn)品研發(fā);另一半專門聚焦于和客戶在平臺(tái)數(shù)據(jù)接收和驗(yàn)收的無(wú)縫對(duì)接。2023年,澳鵬(中國(guó))投資近5000萬(wàn)元用于技術(shù)和系統(tǒng)建設(shè),包括對(duì)澳鵬MatrixGo企業(yè)級(jí)高精度數(shù)據(jù)標(biāo)注平臺(tái)和大模型智能開發(fā)平臺(tái)的開發(fā)和增強(qiáng)。

澳鵬MatrixGo企業(yè)級(jí)高精度數(shù)據(jù)標(biāo)注平臺(tái)
澳鵬MatrixGo企業(yè)級(jí)高精度數(shù)據(jù)標(biāo)注平臺(tái)

今天的澳鵬(中國(guó))有兩大拳頭產(chǎn)品:MatrixGo企業(yè)級(jí)高精度數(shù)據(jù)標(biāo)注平臺(tái)和大模型智能開發(fā)平臺(tái),并用這兩大平臺(tái)扛住了AI數(shù)據(jù)三維度裂變的"滾滾洪流"。澳鵬MatrixGo平臺(tái)和大模型智能開發(fā)平臺(tái)完全由澳鵬(中國(guó))團(tuán)隊(duì)在本地研發(fā),擁有全部的知識(shí)產(chǎn)權(quán)和產(chǎn)品主導(dǎo)能力。

目前,澳鵬(中國(guó))對(duì)MatrixGo平臺(tái)和大模型智能開發(fā)平臺(tái)每年迭代近百次,相當(dāng)于每周都有產(chǎn)品更新,國(guó)內(nèi)本地客戶的 AI 數(shù)據(jù)需求能夠快速反應(yīng)到產(chǎn)品設(shè)計(jì)和開發(fā)中。同時(shí)澳鵬自主研發(fā)的預(yù)標(biāo)注通用模型和交互式算法在數(shù)據(jù)標(biāo)注任務(wù)中能產(chǎn)生25%至10倍以上的效率提升。

具體來(lái)看,澳鵬MatrixGo平臺(tái)主要針對(duì)深度學(xué)習(xí)和機(jī)器學(xué)習(xí)小模型的數(shù)據(jù)采集與標(biāo)注需求,也服務(wù)于自動(dòng)駕駛場(chǎng)景,覆蓋文本、語(yǔ)音、圖像、視頻、多模態(tài)等各種數(shù)據(jù)類型。目前澳鵬MatrixGo平臺(tái)已經(jīng)演進(jìn)到2.0版本,并不斷增強(qiáng)AI輔助智能標(biāo)注引擎,持續(xù)提升人工標(biāo)注的效率和質(zhì)量,降低數(shù)據(jù)標(biāo)注成本。

例如,澳鵬MatrixGo平臺(tái)在2D圖像類項(xiàng)目上可達(dá)到5倍以上的效率提升;3D語(yǔ)義分割數(shù)據(jù)標(biāo)注效率提升可達(dá)到35%以上;2/3D物體檢測(cè)預(yù)標(biāo)注模型效率提升15%-30%;數(shù)據(jù)交付準(zhǔn)確率平均達(dá)到99%以上。在自動(dòng)駕駛場(chǎng)景方面,澳鵬MatrixGo平臺(tái)支持單幀100億以上點(diǎn)云的加載、提供了多種4D數(shù)據(jù)標(biāo)注工具,能夠?yàn)榭蛻粼鲂?0%以上。

澳鵬MatrixGo平臺(tái)針對(duì)各種中國(guó)客戶的不同信息安全性需求,還提供了客戶On-Premise、專屬安全屋On-premise、SaaS等多種不同的部署形式, 如On-premise的部署在48小時(shí)內(nèi)可以完成,不僅極大地滿足了針對(duì)客戶的安全性需求適配,更解決客戶快速交付的緊急訴求,已在中國(guó)成功地提供幾十家客戶的On-Premise部署。

澳鵬大模型智能開發(fā)平臺(tái)
澳鵬大模型智能開發(fā)平臺(tái)

澳鵬大模型智能開發(fā)平臺(tái)是澳鵬(中國(guó))在2023年全新開發(fā)的一個(gè)新技術(shù)工程平臺(tái)。針對(duì)大模型場(chǎng)景,澳鵬(中國(guó))研發(fā)了專業(yè)的多模態(tài)數(shù)據(jù)標(biāo)注工具、多輪對(duì)話數(shù)據(jù)標(biāo)注工具、思維鏈數(shù)據(jù)標(biāo)注工具、工具調(diào)用數(shù)據(jù)標(biāo)注工具、知識(shí)庫(kù)數(shù)據(jù)標(biāo)注工具等多種專業(yè)標(biāo)注工具,支持RLHF、RLAIF、SFT等多種高質(zhì)量數(shù)據(jù)的生產(chǎn);該平臺(tái)對(duì)數(shù)據(jù)集管理、模型評(píng)估進(jìn)行了針對(duì)性設(shè)計(jì),通過A/B測(cè)試、紅藍(lán)對(duì)抗、排序打分等對(duì)大模型質(zhì)量進(jìn)行評(píng)估和分析;該平臺(tái)還集成了算力資源的調(diào)度和對(duì)接,可以進(jìn)行算法的微調(diào)和部署,一站式完成大模型數(shù)據(jù)開發(fā)。

大模型智能開發(fā)平臺(tái)的快速上線讓澳鵬(中國(guó))迅速抓住了大模型商機(jī)。2023年,澳鵬(中國(guó))在中國(guó)、日本和韓國(guó)共拓展了82家新客戶,其中8家客戶帶來(lái)了20個(gè)大模型項(xiàng)目。2023年全年,澳鵬(中國(guó))大模型業(yè)務(wù)營(yíng)收接近3300萬(wàn),2024上半年更直逼5000萬(wàn),呈爆發(fā)式增長(zhǎng)態(tài)勢(shì)。

澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,正是依托澳鵬MatrixGO平臺(tái)和大模型智能開發(fā)平臺(tái)兩大平臺(tái)的技術(shù)能力,讓澳鵬(中國(guó))在眾多數(shù)據(jù)項(xiàng)目中脫穎而出,也是獲得頭部客戶青睞的重要原因。

在自主創(chuàng)新方面,澳鵬(中國(guó))目前累計(jì)申請(qǐng)的專利數(shù)達(dá)到24項(xiàng)(其中20個(gè)專利申請(qǐng)?zhí)幱谝堰f交狀態(tài));軟著登記共計(jì)62項(xiàng),其中56項(xiàng)已獲證。澳鵬(中國(guó))與很多高校和科研院所在計(jì)算機(jī)視覺、多模態(tài)算法、大模型等領(lǐng)域進(jìn)行了項(xiàng)目合作,也與許多院校在人工智能訓(xùn)練師、人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)培養(yǎng)等方面深入合作。

正是因?yàn)閳?jiān)持對(duì)核心技術(shù)進(jìn)行布局,澳鵬(中國(guó))成功入選艾瑞咨詢的《2024年中國(guó)AI基礎(chǔ)數(shù)據(jù)服務(wù)研究報(bào)告》,并作為行業(yè)標(biāo)桿之一被列入AI基礎(chǔ)數(shù)據(jù)服務(wù)廠商案例。而在2024世界人工智能大會(huì)(WAIC2024)期間,澳鵬(中國(guó))入選了億歐的2024 AI產(chǎn)業(yè)鏈圖譜,并被評(píng)選為2024中國(guó)AI企業(yè)商業(yè)落地基礎(chǔ)設(shè)施服務(wù)商Top20等。

躬身入局AI數(shù)據(jù)"江湖",闖出新天地

整個(gè)AI數(shù)據(jù)標(biāo)注行業(yè)在過去5年經(jīng)歷了全面重塑。2019年的數(shù)據(jù)標(biāo)注市場(chǎng),仍處于野蠻生長(zhǎng)狀態(tài),主要以勞動(dòng)力密集型企業(yè)為主,其競(jìng)爭(zhēng)優(yōu)勢(shì)主要體現(xiàn)在低價(jià)格和傳統(tǒng)渠道,不少企業(yè)在四五線城市建立了低成本的數(shù)據(jù)標(biāo)注基地。當(dāng)時(shí)的數(shù)據(jù)標(biāo)注員幾乎零門檻,整個(gè)行業(yè)良莠不齊,惡意競(jìng)爭(zhēng)、低價(jià)競(jìng)爭(zhēng)等種種亂象叢生,可以用"江湖"一詞來(lái)形容當(dāng)時(shí)的市場(chǎng)狀態(tài)。

2019年澳鵬(中國(guó))成立的時(shí)候,當(dāng)時(shí)已經(jīng)成立23年、上市4年的澳鵬Appen全球擁有百萬(wàn)眾包資源,支持235+種語(yǔ)言和方言,具備成熟的眾包人力資源體系和項(xiàng)目管理能力。但對(duì)于2019年僅有不到10個(gè)人的澳鵬(中國(guó))初創(chuàng)團(tuán)隊(duì)來(lái)說,這些來(lái)自頂級(jí)IT公司的專業(yè)精英人才,卻要面對(duì)當(dāng)時(shí)AI數(shù)據(jù)標(biāo)注服務(wù)市場(chǎng)的各種亂象。

澳鵬(中國(guó))精彩亮相2024世界人工智能大會(huì)
澳鵬(中國(guó))精彩亮相2024世界人工智能大會(huì)

針對(duì)處于初級(jí)階段的中國(guó)AI數(shù)據(jù)標(biāo)注市場(chǎng),澳鵬(中國(guó))投入了大量時(shí)間和精力進(jìn)行眾包資源的招募、培訓(xùn)、流程建設(shè)和管理,特別是在二線城市創(chuàng)造性地建立了自營(yíng)數(shù)據(jù)服務(wù)交付基地,通過自有專職人員+眾包資源的方式,適配了中國(guó)數(shù)據(jù)標(biāo)注行業(yè)的初級(jí)階段。

所謂自營(yíng)數(shù)據(jù)服務(wù)交付基地,即在無(wú)錫、大連、重慶等地租用辦公樓,招聘專職數(shù)據(jù)標(biāo)注服務(wù)員工入駐辦公,同時(shí)為項(xiàng)目提供安全封閉的項(xiàng)目辦公空間,供團(tuán)隊(duì)與客戶共同完成高保密性的項(xiàng)目。而在項(xiàng)目管理方面,面對(duì)數(shù)據(jù)標(biāo)注項(xiàng)目節(jié)奏快、數(shù)據(jù)需求量不穩(wěn)定、數(shù)據(jù)規(guī)則不斷變化等挑戰(zhàn),澳鵬(中國(guó))從多個(gè)維度提升項(xiàng)目管理能力,保障對(duì)客戶項(xiàng)目交付的穩(wěn)定性。

澳鵬(中國(guó))非常重視AI數(shù)據(jù)服務(wù)項(xiàng)目的安全和隱私保護(hù),不僅在中國(guó)的各個(gè)自營(yíng)基地均已獲得ISO 27001、27701、9001、14001、45001、ISO 37301等安全及管理領(lǐng)域國(guó)際認(rèn)證,還與客戶、眾包資源等100%簽訂NDA協(xié)議。此外,根據(jù)項(xiàng)目對(duì)數(shù)據(jù)的安全級(jí)別、隱私安全等要求,澳鵬(中國(guó))為客戶定制專屬項(xiàng)目室,包括安全屋、網(wǎng)絡(luò)專線、信息安全管控等,特殊項(xiàng)目要求員工在進(jìn)入項(xiàng)目前還需要上交手機(jī)。正是因?yàn)榘涅i(中國(guó))不遺余力地建設(shè)數(shù)據(jù)安全與隱私保護(hù),才在市場(chǎng)競(jìng)爭(zhēng)中獲得了頭部客戶的青睞。

為什么要建自營(yíng)服務(wù)交付基地?澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士介紹,盡管澳鵬自身非常重視數(shù)據(jù)安全與隱私保護(hù),但很多BPO服務(wù)商特別是中小BPO服務(wù)其實(shí)在這方面并不重視,也很難具備高等級(jí)數(shù)據(jù)安保設(shè)施,相比之下只有自營(yíng)服務(wù)交付基地才能滿足客戶高安全、高保密等高等級(jí)要求。澳鵬(中國(guó))的自營(yíng)服務(wù)交付基地也為中國(guó)AI數(shù)據(jù)標(biāo)注行業(yè)建立了一個(gè)新規(guī)范、新標(biāo)桿。有客戶表示在國(guó)內(nèi)所有大型數(shù)據(jù)標(biāo)注服務(wù)商中,只有澳鵬(中國(guó))是真正將數(shù)據(jù)安保真正落地的服務(wù)商,也是少有的全員交社保的數(shù)據(jù)標(biāo)注服務(wù)商。

選擇在二線城市建設(shè)自營(yíng)數(shù)據(jù)服務(wù)交付基地,還有一個(gè)出發(fā)點(diǎn)就是為了滿足AI數(shù)據(jù)對(duì)于高知識(shí)專業(yè)人才的需求。田小鵬表示,團(tuán)隊(duì)在成立之初就前瞻到了AI模型將越來(lái)越向垂直領(lǐng)域和專業(yè)化方向發(fā)展,對(duì)于知識(shí)的需求將越來(lái)越高。相比于四五線城市,二線城市有大量高水平的高校以及具備高知識(shí)的專業(yè)化人才,選擇在二線城市建設(shè)自營(yíng)數(shù)據(jù)服務(wù)交付基地可就近招募高知識(shí)專業(yè)化人才,滿足AI模型的長(zhǎng)期演進(jìn)需求。

在澳鵬(中國(guó))創(chuàng)業(yè)的5年中,經(jīng)歷了中國(guó)AI數(shù)據(jù)標(biāo)注行業(yè)從初期亂象走向規(guī)范化發(fā)展之路,在這期間還經(jīng)歷了三年疫情這樣百年未遇的公共事件,這些都是澳鵬(中國(guó))創(chuàng)業(yè)團(tuán)隊(duì)在創(chuàng)業(yè)之初都始料未及的挑戰(zhàn)。

例如,有的客戶在項(xiàng)目進(jìn)行過程中或項(xiàng)目結(jié)束就破產(chǎn)了,或因各種原因出現(xiàn)賴賬,導(dǎo)致無(wú)法收回上百萬(wàn)的項(xiàng)目款或者打折結(jié)算,而與此同時(shí)很多眾包人員的工作已經(jīng)在進(jìn)行中或完成了,澳鵬(中國(guó))團(tuán)隊(duì)經(jīng)過慎重考慮選擇自行墊款結(jié)算所有眾包人員和BPO商的項(xiàng)目款,因?yàn)閷?duì)于很多地方上的眾包和 BPO人員來(lái)說,項(xiàng)目款是維持生計(jì)的重要來(lái)源,特別在疫情期間甚至是唯一生計(jì)來(lái)源。

從"科技向善"的公司理念出發(fā),澳鵬(中國(guó))并沒有因?yàn)锳I數(shù)據(jù)"江湖"的亂象而放棄原則,而是知行合一地實(shí)踐了這一理念,杜絕各種"踩紅線"行為,為整個(gè)行業(yè)樹立科技向善的標(biāo)桿,引領(lǐng)AI數(shù)據(jù)標(biāo)注行業(yè)走出無(wú)序和不良競(jìng)爭(zhēng)亂象,走向更加光明的未來(lái)。

下一個(gè)5年,勇攀高峰

在過去5年中,出現(xiàn)了大量不確定性的事件,包括全球疫情和中美科技競(jìng)爭(zhēng),但也幸運(yùn)地趕上了自動(dòng)駕駛和大模型浪潮以及由此引發(fā)的AI數(shù)據(jù)三維度爆發(fā)式裂變。由于澳鵬(中國(guó))堅(jiān)持以科技創(chuàng)新立身,堅(jiān)定投入自有技術(shù)平臺(tái),依靠更高效率、更高質(zhì)量、更高安全性的技術(shù)平臺(tái)和人力資源優(yōu)勢(shì),在市場(chǎng)中站穩(wěn)了腳跟。

澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士
澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士

過去5年澳鵬(中國(guó))的成功,可以總結(jié)為五大因素:順勢(shì)而為、創(chuàng)新為要、資源多樣化、洞察客戶需求、員工滿意與數(shù)據(jù)合規(guī)。

順勢(shì)而為。澳鵬(中國(guó))非常幸運(yùn)地抓住了ChatGPT、LLM等AI科技突破性技術(shù)創(chuàng)新和成就所產(chǎn)生的商機(jī),特別是敏銳察覺和把握了AI數(shù)據(jù)三維度爆發(fā)式裂變,堅(jiān)定了對(duì)AI數(shù)據(jù)標(biāo)注服務(wù)、AI和未來(lái)科技演進(jìn)的信心與信念,在前瞻性戰(zhàn)略思考基礎(chǔ)上,謀定而后動(dòng)。

創(chuàng)新為要。澳鵬(中國(guó))將創(chuàng)新視為公司和行業(yè)發(fā)展的動(dòng)力,以創(chuàng)新謀新局、開新篇:創(chuàng)造性地建立在中國(guó)自營(yíng) AI 數(shù)據(jù)服務(wù)交付基地模式;大膽投資開發(fā)了澳鵬MatrixGo平臺(tái)和大模型智能開發(fā)平臺(tái)并建立了技術(shù)護(hù)城河;率先嘗試各種AI數(shù)據(jù)服務(wù),包括3D數(shù)據(jù)標(biāo)注、4D數(shù)據(jù)標(biāo)注、大模型數(shù)據(jù)服務(wù)、多模態(tài)數(shù)據(jù)服務(wù)、海外路采等等。

資源多樣化。通過眾包、BPO和專職數(shù)據(jù)標(biāo)注與服務(wù)人員等多種資源布局與協(xié)同,解決了客戶在AI數(shù)據(jù)規(guī)模、質(zhì)量與復(fù)雜性方面的挑戰(zhàn),同時(shí)也解決了部分大眾就業(yè)、中小企業(yè)生存發(fā)展等民生問題,將創(chuàng)業(yè)與企業(yè)責(zé)任結(jié)合起來(lái),用實(shí)踐向業(yè)界展現(xiàn)了AI向善的商業(yè)與社會(huì)價(jià)值,引領(lǐng)整個(gè)行業(yè)走上可持續(xù)發(fā)展之路。

洞察客戶需求。在AI數(shù)據(jù)服務(wù)行業(yè),客戶真正關(guān)心的是優(yōu)異的品質(zhì)和合理的價(jià)格。澳鵬(中國(guó))一直秉承"季布一諾千金"的優(yōu)良文化,全心全意服務(wù)好客戶,不斷打磨精細(xì)化管理,以優(yōu)異的數(shù)據(jù)質(zhì)量品質(zhì),在業(yè)界形成了良好的口碑。

員工滿意和數(shù)據(jù)合規(guī)。澳鵬(中國(guó))非常重視員工的滿意度,授予員工充分的自主權(quán),讓員工全方位參與公司管理,獲得員工的高認(rèn)可度。數(shù)據(jù)合規(guī)紅線是企業(yè)運(yùn)營(yíng)的根本,公司通過各種獨(dú)立項(xiàng)目交付合規(guī)室的建設(shè)和管控措施以及ISO信息安全認(rèn)證等多種舉措建立了安全合規(guī)的企業(yè)文化。

目前,澳鵬(中國(guó))客戶主要分布在互聯(lián)網(wǎng)/電商企業(yè)、算法科技公司、自動(dòng)駕駛等行業(yè),客戶包括國(guó)內(nèi)前十大汽車公司、前十大互聯(lián)網(wǎng)公司和前四大移動(dòng)互聯(lián)網(wǎng)公司等。鑒于AI數(shù)據(jù)與AI模型越來(lái)越密不可分,澳鵬(中國(guó))為頭部客戶配置了專屬的客戶經(jīng)理,從而深入理解客戶業(yè)務(wù),并根據(jù)客戶業(yè)務(wù)發(fā)展,提前準(zhǔn)備相應(yīng)的資源和能力,靈活及時(shí)滿足客戶需求。

例如,在服務(wù)某中國(guó)頭部社交媒體海外實(shí)體公司的過程中,雙方在大模型文本生成和多模態(tài)數(shù)據(jù)處理等領(lǐng)域展開了深入合作。澳鵬(中國(guó))在東南亞地區(qū)建立了多個(gè)大模型標(biāo)注的基地,招募了當(dāng)?shù)貎?yōu)秀的本科、碩士畢業(yè)生以及部分垂直領(lǐng)域的專家。借助海外專業(yè)且穩(wěn)定的人力資源以及澳鵬豐富的管理經(jīng)驗(yàn),為該客戶實(shí)現(xiàn)了大模型高精度+高一致率的標(biāo)注結(jié)果。目前該客戶大模型的業(yè)務(wù)量已經(jīng)躋身澳鵬(中國(guó))前三,成為重要的業(yè)務(wù)支柱。

在下一個(gè)5年到來(lái)之際,澳鵬(中國(guó))又站在了一個(gè)新的起點(diǎn)。未來(lái)5年,在大模型的持續(xù)影響和應(yīng)用需求激增下,全社會(huì)全面進(jìn)入AI規(guī)?;瘧?yīng)用階段,相關(guān)數(shù)據(jù)標(biāo)注的需求也呈現(xiàn)爆發(fā)式增長(zhǎng)。面對(duì)下一波AI浪潮,澳鵬(中國(guó))已經(jīng)做好了充分的準(zhǔn)備。

首先,澳鵬(中國(guó))將持續(xù)投入兩大平臺(tái)的研發(fā),不斷提高產(chǎn)品力,從而提升產(chǎn)品在整個(gè)營(yíng)收中的占比。在數(shù)據(jù)標(biāo)注服務(wù)外,客戶對(duì)于數(shù)據(jù)處理平臺(tái)、數(shù)據(jù)處理工具和數(shù)據(jù)處理算法有大量需求。為此,澳鵬(中國(guó))投入產(chǎn)品研發(fā),打造可商業(yè)化的數(shù)據(jù)標(biāo)注平臺(tái)、多模態(tài)數(shù)據(jù)標(biāo)注工具、成品數(shù)據(jù)庫(kù)產(chǎn)品以及覆蓋數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)脫敏、數(shù)據(jù)挖掘等不同階段的自動(dòng)化算法產(chǎn)品,為客戶提供全面的產(chǎn)品矩陣。

澳鵬(中國(guó))的團(tuán)隊(duì)與客戶團(tuán)隊(duì)一起,共同探討算法研發(fā)的思路和數(shù)據(jù)標(biāo)注工具的產(chǎn)品設(shè)計(jì)。澳鵬(中國(guó))團(tuán)隊(duì)每天都在為客戶定制化需求而研發(fā),這些需求可能是為了客戶算法工程師的一個(gè)新思路而實(shí)現(xiàn)一個(gè)特殊的數(shù)據(jù)標(biāo)注功能以標(biāo)注特定的數(shù)據(jù)特征,也可能是為了讓客戶更好更快地驗(yàn)收數(shù)據(jù)標(biāo)注結(jié)果而開發(fā)更便捷、可視化功能和數(shù)據(jù)準(zhǔn)確率看板。所有這些新算法、新功能、新工具都匯入澳鵬(中國(guó))的兩大平臺(tái),惠及更多客戶。

其次,澳鵬(中國(guó))將繼續(xù)開拓大模型和中國(guó)企業(yè)出海兩大市場(chǎng)。在大模型市場(chǎng),科技企業(yè)對(duì)于AI/LLM的研發(fā)投入巨大,迫切需要具有的高質(zhì)量訓(xùn)練數(shù)據(jù)交付能力的公司,幫助更好、更快地處理模型訓(xùn)練數(shù)據(jù),而澳鵬(中國(guó))已經(jīng)構(gòu)建了強(qiáng)大的競(jìng)爭(zhēng)力。

在中國(guó)企業(yè)出海市場(chǎng),企業(yè)出海首先面對(duì)的就是語(yǔ)言和全球資源的挑戰(zhàn),澳鵬在全球170多個(gè)國(guó)家擁有290多種語(yǔ)言的資源,同時(shí)在菲律賓、越南、美國(guó)等地區(qū)擁有大型交付中心,這是澳鵬在行業(yè)內(nèi)獨(dú)一無(wú)二的優(yōu)勢(shì),可以很好地支持國(guó)內(nèi)企業(yè)出海拓展海外市場(chǎng)業(yè)務(wù)。

第三,針對(duì)AI技術(shù)深入行業(yè)應(yīng)用帶來(lái)的長(zhǎng)期需求,包括代碼、醫(yī)療、教育、金融、工業(yè)、汽車等行業(yè),澳鵬(中國(guó))已經(jīng)儲(chǔ)備了超過1500人的高學(xué)歷專業(yè)人士,而且還在無(wú)錫、大連、重慶等多地的交付基地同時(shí)招聘招募專業(yè)人員,從而打造全國(guó)性的專業(yè)資源能力池。

艾瑞咨詢預(yù)計(jì)到2028年,中國(guó)AI基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模將達(dá)170億元,未來(lái)五年的復(fù)合增長(zhǎng)率為30.4%。澳鵬Appen全球高級(jí)副總裁、大中華及北亞區(qū)總經(jīng)理田小鵬博士表示,有信心在5年后實(shí)現(xiàn)12億人民幣的年?duì)I收,以至少27.8%+的高速?gòu)?fù)合增長(zhǎng)率,成為中國(guó)及亞洲區(qū)AI數(shù)據(jù)專業(yè)服務(wù)行業(yè)的領(lǐng)軍服務(wù)商。

其中,產(chǎn)品和服務(wù)兩條線更均衡發(fā)展,產(chǎn)品項(xiàng)目的占比將從2024年的4%至少提升到2029年的12%;進(jìn)一步加速開拓亞洲市場(chǎng),占比將從 2024年10%至少提升到2029年15%,澳鵬中國(guó)5 年后將完成亞洲、歐洲、非洲、中東、南美、北美等地所有AI數(shù)據(jù)服務(wù)的全覆蓋。

展望5年后乃至更長(zhǎng)遠(yuǎn)的未來(lái),田小鵬認(rèn)為廣闊天地在于突破AI數(shù)據(jù)標(biāo)注服務(wù)窄領(lǐng)域,進(jìn)入AI數(shù)據(jù)服務(wù)寬領(lǐng)域,即:AI數(shù)據(jù)服務(wù)將會(huì)有更廣泛行業(yè)的覆蓋拓展;AI 數(shù)據(jù)類型將向多模態(tài)、垂類細(xì)分顆粒度等演變;AI 數(shù)據(jù)產(chǎn)品將更國(guó)際化、全球化、多語(yǔ)言覆蓋。例如:大模型就將AI數(shù)據(jù)服務(wù)推進(jìn)到了人工反饋算法迭代服務(wù)和模型評(píng)估服務(wù),今后隨著AI技術(shù)的持續(xù)發(fā)展或?qū)⒊霈F(xiàn)新的AI模型,相應(yīng)帶來(lái)新的AI數(shù)據(jù)服務(wù)需求,這為澳鵬(中國(guó))基業(yè)長(zhǎng)青奠定了信心。

回顧過去5年走過的路,田小鵬笑說如果再來(lái)一遍,肯定不會(huì)選擇創(chuàng)業(yè)這條道路。因?yàn)樵谝粋€(gè)市場(chǎng)的初級(jí)階段搏殺,再疊加全球三年疫情這樣極具挑戰(zhàn)的公共事件,即便是老兵創(chuàng)業(yè)也是每日如履薄冰。

5年前創(chuàng)業(yè)之初,澳鵬(中國(guó))從零起步,沒有客戶、沒有產(chǎn)品、沒有流程、沒有團(tuán)隊(duì)、只有投資和勇氣;5年后,澳鵬(中國(guó))已經(jīng)有兩大產(chǎn)品平臺(tái)、3000+員工、3000+BPO合作伙伴、近百萬(wàn)眾包資源、6大服務(wù)交付基地、完整的組織、流程與管理以及350+家優(yōu)質(zhì)客戶……

闖過了前面的險(xiǎn)灘,后面就是奔騰不息的大江大河。面向下一個(gè)5年,田小鵬說"澳鵬(中國(guó))并不完美,但一直在追求完美的道路上。在 AI 的未來(lái)浪潮中,在AI數(shù)據(jù)主航道上我們將勇往直前。澳鵬(中國(guó))愿做客戶在 AI成功的幕后英雄和鋪路石,成就客戶是我們永遠(yuǎn)不變的初心!"

消息來(lái)源:澳鵬數(shù)據(jù)科技(上海)有限公司
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection