北京2025年4月8日 /美通社/ -- 亞馬遜云科技日前宣布Amazon SageMaker Unified Studio已正式可用,這是一套獨(dú)立的數(shù)據(jù)與人工智能(AI)開(kāi)發(fā)環(huán)境,也是新一代Amazon SageMaker的核心。這項(xiàng)新產(chǎn)品將多種工具整合至一站式的界面中,為客戶(hù)提供一致的開(kāi)發(fā)體驗(yàn),不僅能夠節(jié)省開(kāi)發(fā)時(shí)間,還能簡(jiǎn)化訪(fǎng)問(wèn)控制管理,使數(shù)據(jù)從業(yè)者能夠?qū)W⒂诤诵娜蝿?wù)——構(gòu)建高質(zhì)量的數(shù)據(jù)分析場(chǎng)景和AI應(yīng)用。
新一代Amazon SageMaker是亞馬遜云科技在2024 re:Invent全球大會(huì)上發(fā)布的一個(gè)一站式平臺(tái),涵蓋數(shù)據(jù)、分析和AI等功能。它整合了亞馬遜云科技廣泛應(yīng)用的機(jī)器學(xué)習(xí)和分析功能,通過(guò)統(tǒng)一的工具訪(fǎng)問(wèn)和數(shù)據(jù)治理,解決了企業(yè)在數(shù)據(jù)分析和AI應(yīng)用中面臨的挑戰(zhàn)。它使團(tuán)隊(duì)能夠安全地發(fā)現(xiàn)、準(zhǔn)備和協(xié)作處理數(shù)據(jù)資產(chǎn),并在一站式的環(huán)境中構(gòu)建分析和AI應(yīng)用,加快從數(shù)據(jù)到價(jià)值的轉(zhuǎn)化過(guò)程。
Amazon SageMaker Unified Studio是新一代Amazon SageMaker的核心,這是一個(gè)一站式的數(shù)據(jù)和AI開(kāi)發(fā)環(huán)境,用戶(hù)可以在其中發(fā)現(xiàn)和訪(fǎng)問(wèn)企業(yè)的數(shù)據(jù),并使用最適合的工具處理幾乎所有的應(yīng)用場(chǎng)景。Amazon SageMaker Unified Studio現(xiàn)已正式可用。
Amazon SageMaker Unified Studio的優(yōu)勢(shì)
Amazon SageMaker Unified Studio集成了亞馬遜云科技現(xiàn)有的分析、人工智能與機(jī)器學(xué)習(xí)服務(wù),包括Amazon EMR、Amazon Glue、Amazon Athena、Amazon Redshift、Amazon Bedrock及Amazon SageMaker AI。用戶(hù)可以在這個(gè)一站式的開(kāi)發(fā)環(huán)境中查找、訪(fǎng)問(wèn)并查詢(xún)數(shù)據(jù)和AI資產(chǎn),并在項(xiàng)目中高效協(xié)作,共享數(shù)據(jù)、模型和生成式AI應(yīng)用。通過(guò)Amazon SageMaker Catalog,Amazon SageMaker Unified Studio內(nèi)置的細(xì)粒度權(quán)限控制等治理功能,幫助用戶(hù)滿(mǎn)足企業(yè)數(shù)據(jù)資產(chǎn)的安全要求。
Amazon SageMaker Unified Studio具有統(tǒng)一的數(shù)據(jù)訪(fǎng)問(wèn)能力,該功能由Amazon SageMaker Lakehouse提供,這是一個(gè)基于Apache Iceberg開(kāi)放標(biāo)準(zhǔn)構(gòu)建的統(tǒng)一、開(kāi)放和安全的數(shù)據(jù)湖倉(cāng)庫(kù)。無(wú)論數(shù)據(jù)存儲(chǔ)在Amazon Simple Storage Service (Amazon S3)數(shù)據(jù)湖、Amazon Redshift數(shù)據(jù)倉(cāng)庫(kù),還是第三方和整合的數(shù)據(jù)源中,用戶(hù)都可以從單一入口訪(fǎng)問(wèn)并使用兼容Apache Iceberg的引擎和工具進(jìn)行處理。此外,Amazon SageMaker Lakehouse現(xiàn)已與Amazon S3 Tables集成,Amazon S3 Tables是首個(gè)原生支持Apache Iceberg的云對(duì)象存儲(chǔ)服務(wù),用戶(hù)能夠使用Amazon SageMaker Lakehouse高效地創(chuàng)建、查詢(xún)和處理S3 Tables,既可以使用Amazon SageMaker Unified Studio中的各種分析引擎,也可以使用如Apache Spark和PyIceberg等Apache Iceberg兼容的引擎。
Amazon Bedrock的功能現(xiàn)已在Amazon SageMaker Unified Studio中正式可用,能夠幫助客戶(hù)在受管理的環(huán)境中快速構(gòu)建原型、定制和共享生成式AI應(yīng)用??蛻?hù)可以在Amazon SageMaker Unified Studio的界面中使用Amazon Bedrock功能,包括如Claude 3.7、DeepSeek及Amazon Nova等高性能基礎(chǔ)大模型,并能夠通過(guò)簡(jiǎn)單操作創(chuàng)建 AI助手(Agents)、工作流、知識(shí)庫(kù)和對(duì)大模型生成內(nèi)容的防護(hù)機(jī)制(Guardrails)等。
Amazon SageMaker Unified Studio現(xiàn)已集成Amazon Q Developer。Amazon Q Developer是強(qiáng)大的軟件開(kāi)發(fā)生成式AI助手,可在Amazon SageMaker Unified Studio中使用,用于簡(jiǎn)化數(shù)據(jù)和AI開(kāi)發(fā)生命周期中的各項(xiàng)任務(wù),包括代碼編寫(xiě)、SQL生成、數(shù)據(jù)發(fā)現(xiàn)和問(wèn)題排查。
全新的工作集成方式
Amazon SageMaker Unified Studio是亞馬遜云科技為客戶(hù)提供簡(jiǎn)化數(shù)據(jù)工作方式的又一重要里程碑,無(wú)論是用于數(shù)據(jù)分析還是AI應(yīng)用。許多客戶(hù)正在構(gòu)建數(shù)據(jù)驅(qū)動(dòng)型應(yīng)用來(lái)指導(dǎo)業(yè)務(wù)決策、提高敏捷性和推動(dòng)創(chuàng)新,但由于這些應(yīng)用需要跨團(tuán)隊(duì)協(xié)作以及整合數(shù)據(jù)和工具,構(gòu)建過(guò)程十分復(fù)雜??蛻?hù)不僅需要花費(fèi)時(shí)間學(xué)習(xí)多種開(kāi)發(fā)環(huán)境,而且由于數(shù)據(jù)、代碼和其他開(kāi)發(fā)資產(chǎn)被分散存儲(chǔ),要理解各要素資產(chǎn)之間的交互關(guān)系并實(shí)現(xiàn)協(xié)同運(yùn)作對(duì)客戶(hù)而言就是一大挑戰(zhàn)。配置和管理權(quán)限也是一個(gè)繁瑣的手動(dòng)過(guò)程。為了克服這些挑戰(zhàn),許多企業(yè)正在嘗試將各類(lèi)服務(wù)、工具和企業(yè)的權(quán)限管理系統(tǒng)進(jìn)行定制化集成。然而,客戶(hù)真正需要的是:既能夠靈活采用最適合其使用場(chǎng)景的服務(wù),又能為數(shù)據(jù)團(tuán)隊(duì)提供一站式的開(kāi)發(fā)體驗(yàn)。
"在為客戶(hù)構(gòu)建數(shù)據(jù)驅(qū)動(dòng)型應(yīng)用時(shí),我們需要一個(gè)一站式的平臺(tái),使各種技術(shù)能夠以集成的方式協(xié)同工作。Amazon SageMaker Unified Studio通過(guò)全面的分析功能、一站式的開(kāi)發(fā)環(huán)境以及整合數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)湖管理的湖倉(cāng)架構(gòu),簡(jiǎn)化了我們的解決方案交付流程。Amazon SageMaker Unified Studio將客戶(hù)數(shù)據(jù)項(xiàng)目的價(jià)值實(shí)現(xiàn)時(shí)間縮短了多達(dá)40%,幫助我們加速客戶(hù)的數(shù)字化轉(zhuǎn)型進(jìn)程。"
——NTT DATA解決方案部門(mén)負(fù)責(zé)人鈴江明弘、NTT DATA應(yīng)用與數(shù)據(jù)技術(shù)部高級(jí)經(jīng)理莊野裕司、NTT DATA數(shù)字成功解決方案部經(jīng)理齊藤優(yōu)希
數(shù)百萬(wàn)企業(yè)信任亞馬遜云科技,并利用我們?nèi)娴膶?zhuān)門(mén)構(gòu)建的分析、人工智能與機(jī)器學(xué)習(xí)、生成式AI功能來(lái)支持?jǐn)?shù)據(jù)驅(qū)動(dòng)型應(yīng)用,同時(shí)無(wú)需在性能、可擴(kuò)展性和成本效益之間進(jìn)行妥協(xié)。亞馬遜云科技希望通過(guò)新一代Amazon SageMaker(包括Amazon SageMaker Unified Studio)在一站式的開(kāi)發(fā)環(huán)境中為企業(yè)提供對(duì)所有數(shù)據(jù)和工具的訪(fǎng)問(wèn),提升數(shù)據(jù)和AI從業(yè)者的工作效率。
從一站式數(shù)據(jù)和AI開(kāi)發(fā)環(huán)境開(kāi)始構(gòu)建
如何通過(guò)優(yōu)化潛在客戶(hù)挖掘來(lái)提升收入是一個(gè)常見(jiàn)的業(yè)務(wù)挑戰(zhàn)。請(qǐng)想象這樣一個(gè)場(chǎng)景:一個(gè)企業(yè)在其網(wǎng)站上部署智能數(shù)字助手來(lái)與客戶(hù)進(jìn)行互動(dòng),這個(gè)過(guò)程傳統(tǒng)上需要多個(gè)工具和數(shù)據(jù)源?,F(xiàn)在,通過(guò)使用Amazon SageMaker Unified Studio,用戶(hù)可以在一站式的數(shù)據(jù)和AI開(kāi)發(fā)環(huán)境中完成整個(gè)過(guò)程。
首先,數(shù)據(jù)團(tuán)隊(duì)使用Amazon SageMaker Unified Studio中的生成式AI環(huán)境快速評(píng)估并選擇最適合客戶(hù)互動(dòng)的模型。然后,團(tuán)隊(duì)會(huì)創(chuàng)建一個(gè)項(xiàng)目來(lái)整合用例所需的工具和資源,并在項(xiàng)目中使用Amazon Bedrock構(gòu)建和部署一個(gè)智能虛擬助手,該助手可以快速通過(guò)網(wǎng)站篩選潛在客戶(hù)。
為了識(shí)別最具潛力的機(jī)會(huì),團(tuán)隊(duì)制定了客戶(hù)分層策略。數(shù)據(jù)工程師借助Amazon Q Developer識(shí)別含有潛在客戶(hù)信息的數(shù)據(jù)集,并通過(guò)zero-ETL的方式將數(shù)據(jù)導(dǎo)入Amazon SageMaker Lakehouse。隨后,數(shù)據(jù)分析師發(fā)現(xiàn)這些數(shù)據(jù)并創(chuàng)建關(guān)于他們業(yè)務(wù)的全景視圖。他們使用SQL查詢(xún)編輯器構(gòu)建營(yíng)銷(xiāo)細(xì)分表,然后將查詢(xún)結(jié)果寫(xiě)回Amazon SageMaker Lakehouse,供其他團(tuán)隊(duì)成員使用。
最后,數(shù)據(jù)科學(xué)家訪(fǎng)問(wèn)同一數(shù)據(jù)集,使用Amazon SageMaker AI提供的工具訓(xùn)練和部署自動(dòng)化的潛在客戶(hù)評(píng)分模型。在模型開(kāi)發(fā)階段,他們利用Amazon Q Developer的內(nèi)聯(lián)代碼編寫(xiě)和問(wèn)題排查功能,在其JupyterLab notebook中高效編寫(xiě)無(wú)錯(cuò)誤代碼。最終的模型為銷(xiāo)售團(tuán)隊(duì)提供最具價(jià)值的機(jī)會(huì),他們可以通過(guò)商業(yè)智能儀表板直觀(guān)查看并立即采取行動(dòng)。
在一站式的環(huán)境中加速實(shí)現(xiàn)數(shù)據(jù)價(jià)值
這個(gè)示例的非凡之處在于,整個(gè)過(guò)程都在一個(gè)統(tǒng)一的環(huán)境中完成。如果沒(méi)有Amazon SageMaker Unified Studio,團(tuán)隊(duì)就必須在多個(gè)數(shù)據(jù)源、工具和服務(wù)之間切換,花費(fèi)大量時(shí)間學(xué)習(xí)不同的開(kāi)發(fā)環(huán)境、創(chuàng)建資源共享和手動(dòng)配置權(quán)限控制。數(shù)據(jù)工程師和數(shù)據(jù)分析師需要在各種數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖和分析工具中工作,數(shù)據(jù)科學(xué)家需要在機(jī)器學(xué)習(xí)環(huán)境和notebook環(huán)境中工作,應(yīng)用程序開(kāi)發(fā)者則需要在生成式AI工具中工作?,F(xiàn)在,他們能夠在一個(gè)統(tǒng)一的環(huán)境中使用所需的數(shù)據(jù)和工具進(jìn)行構(gòu)建和協(xié)作,大大縮短了價(jià)值實(shí)現(xiàn)時(shí)間。
現(xiàn)在Amazon SageMaker Unified Studio已正式可用,通過(guò)將分析和AI所需的一切整合在一處,客戶(hù)可以更高效地解決復(fù)雜的端到端問(wèn)題,比以往更快地實(shí)現(xiàn)創(chuàng)新成果。
豐田是全球領(lǐng)先的汽車(chē)制造商之一,豐田內(nèi)部數(shù)據(jù)來(lái)源分散,涵蓋數(shù)據(jù)湖、數(shù)據(jù)庫(kù)及第三方數(shù)據(jù)源,實(shí)現(xiàn)數(shù)據(jù)互聯(lián)互通成為其一大挑戰(zhàn)。豐田不僅需要高效整合數(shù)據(jù),還需從多個(gè)來(lái)源快速提取信息,獲取洞察并構(gòu)建AI模型。Amazon SageMaker Unified Studio為豐田提供數(shù)據(jù)目錄、MLOps管道和完整的人工智能和機(jī)器學(xué)習(xí)工具集,助力數(shù)據(jù)科學(xué)團(tuán)隊(duì)快速部署模型,并高效共享成果,實(shí)現(xiàn)了從數(shù)據(jù)到業(yè)務(wù)價(jià)值的快速轉(zhuǎn)化。