omniture

禾賽科技攜手Scale AI發(fā)布開源數(shù)據(jù)集 | 美通社

2020-07-10 10:15

PandaSet數(shù)據(jù)采集的兩款激光雷達(dá)Pandar64和PandarGT,以及配置6個(gè)攝像頭

近日,禾賽科技與Scale AI聯(lián)合發(fā)布了自動(dòng)駕駛開源數(shù)據(jù)集 -- PandaSet。PandaSet采用禾賽科技先進(jìn)的激光雷達(dá)進(jìn)行數(shù)據(jù)采集,并通過Scale AI強(qiáng)大的標(biāo)注平臺(tái)進(jìn)行精準(zhǔn)的數(shù)據(jù)標(biāo)注,為從事自動(dòng)駕駛研發(fā)的公司、機(jī)構(gòu)和個(gè)人,提供了內(nèi)容豐富、目標(biāo)物密集的高質(zhì)量免費(fèi)數(shù)據(jù)。

PandaSet數(shù)據(jù)集采用2款激光雷達(dá)和6個(gè)攝像頭進(jìn)行數(shù)據(jù)采集,包含超過16000幀激光雷達(dá)點(diǎn)云和超過48000張照片,共100多個(gè)場景。除了激光雷達(dá)點(diǎn)云和照片外,數(shù)據(jù)集還包含GPS(全球定位系統(tǒng))/IMU(慣性傳感器)、標(biāo)定參數(shù)、標(biāo)注、SDK(軟件開發(fā)工具包)等信息。

尤其值得關(guān)注的是,PandaSet數(shù)據(jù)集對100多個(gè)場景的每個(gè)場景都進(jìn)行了目標(biāo)檢測,共檢測28類物體;大多數(shù)場景還進(jìn)行了語義分割,共37種語義標(biāo)簽。目標(biāo)檢測采用傳統(tǒng)的長方體標(biāo)注,例如,自行車和汽車可以用長方體線框框出來。而對于激光雷達(dá)點(diǎn)云數(shù)據(jù),并非每個(gè)點(diǎn)都隸屬于某一目標(biāo)物,因此數(shù)據(jù)集還通過點(diǎn)云分割工具精確標(biāo)注了每個(gè)點(diǎn)的語義標(biāo)簽。如此細(xì)膩的標(biāo)注,也為深度學(xué)習(xí)算法模型提供了絕佳的數(shù)據(jù)資料。

對于一個(gè)自動(dòng)駕駛數(shù)據(jù)集,場景的多樣性和復(fù)雜性是衡量其優(yōu)劣程度的重要標(biāo)準(zhǔn)之一。PandaSet數(shù)據(jù)集中的所有數(shù)據(jù)均采集自舊金山的城區(qū)道路和硅谷的郊區(qū)道路,這些道路涵蓋了汽車、自行車、交通燈、行人、建筑物等各種各樣的交通信息,是對自動(dòng)駕駛挑戰(zhàn)性最大的一類應(yīng)用場景。此外,PandaSet數(shù)據(jù)集的數(shù)據(jù)覆蓋了白天和黑夜,也讓其具備了很強(qiáng)的適用性。

在數(shù)據(jù)采集中,PandaSet用于數(shù)據(jù)采集的兩款激光雷達(dá)均為業(yè)內(nèi)領(lǐng)先產(chǎn)品,這兩款激光雷達(dá)由禾賽科技自主研發(fā),一款是具有圖像級分辨率的前向激光雷達(dá)PandarGT,另一款是64線機(jī)械旋轉(zhuǎn)式激光雷達(dá)Pandar64,保證采集到的點(diǎn)云足夠準(zhǔn)確、清晰、細(xì)膩 -- 世界上現(xiàn)有的開源數(shù)據(jù)集普遍采集較早,還鮮有使用Pandar64和PandarGT這樣的高性能激光雷達(dá)來采集數(shù)據(jù)。

(美通社,2020年7月9日上海)