說起人工智能,大部分人不只是耳熟,更能一一列舉出身邊人工智能應用的例子:人臉識別,智能家電,語音識別??扇绻麊柕绞裁词菙?shù)據(jù)采集和標注,相信除了人工智能技術從業(yè)者外,了解這一領域的人真是寥寥無幾,但這阻擋不了數(shù)據(jù)采集標注在人工智能行業(yè)所扮演的關鍵作用,說數(shù)據(jù)采集標注是人工智能行業(yè)的發(fā)展基石,一點也不為過。
按照目前采用的主流技術模式,人工智能技術的關鍵在于能夠模進行深度學習,而深度學習的基礎,是以輸入為導向的數(shù)據(jù)算法——神經(jīng)網(wǎng)絡,神經(jīng)網(wǎng)絡結果的準確性則取決于接近于“無窮”量級的大數(shù)據(jù)。所以,進行大量精準的數(shù)據(jù)訓練,采集海量數(shù)據(jù)進行標注,是人工智能進行深度學習極其關鍵的一環(huán)。
業(yè)內人士介紹,大數(shù)據(jù)時代的科技分工更加細化,準確高效地對多種類型的數(shù)據(jù)進行采集、標注、篩選、分類,滿足客戶在機器識別領域進行科研、測試和產(chǎn)品開發(fā)等方面的不同需求,就能摒棄復雜的中間環(huán)節(jié),大大提升人工智能深度學習的效率,這也成為人工智能時代最關鍵的一環(huán)。比如在數(shù)據(jù)標注方面,無論是人物表情標注、人臉多點標注、車輛標注、行進軌跡標注,還是特定符號標注、特殊場景標注、地圖位置標注,完美算法功能的實現(xiàn)完全取決于數(shù)據(jù)的精準標注。
那么,數(shù)據(jù)標注行業(yè)在整個人工智能領域處于什么樣的地位,未來又著怎樣的發(fā)展前景?龍貓數(shù)據(jù)的銷售總監(jiān)謝林波和商務總監(jiān)羅微波先生在接受媒體訪問時,對上述問題進行了專業(yè)的解答。
謝林波認為,數(shù)據(jù)采集標注和人工智能之間有著極強的協(xié)同增效關系,這個特點已經(jīng)得到業(yè)界的足夠重視,幾乎是業(yè)內共識。如何將兩者之間的結界徹底打通?數(shù)據(jù)采集標注的質量是一個重要的紐帶和基石。人工智能本身不會識別物體,而要依靠海量的數(shù)據(jù)訓練。
以人臉識別技術為例,當人臉關鍵點被一一標注之后,計算機才能建立起對人臉的認知。而人臉關鍵點的數(shù)目并不固定,不同數(shù)目的背后連接的是不同的算法。數(shù)據(jù)標注就是把這些數(shù)據(jù)進行分類、甄別、標注,最終實現(xiàn)更為精準的識別。
謝林波表示,隨著人工智能產(chǎn)業(yè)的發(fā)展,數(shù)據(jù)采集樣本需求量越來越大、樣本分布越來越廣泛,標注要求越來越嚴格,這對于數(shù)據(jù)服務商——特別是龍貓數(shù)據(jù)這種全領域大型服務商,是一個很大的挑戰(zhàn)。依靠自主開發(fā)的智能采集標注平臺,龍貓把數(shù)據(jù)采集標注需求分發(fā)給平臺上百萬量級的眾包用戶,依靠他們閑暇的時間進行數(shù)據(jù)采集標注,可以快速搜集大量的數(shù)據(jù)樣本;數(shù)據(jù)標注有多重質量把關,保證了數(shù)據(jù)采集、標注、分類精確無誤。
之前說過,數(shù)據(jù)標注的質量會直接影響人工智能訓練的效果,龍貓的數(shù)據(jù)標注平臺有標注員培訓—標注員考核—標注—審核——抽審等多重環(huán)節(jié),多重把關機制能夠確保最終產(chǎn)出高質量數(shù)據(jù);對于復雜的數(shù)據(jù)需求,龍貓還會通過自己管理的線下團隊進行采集標注。
對于產(chǎn)業(yè)的未來發(fā)展,龍貓數(shù)據(jù)的商務總監(jiān)羅微波表示,人工智能產(chǎn)業(yè)戰(zhàn)略地位不斷提升,無論從國家戰(zhàn)略層面還是行業(yè)本身來講,數(shù)據(jù)服務都是非常重要的一環(huán),從目前的市場規(guī)模來看,數(shù)據(jù)服務行業(yè)處于高速增長期,發(fā)展?jié)摿薮螅瑪?shù)據(jù)服務市場概念持續(xù)升溫,資本市場也非常關注。
謝林波表示,隨著數(shù)據(jù)服務行業(yè)市場的不斷成熟,公司業(yè)務也不斷拓展,服務能力不斷提升,龍貓數(shù)據(jù)目前仍在集中精力研發(fā)數(shù)據(jù)的開發(fā)采集和標注技術,打造高效穩(wěn)定的團隊,下一步將持續(xù)規(guī)范人工智能數(shù)據(jù)服務市場,在目前合作的企業(yè)領域內拓展更多的跨行業(yè)客戶。
據(jù)介紹,龍貓數(shù)據(jù)目前在產(chǎn)品和服務的橫向發(fā)展和縱向延伸都做了升級,不僅開放了很多免費數(shù)據(jù)集服務社會,更創(chuàng)造性搭建出國內首個基于數(shù)據(jù)的人工智能綜合服務平臺,可以更大限度的滿足人工智能企業(yè)甚至是傳統(tǒng)行業(yè)企業(yè)日益增長的定制化數(shù)據(jù)需求。龍貓數(shù)據(jù)將持續(xù)踐行行業(yè)責任和使命,未來會進一步加大在人工智能數(shù)據(jù)質量和安全性方面的投入,爭取用最高的性價比,為更多客戶提供精準、安全、迅速的優(yōu)質數(shù)據(jù)服務。
“用龍貓的專業(yè),助推中國人工智能產(chǎn)業(yè)的騰飛。”謝林波信心滿滿地說。
【來源:搜狐科技】