国产无遮挡色视频免费视频-国产五月色婷婷综合-国产五月婷婷-国产午夜不卡-曰批免费视频播放在线看片二-曰韩一级毛片

更多精彩 >

行業最高質量AI數據如何煉成?揭秘云測數據的取勝之法

2020-09-25 13:49:04   來源:投資家網專欄  作者:智能相對論 

摘要:AI加速落地的大背景下,作為人工智能產業落地重要的環節,AI數據標注越來越受到業界的關注,并在發生著很大的變化。

文|葉遠風

來源|智能相對論(aixdlun)

AI加速落地的大背景下,作為人工智能產業落地重要的環節,AI數據標注越來越受到業界的關注,并在發生著很大的變化。

不久前的服貿會上,數據標注領域的頭部企業云測數據首次對外發布了一項標準,其AI數據項目的最高交付精準度達到了99.99%,這是一個新的行業紀錄。對此,有自媒體“曾響鈴”評論認為,AI數據標注已經由“勞動密集”進入“技能密集”時代。

在AI數據產業中,數據精準度=驗收合格數量/全部數量,這意味極高的精準度不僅要滿足一些客觀標準,還需要與AI項目方的需求深度契合,通過基于需求的驗收過程。

事實上,對AI數據標注這種與制造業在很多地方相似的產業而言,更高的精準度的打造過程,就如同制造業的“精益制造”一樣,在多個方面有著發展方式的契合,只不過一個交付數據服務,一個產出實體產品。

這種契合,從行業頭部企業的動作看,包括四個方面。

業務平臺:應對復雜的AI數據交接和作業,出現線上自動化“流水線”

制造業的精益制造首先是“流水線”的自動化、智能化升級,引入更多精密的工具或機械,為產品的精益打磨提供了生產環境基礎。

數據標注也類似,粗放式的業務平臺越來越無法承接復雜的AI數據交接和作業,在這種背景下,線上的自動化“流水線”開始出現。

以往,數據標注過程的“線下”痕跡濃厚,尤其是數據導入和導出,硬碟拷貝、交接的“原始模式”不時出現。

為了提升效率和安全,做到短時間無縫對接,以云測數據為代表的企業探索出線上“流水線”業務平臺化模式。具體來說,就是根據AI企業的自身數據處理流程,完成標準化API接口的流程嵌入,數據在線上接入,完成作業后從線上輸出,中間有模板化的任務創建與責任安排,支持不同標注類型和標注方法。

這個過程,對應到制造業,其實就是“物料進入、找到眾多產線中合適的那一條并安排好生產工人、產品輸出”的過程。在線上,數據標注已經做到了數據進入、標注、交付的云上無縫連接過程。

這其中,對數據標注“精益制造”價值最為明顯的可能是“生產工具”的優化,工具能力的提升,大幅提升了數據標注的效率和精準度,這就好比流水線上功能豐富的自動化機械臂能夠幫助企業大大提升效率和質量一樣。

以云測數據為代表的企業開發的工具為案例,目前來看,工具對數據標注的價值有這三個體現:

一是直接的操作輔助,例如對人臉進行26點、54點、96點、206點的人臉關鍵點標注、貼合度在3像素以內的特定任務關鍵點追蹤,這使得標注員的操作能夠更加精細化,且擁有不錯的效率。

二是特殊數據的操作輔助,例如自動駕駛中激光雷達形成的3D點云數據不同于攝像頭形成的2D圖像數據,標注起來更有難度也更可能出現偏差,這時候,融合標注工具(把3D點云數據和2D圖像數據結合在一起對照)的價值就體現出來。

三是數據標注的糾錯保障,這類似于“精益制造”中人工質檢前的機器自動質檢,在數據標注過程中,工具根據AI項目需求設定查錯規則,保障標注的精準度(例如,一個三米高的物體標注為人體就錯了)

當然,工具質檢只是一種輔助,在數據標注的“精益制造”過程中,人工質檢(抽檢)同樣必不可少。云測數據不僅在標注流程上實現了正規化和科學化,設計了從創建任務、分配任務、標注流轉,還完善了了從質檢/抽檢環節到最后的驗收的管理流程。

數據作業:應對AI落地的深度需求,出現“數據工藝”般的精細化作業

生產工藝是“精益制造”的核心之一,工藝越好,產品往往更為優質,也更掌握市場的話語權。在“流水線”生產環境基礎上,隨著AI落地需求的加深,AI數據標注開始出現可以稱之為“數據工藝”的類似精細化作業過程,99.99%的精準度本身就是“數據工藝”的結果。

在云測數據的日常作業中,可以發現很多這種“數據工藝”般的做法,例如更豐富的數據標注類型,“線段”這種看起來簡單的標注對象也分出了折線、曲線、貝塞爾曲線等。

此外,如同制造業不斷積累工藝經驗,逐步提升工藝水準生產出更高等級的產品一樣,數據標注也存在一個經驗積累的過程來提升“數據工藝”水準,例如,工業中的大量看起來差不多的零件的標注,做到更細節層面才能區分出兩個型號類似的螺絲;零售行業大量相似的SKU,需要從品牌、標簽等多種細化角度來標注,幫助算法識別。

總的看來,對AI數據的復雜需求是促使數據標注朝著“數據工藝”方向發展的直接原因。

當下的AI數據呈現三個特征,一是由于AI產品落地場景的復雜性導致數據場景需求的多元化,如光線強度、拍攝角度、噪聲要求、室內室外等;二是同類數據表現出樣本多樣性,僅就聲音的數據,可能就包括年齡、性別、口音等差別;三是針對同一應用目標的數據多維化,例如智能駕駛就可能同時需要攝像頭、激光雷達、超聲波雷達等不同傳感器產生的數據。

很顯然,在這種背景下,AI發展初期那種直接應用或者購買成品“數據集”的做法行不通了,它們可以幫助算法快速成型,但卻難以支撐更多樣化的AI落地需求。

于是,“數據工藝”般的精細化作業對數據標注的需求自然而然就超出了單純數據標注的業務范疇,必然要整合上游數據采集這個關鍵環節。可以看到,以云測數據為代表的企業都在大力提升場景化數據采集的能力。幫助客戶還原落地場景所需要的AI數據,從源頭保證AI數據的質量,才能更好的應用于AI產業化的深度落地。

或許正因為這樣的原因,可以看到,云測數據在發布了最高項目交付99.99%精準度的同時,為了貼合實際場景、幫助更多行業實現“AI產品更快更好的落地”, 云測數據結合自身的服務能力積累和行業專業性,還推出了智慧城市、智能家居、智能駕駛、智慧金融四個場景下的“AI訓練數據服務解決方案”。

在這些整合了數據采集與標注的場景AI數據解決方案中,可以發現更明顯的“數據工藝”痕跡。

例如,在戶外場景中,攝像頭囊括了大量的行人、機動車、自行車等道路場景數據,但智慧城市的AI應用可能需要識別人流檢測、突發事件等長尾場景數據。

在云測數據的智慧城市解決方案中,就通過行業首創的數據場景實驗室來還原搭建真實場景,用于采集長尾場景數據,例如多種不同光線下的人員檢測、危險動作檢測等。

類似的還有智能駕駛場景。智能駕駛的車外環境感知需要大量真實場景數據用于算法訓練,為了確保行駛安全,需要覆蓋非常多的長尾場景數據,例如舉傘的行人、突然出現的寵物等,疫情發生后,帶口罩的行人也是另一種車外環境感知所需要的“場景AI數據”。

從細節上滿足更復雜深度的AI數據需求,提供獨特的、無法替代的AI數據獲取能力,將幫助數據標注持續獲得更高的產業地位。

人力建設:應對高精細化的“數據工藝”,出現專業的“人工智能訓練師”

“流水線”的生產基礎加上更高的生產工藝之后,“精益制造”考驗的還有產業工人是否能將工藝實現的能力,在產業升級的浪潮下,產業工人的素質成為“精益制造”的關鍵因素之一。

映射到數據標注,為了應對高精細化的“數據工藝”,專業的“人工智能訓練師”開始出現,這表現在三個方面。

一是體系化的人才培訓,整體技能專業性、領域知識專業性、人員素養等都在提升。

以云測數據為例,云測數據不僅提供崗前培訓,還帶有員工技能培訓、職能培訓、行業領域知識、責任培訓、標注內容的培訓,以及一對一的持續交流來提升員工的能力;與此同時,配備在線化、體系化的打分系統來評估員工的能力。

過去,數據標注那種隨便在街上、學校里拉一些人,只要認得圖片、懂基本的語法拼寫就開始干活的做法,已經不再具備任何競爭力了。

二是匹配不同需求的“人才梯隊”開始出現。

這一點,如同“精益制造”里更復雜產品配以技藝手段更高的工人一樣,在數據標注領域,出現了一些數據需求上的分化,倒逼企業培養某種意義上的“人才梯隊”。

典型的如醫療、法律、金融、家居等高度專業化的領域中,不論是CV還是NLP,人工智能訓練師需要非常專業,才能進行正確的數據標注與解讀,這甚至不是光有培訓就能解決的。云測數據在NLP領域就吸納了一些金融及家居行業的專才來提升對應領域的數據標注能力,這也意味著數據標注產業開始對人才來源口徑有了一些要求,不再是泛化的人群。

三是大量的操作細節和專業性不斷疊加。

產業工人變成“老師傅”,一方面來源于苛刻的工作要求,另一方面來自不斷的專業經驗積累。在數據標注這里也是如此。

粗放式管理下,傳統數據標注行業有一種“混亂”的旗氣質,草臺班子稀里糊涂完成了大量的數據標注工作。但現在,高精準度的大旗下,數據服務團隊的專業化能力被嚴格要求,在云測數據,智能客服單個場景的意圖標注就分為10-20個大類、上百個子類(表達同一個意圖,算法面臨的用戶可能有不同的表達方式,故越細分越好),根據業務需求可能還會有進一步的標注細分。

這倒逼數據標注員提升對話意圖的判斷能力,需要對句子進行泛化、以不同的描述方式重組或擴充句式、標簽(比如,用戶只是單純口誤了,或者夾雜了方言,數據都需要標注清晰,供AI算法去學習)。

在整體素質不斷提升的基礎上,人工智能訓練師呈現出更多樣化的梯度,更多優質的標注人才將脫穎而出。

需求交互:應對縱深的項目需求,出現深度交互的專業化服務模式

最后,“精益制造”階段的制造業,往往伴隨訂單方與生產方的深度溝通,需求方深度介入生產制造,才能生產出更符合初衷的產品。

這其實是支撐“精益制造”的專業化服務模式,在數據標注領域也是如此。為了明確AI數據標準,云測數據這種追求高精準度的企業早已要求項目經理與AI項目方在項目開展前反復溝通需求,配合行業培訓師對標注員們進行前期培訓,并在標注作業過程中保持實時的溝通和反饋。

這種反復溝通中,涉及到大量影響最終數據結果精準度的細節,例如,CV項目中,什么樣的光線要標注和定義為“強光線”?不同需求方的理解可能并不一樣。

除了明確數據標準的溝通,在作業方式上,數據標注現在也更為靈活。

典型的是金融場景中,由于行業的特殊性,尤其是對數據安全的極高要求,數據標注企業除了要提供了一套針對金融行業深度結合企業自身業務流程的AI數據服務方案,一些時候還必須改變部署與作業的物理方式,例如云測數據提供的私有化部署和駐場作業服務,在這種服務方式下,數據標注“企業服務”的本質也更明顯了一些。

值得強調的是,在數據隱私安全方面,云測數據設置了一系列嚴格措施。其中一條核心原則就是數據絕不復用,當數據合格交付后從不留底,會清毀相關數據;其二,所有和云測數據進行數據采集的用戶都會簽訂數據授權協議,從來源上確保企業用于訓練的數據合法合規;同時,云測數據內部還設定了數據隔離、質量保障等一系列數據安全流程和技術。

總而言之,AI加速落地催生出更為復雜的AI數據需求,使得本來與制造業在過程上有些類似的AI數據標注也走入屬于產業自身的“精益制造”過程,在生產環境、作業標準、人才建設以及服務模式上都有了很大的轉變。而云測數據帶來的這種轉變,不只是帶來了更高的精準度、更高質量的AI數據,也使得數據標注產業在AI時代的產業鏈條中作用愈加突出。數據標注就像是信息世界的新基建,只有基石的建設穩妥了,AI產業的高樓才能拔地而起,才能加速人工智能更好的到來。

此內容為【智能相對論】原創,

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業用途,如有侵犯,請作者與我們聯系。


小鵬汽車,徹底爆了!

新能源車市場,正在發生翻天覆地的巨變。

2025-03-11

Exness: 非農數據略疲軟,美元進一步走低

金融科技Exness

美國經濟在2月份增加了15萬個工作崗位,而普遍預期是16萬個左右。

2025-03-11

廣大特材:風力發電領域再創佳績,重大合同助力高質量發展!

上市公司廣大特材

在新能源產業蓬勃發展的浪潮中,張家港廣大特材股份有限公司(以下簡稱 " 廣大特材 ")憑借其卓越的技...

2025-03-11

快遞物流行業迎來"DeepSeek時刻",以AI重構“速度-成本”最優解

創新創業既未科技

曾幾何時,AI領域信奉“大力出奇跡”,隨著DeepSeek橫空出世,以“四兩撥千斤”的創新路徑,僅以...

2025-03-11

芯片賦能:粵港澳大灣區北斗產業的進階之路

創新創業北斗產業

從產業規模來看,2023年珠三角的衛星導航與位置服務產業產值達1112億元,占全國總產值的20.74...

2025-03-11

BCR澳洲18年券商全球金融市場重大事件權威解讀:美元貶值與黃金牛:新驅動因素浮現

金融科技BCR澳洲券商

VanEck的策略師表示,金價在2月份創下歷史新高,美元的“信心危機”或成為金價進一步上漲的催化劑。

2025-03-11

百利好:地緣情緒降溫 金價高位震蕩

金融科技百利好

近期,黃金市場呈現出復雜態勢。自 2 月下旬黃金價格觸及歷史高位2942.71美元/盎司后,便開啟了...

2025-03-11

問界M8\新M9累計訂單突破7萬臺 機構:賽力斯有望迎新一輪強新車周期

新能源問界

在賽力斯與華為的跨界合作下,問界在國內豪華汽車市場拿下一席之地,隨著雙方合作的持續深化,有助于進一步...

2025-03-11

當家長糾結 “什么奶粉比較好” 時,海普諾凱荷致給出最優解

大消費海普諾凱荷致

當新生命降臨,滿心歡喜的新手父母們瞬間被鋪天蓋地的育兒難題淹沒。寶寶每一聲啼哭,都像在提醒父母責任重...

2025-03-11

315新觀察:以用戶為本,人保app等構筑金融消費安全新防線

金融科技中國人保

在“3·15國際消費者權益日”來臨之際,我們接到了不少消費者關于保險及相關平臺的投訴

2025-03-11

投資家網(www.51baobao.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。

分化浪潮中的堅守與突破 | 第19屆中國投資年會,即將啟幕

分化浪潮中的堅守與突破 | 第19屆中國投資年會,即將啟幕

在時代的浩渺長河中,“分化”宛如一條隱匿的脈絡,貫穿于萬物的生長、發展與變遷。從生命的進化到文明的演...

第二屆中匈可再生能源、新材料商業投資峰會將盛大啟幕

第二屆中匈可再生能源、新材料商業投資峰會將盛大啟幕

第二屆中匈可再生能源、新材料商業投資峰會于2025年4月9日在匈牙利布達佩斯盛大啟幕。

雕刻耐心|第18屆中國投資年會·有限合伙人峰會在滬召開

雕刻耐心|第18屆中國投資年會·有限合伙人峰會在滬召開

“中國投資年會”作為私募股權行業的年度盛會,已成功舉辦了18屆,吸引了全國VC/PE領域從業者的廣泛...

主站蜘蛛池模板: 欧美日韩加勒比一区二区三区 | 久久精品国产6699国产精 | 91亚洲精品久久91 | 牛人国产偷窥女洗浴在线观看 | 午夜香蕉成视频人网站高清版 | 久久精品一区二区三区四区 | 成人午夜爽爽爽免费视频 | 久久夜色精品国产 | 99国产欧美久久精品 | 亚洲国产精品综合久久一线 | 中文字幕二区三区 | 免费一级美国片在线观看 | 一级做a爱片特黄在线观看 一级做a爱片特黄在线观看免费看 | 免费人成年短视频在线观看网站 | 手机看片福利视频 | 久久久久久一品道精品免费看 | 一级爱| 伊人22综合| 亚洲国产情侣一区二区三区 | 午夜一级毛片免费视频 | 一级毛片在线免费观看 | 亚洲欧美日韩精品久久亚洲区色播 | 美日韩黄色片 | 黄色毛片视频在线观看 | 一本色道久久88综合亚洲精品高清 | 欧美成人另类 | 怡红院免费va男人的天堂 | 欧美亚洲另类视频 | 免费观看日本高清a毛片 | 国产一级一片免费播放视频 | 国产日韩精品一区在线不卡 | 久久精品爱国产免费久久 | 欧美一级久久久久久久大片 | 18在线观看国内精品视频 | 欧美视频在线网站 | 99久久精品自在自看国产 | 一级欧美激情毛片 | 99久久99久久久99精品齐 | 男人的天堂毛片 | 性感美女视频免费网站午夜 | 美女午夜色视频在线观看 |