近年來(lái),各個(gè)業(yè)務(wù)領(lǐng)域?qū)σ曨l數(shù)據(jù)的AI分析的需求急劇增加。尤其是第五代移動(dòng)通信系統(tǒng)的普及,預(yù)計(jì)將導(dǎo)致攝像機(jī)捕獲的超高清視頻圖像以及街頭和生產(chǎn)線上捕獲的許多圖像爆炸性增長(zhǎng)。
在開(kāi)發(fā)這項(xiàng)新的壓縮技術(shù)時(shí),富士通專注于AI和人類識(shí)別圖像的方式上的重要差異。即,在識(shí)別視頻數(shù)據(jù)中的人,動(dòng)物或物體時(shí),人工智能和人類在圖像區(qū)域上往往有所不同,而圖像區(qū)域在強(qiáng)調(diào)判斷時(shí)很重要。富士通已開(kāi)發(fā)出一種技術(shù),可以自動(dòng)分析AI重視的領(lǐng)域,并將數(shù)據(jù)壓縮到AI可以識(shí)別的最小大小。這使得可以分析大量視頻數(shù)據(jù)而不會(huì)損害識(shí)別精度,同時(shí)可以大大降低操作和數(shù)據(jù)傳輸成本。還可以預(yù)期,該技術(shù)將允許用戶通過(guò)組合存儲(chǔ)在云中的多個(gè)視頻數(shù)據(jù),傳感器數(shù)據(jù)和性能數(shù)據(jù)(例如銷售數(shù)據(jù))來(lái)分析更高級(jí)的視頻數(shù)據(jù)。
背景與挑戰(zhàn)
近年來(lái),使用AI分析圖像的技術(shù)發(fā)展迅速,并有望成為許多行業(yè)中許多公司進(jìn)行數(shù)字化轉(zhuǎn)型的驅(qū)動(dòng)力之一。隨著2020年復(fù)雜的5G移動(dòng)服務(wù)的到來(lái),對(duì)AI分析的需求預(yù)計(jì)會(huì)進(jìn)一步增加,同時(shí)超高清4K和8K攝像機(jī)以及大量視頻數(shù)據(jù)在包括行為分析在內(nèi)的應(yīng)用中的使用也將增加。制造業(yè)和零售業(yè)。
盡管如此,對(duì)于用于圖像分析的深度學(xué)習(xí)技術(shù)的處理要求仍提出了相當(dāng)大的挑戰(zhàn)。一種確保處理這些任務(wù)的計(jì)算能力的有效技術(shù)是與云一起處理,但是由于視頻數(shù)據(jù)通常非常占用資源,因此需要一種可以將所有視頻數(shù)據(jù)傳輸?shù)皆频母邏嚎s技術(shù)。而不會(huì)影響質(zhì)量,從而不會(huì)使網(wǎng)絡(luò)帶寬過(guò)載。
壓縮視頻會(huì)根據(jù)壓縮率降低圖像質(zhì)量,并且如果AI聚焦的區(qū)域過(guò)度壓縮,識(shí)別精度會(huì)降低。富士通開(kāi)發(fā)了一種視頻壓縮技術(shù),該技術(shù)可以自動(dòng)分析一幀視頻數(shù)據(jù)圖像中被AI識(shí)別為判斷材料的物體的區(qū)域,以每個(gè)區(qū)域識(shí)別所需的最低圖像質(zhì)量對(duì)圖像進(jìn)行壓縮(2)(圖1)。與傳統(tǒng)的壓縮技術(shù)相比,通過(guò)應(yīng)用此技術(shù),可以顯著減小視頻數(shù)據(jù)的大小,同時(shí)保持識(shí)別精度。
自動(dòng)估算壓縮比而不影響AI識(shí)別精度的技術(shù)。針對(duì)每個(gè)區(qū)域分析了壓縮特有的圖像質(zhì)量下降對(duì)識(shí)別精度的影響。根據(jù)AI識(shí)別結(jié)果自動(dòng)估算不影響識(shí)別精度的壓縮比。
當(dāng)改變整個(gè)圖像的壓縮比并改變圖像質(zhì)量時(shí),通過(guò)匯總對(duì)識(shí)別結(jié)果的影響來(lái)確定所有區(qū)域中AI在識(shí)別過(guò)程中特征的重要程度。將緊接在每個(gè)區(qū)域中的識(shí)別精度迅速惡化之前的壓縮率估計(jì)為不影響識(shí)別精度的壓縮率。