連日來語義緩存可用于支持AI的圖像分析向來一不斷的有小伙伴關注,不僅如此還衍生出了各大相關話題,那么跟著小編來看看語義緩存可用于支持AI的圖像分析以及它的相關資訊吧!
高分辨率,便宜傳感器的可用性以指數(shù)方式增加了所產(chǎn)生的數(shù)據(jù)量,這可能使現(xiàn)有的互聯(lián)網(wǎng)不堪重負。這導致需要在網(wǎng)絡邊緣具有計算能力來處理接近生成數(shù)據(jù)的數(shù)據(jù),而不是將其發(fā)送到云數(shù)據(jù)中心。眾所周知,邊緣計算不僅減少了帶寬的壓力,而且減少了從原始數(shù)據(jù)獵取情報的等待時間。但是,由于缺乏規(guī)模經(jīng)濟,使得云基礎架構的治理和提供具有成本效益,邊緣資源的可用性受到限制。
邊緣計算的潛力在任何地方都比視頻分析更為明顯。高清(1080p)攝像機在監(jiān)視等領域正變得司空見慣,并且根據(jù)幀速率和數(shù)據(jù)壓縮,每秒可產(chǎn)生4-12兆位的數(shù)據(jù)。較新的4K分辨率相機可產(chǎn)生每秒千兆字節(jié)的原始數(shù)據(jù)。對此類視頻流進行實時洞察的需求正在推動AI技術(例如深度神經(jīng)網(wǎng)絡)用于諸如分類,對象檢測和提取以及異常檢測等任務。
在我們的Hot Edge 2018會議論文“影子木偶:以Edge的速度和經(jīng)濟實現(xiàn)云級準確的AI推理”中,我們在IBM Research – Ireland的團隊使用商用云通過實驗評估了其中一種AI工作負載,對象分類的性能。托管服務。我們可以確保的最佳結果是每秒2幀的分類輸出,這遠遠低于每秒24幀的標準視頻生產(chǎn)率。在代表性的邊緣設備(NVIDIA Jetson TK1)上執(zhí)行類似的實驗可以滿足延遲要求,但是在此過程中,設備上的大部分可用資源都已耗盡。
我們通過提出語義緩存來打破這種雙重性,該方法將邊緣部署的低延遲與云中幾乎無限的資源結合在一起。我們使用眾所周知的緩存技術,通過對云中的特定輸入(例如,視頻幀)執(zhí)行AI推理,并根據(jù)提取的特征,針對“指紋”或哈希碼將結果存儲在邊緣,從而掩蓋了延遲從輸入。
設計該方案,以便根據(jù)某種距離度量,語義相似(例如,屬于同一類)的輸入將具有彼此“接近”的指紋。圖1顯示了緩存的設計。編碼器創(chuàng)建輸入視頻幀的指紋,并在高速緩存中搜索特定距離內的指紋。如果存在匹配項,則從緩存中提供判斷結果,從而幸免了查詢運行在云中的AI服務的需要。
我們發(fā)現(xiàn)指紋類似于影子木偶,是背景光在屏幕上產(chǎn)生的二維圖形投影。任何用手指創(chuàng)建影子木偶的人都將證明,這些圖形中沒有細節(jié),并不限制其成為良好敘事基礎的能力。指紋是實際輸入的投影,即使沒有原始細節(jié)也可以用于豐富的AI應用程序。
我們遵循“即服務”設計方法,并通過REST接口向邊緣設備/網(wǎng)關用戶公開了服務,從而開辟了語義高速緩存的完整概念證明。我們對各種邊緣設備(Raspberry Pi 3 / NVIDIA Jetson TK1 / TX1 / TX2)的評估表明,與云計算相比,推理延遲降低了3倍,帶寬使用率至少降低了50%。唯一的解決方案。
對我們方法的第一個原型實現(xiàn)的早期評估顯示了其潛力。我們將繼續(xù)完善初始方法,優(yōu)先嘗試使用替代編碼技術以提高精度,同時還將評估范圍擴展到其他數(shù)據(jù)集和AI任務。
我們設想該技術將在零售,工業(yè)設施的預測性維護以及視頻監(jiān)控等方面得到應用。例如,語義緩存可用于在結帳時存儲產(chǎn)品圖像的指紋。這可以用來防止由于盜竊或掃描錯誤而造成的商店損失。我們的方法是在云服務和邊緣服務之間無縫切換以在邊緣提供同類最佳的AI解決方案的示例。