IT之家 5 月 21 日消息,英偉達打造了用于視頻搜索與總結(VSS)的 AI Blueprint,該藍圖由 NVIDIA Metropolis 平臺驅動,現已全面推出,可為開發(fā)者提供構建和部署 AI 智能體的工具,用于分析大量實時和存檔視頻。

由視覺語言模型(VLM)驅動的一系列視覺 AI 智能體和生產力助手即將上線。結合計算機視覺模型與超智能大語言模型(LLM),這些視頻分析 AI 智能體可幫助企業(yè)查看、搜索并總結海量視頻。通過實時分析視頻或處理 TB(terabytes)級錄制視頻,視頻分析 AI 智能體正在眾多行業(yè)釋放前所未有的價值和機遇。

英偉達推出視頻搜索和總結工具AI Blueprint

IT之家附示例如下,該工具采用問答形式,可幫助讀者分析球賽、裝機,甚至能找到視頻中的某個時間段提到了某個特定詞匯。

VSS 藍圖集成了 NVIDIA AI Enterprise 軟件平臺,包括用于 VLM、LLM 的 NVIDIA NIM 微服務,以及用于 RAG 的先進 AI 框架。通過 VSS 藍圖,用戶總結視頻的速度比實時觀看快 100 倍。例如,60 分鐘的視頻可在不到 1 分鐘的時間內用文字總結出來。

英偉達推出視頻搜索和總結工具AI Blueprint

它可以同時處理數百個實時視頻流或多組視頻片段。除了視覺理解,它還支持音頻轉錄。在音頻至關重要的場景中,將語音轉換為文本可增強理解,例如訓練視頻、主題演講或團隊會議等。

標題:英偉達推出視頻搜索和總結工具AI Blueprint

地址:http://liuxuerexian.com/kaoxiang/232500.html