蘋果將出席今年 IEEE / CVF CVPR 大會,展示三項 AI 計算機視覺新成果
IT之家 6 月 6 日消息,蘋果公司宣布將參加本年度 IEEE / CVF 計算機視覺與模式識別會議(CVPR),現場展示其最新的計算機視覺研究成果,并進行多場技術演示。本次會議“有超過 20 位與蘋果有關的研究人員”擔任會議審稿人,這暗示蘋果公司正積極加強與學術界在人工智能領域的深度融合。
IT之家獲悉,今年的 CVPR 大會將于 6 月 11 日至 15 日在美國納什維爾(Nashville)舉行。蘋果將在大會現場展示三篇最新發布的研究論文:
FastVLM:面向視覺語言模型的高效視覺編碼器,該模型通過減少視覺標記數量,大幅提升了對高分辨率圖像的實時理解效率;
Matrix3D:大型三維建模一體化方案,該統一模型即使在訓練數據不完整的情況下,也能簡化 3D 內容生成流程;
World-Consistent Video Diffusion with Explicit 3D Modeling,該模型通過顯式三維建模提升 3D 一致性,在攝像機位置未知的情況下依然能夠實現更準確的三維結構預測。
蘋果表示,該公司將在以下時間段現場演示其 FastVLM 模型(IT之家注:下述時間已根據時差調整為北京時間):
公開信息顯示,IEEE / CVF 計算機視覺與模式識別會議自 1983 年起舉辦,是計算機視覺領域最具影響力的國際會議之一,競爭異常激烈,口頭報告錄取率不足 5%。
來源:IT之家