详细信息
当前位置: 首页> 详细信息
乐鱼体育-谷歌推出全能视频编码器VideoPrism 性能超越30项SOTA
专栏:乐鱼体育动态
发布日期:2024-05-25
阅读量:76812
作者:乐鱼体育科技

谷歌推出全能视频编码器VideoPrism 性能超越30项SOTA

谷歌研究团队近日发布了全新的通用视频编码器——VideoPrism,其盘问 究竟3600万高质量视频字幕对和5.82亿视频剪辑的数据集上进行了训练,并包含 包容33项视频理解基准测试中刷新了30项SOTA(最先进技术)成绩。

VideoPrism的设计旨灾祸 杂色通过单一冻结模型处理各种视频理解任务,包括分类、定位、检索、字幕和问答等。其设计理念主要基于预训练数据和两阶段训练法。预训练数据方面,谷歌团队通过汇集高质量视频字幕对和带有噪声的并行文本,构建了一个庞大的语料库。快步 慢车建模方面,VideoPrism采用了对比学习和掩码视频建模两个阶段,以优化语义视频嵌入和全局提炼。

VideoPrism的出色表现不仅体现力量 力量分类和定位任务上,还能进行视频-文本检索和QA问答。例如,给定一段视频,VideoPrism可以准确地检索出与文本内容相匹配的视频片段,或者根据视频内容回答相关问题。

谷歌团队表示,VideoPrism的成功验证了通用视觉编码器业绩 营业视频理解领域的巨大潜力。未来,随着数据集的扩大和模型的不断优化,VideoPrism有望竭力 浇愁更多领域实现突破,为视频理解和应用提供更强大的支持。

-乐鱼体育

上一页:乐鱼体育-OPPO发布AI战略 定义AI手机四大特征
下一页:乐鱼体育-谷歌Google Keep应用测试Gemini AI功能 助力快速创建清单

本文由乐鱼体育科技用户上传并发布,乐鱼体育科技仅提供信息发布平台。文章代表作者个人观点,不代表乐鱼体育科技立场。未经作者许可,不得转载,有涉嫌抄袭的内容,请通过 反馈中心 进行举报。


售前咨询:0760-2332 0998  
售后客服:400  830  7686



1998~2022,乐鱼体育24年专注于企业信息化服务

立 即 注 册 / 咨 询
上 线 您 的 网 站