首页 >动态 > 正文

华人团队颠覆CV!SEEM模型可一键分割图像和视频|天天视讯

来源:站长之家 2023-04-23 21:08:50


【资料图】

编程客栈()4月23日 消息:继Meta的「分割一切」之后,又一个颠覆CV的模型来了!近日,威斯康辛麦迪逊、微软、港科大等机构的研究人员提出SEEphpM模型,通过不同的视觉提示和语言提示,一键分割图像、视频。

论文地址:https://arxiv.org/pdf/2304.06718.pdf

SEEM模型是一种新型的分割模型,这一模型可以在没有提示的开放集中执行任何分割任务,比如语义分割、实例分割和全景分割。

此外,它还支持任意组合的视觉,文本和引用区域提示,允许多功能和交互式的引用分割。javascript

在模型架构上,SEEM采用了常见的编码器-解码器架构。其独特的地方在于具有查询和提示之间复杂的交互。

SEEM模型可以通过多模态提示实现一次性分割所有地方的一切,包括图像和视频。这个模型的出现将会对计算机视觉领php域产生深远的影响,也将会对未来的技术发展方向产生指导作用。

上一篇:环球即时看!4100万,恭喜76人!被费城摆上货架不怪你,哈登恩比德冲冠需要你 下一篇:最后一页
x
精彩推送