VRBench: a benchmark for multi-step reasoning in long narrative videos 2025年8月12日· Jiashuo Yu , Yue Wu , Meng Chu , Zhifei Ren , Zizheng Huang , Pei Chu , Ruijie Zhang , Yinan He , Qirui Li , Songze Li , Zhenxiang Li , Zhongying Tu , Conghui He , Yu Qiao , Yali Wang , Yi Wang Limin Wang · 0 分钟阅读时长 引用 URL 类型 会议文章 出版物 Proceedings of the IEEE/CVF International Conference on Computer Vision 最近更新于 2025年8月12日 Authors Limin Wang 南京大学 ← Scalable image tokenization with index backpropagation quantization 2025年8月12日 Differentiable solver search for fast diffusion sampling 2025年7月18日 →