sponsored links

scene understand

论文阅读:Rethinking Visual Relationships for High-level Image Understanding

November 30
论文阅读:Rethinking Visual Relationships for High-level Image Understanding
文章   本文想解决的问题是,对于视觉关系检测这一任务来说,在目前常用的权威数据集Visual Genome的一个子集VG150(VG中出现频率最高的150类物体和50类关系)上,直接可以依赖统计的方法解决得比较好,这不利于关系检测的进一步研究,因此文章设计了一个网络可以滤除掉VG数据集中那些视觉无关(visually-irrelevant)的关系样本.在新的数据集上,基于频率的方法不再有效. 如上图(a)就是VG150中的一个场景图描述,(b)则是本文的的方法对VG清洗之后留下的场景图描述(V