竞赛课题
对大场景自然现象的表达需要高时空分辨能力,然而由于生物视觉系统感知通量的限制,需借助人工智能算法实现对大场景多对象复杂关系的智能感知与建模。PANDA(gigaPixel-level humAN centric video Dataset)是清华大学团队构建的国际上首个动态大场景多对象数据平台,场景平均覆盖平方千米级范围,可同时观测数千人,百米外人脸清晰可识别,视频分辨率近10亿像素。本赛道包含大场景多目标检测、追踪等视觉任务,旨在推动人工智能在大场景多对象复杂关系上研究的发展
数据描述
初赛使用PANDA-Image数据集。PANDA-Image由555张静态十亿像素图片组成,总共包含21个不同的场景,其中Training集包括390张图片。复赛使用PANDA-Video数据集。PANDA-Video数据集由15段视频序列组成。由于数据规模的限制,PANDA-Video经过了抽帧处理,抽帧后的帧率为2FPS,并以帧图像的方式存储视频。