Yuanyuan Jiang, Jianqin Yin: Target-Aware Spatio-Temporal Reasoning via Answering Questions in Dynamic Audio-Visual Scenarios. EMNLP (Findings) 2023: 9399-9409