Yikun Wang | Fudan University

About Me [CV]

Hi, I am a second-year Ph.D. student in Fudan University & SII (Joint Program), currently supervised by Prof. Pengfei Liu. I received my B.S. in Computer Science from Fudan University. Previously, I worked with Qi Zhang, Fei Liu, and Jiaqi Wang.

My research centers on Multimodal Interactive Intelligence, with a particular focus on Multimodal LLMs and LLM agents. Please feel free to contact me for discussion and collaboration!

🚀 News

[Mar. 2026] Three papers were accepted to ACL 2026: GeometryZero, ASVR, and VideoPro.

[Nov. 2025] We released GeoVista, a web-augmented agentic visual reasoning framework for geolocalization.

[Jul. 2025] I joined Tencent Hunyuan as a research intern, working on frontier visual reasoning models.

[Apr. 2025] VisuoThink was accepted to ACL 2025 Main.

[Aug. 2024] Two papers were presented at ACL 2024.

Selected Publications [Google Scholar]

arXiv

GeoVista: Web-Augmented Agentic Visual Reasoning for Geolocalization

Yikun Wang, Zuyan Liu, Ziyi Wang, Pengfei Liu, Han Hu, Yongming Rao

ArXiv Technical Report

PDF Project Code

ACL

Autoregressive Semantic Visual Reconstruction Helps VLMs Understand Better

Dianyi Wang, Wei Song, Yikun Wang, Siyuan Wang, Kaicheng Yu, Zhongyu Wei, Jiaqi Wang

ACL, 2026

PDF Code

ACL

VisuoThink: Empowering LVLM Reasoning with Multimodal Tree Search

Yikun Wang*, Siyin Wang*, Qinyuan Cheng, Zhaoye Fei, Liang Ding, Qipeng Guo, Dacheng Tao, Xipeng Qiu

ACL, 2025 (Main)

PDF Code

ACL

Uncertainty Aware Learning for Language Model Alignment

Yikun Wang*, Rui Zheng*, Liang Ding, Qi Zhang, Dahua Lin, Dacheng Tao

ACL, 2024 (Main)

PDF

ACL

RRescue: Ranking LLM Responses to Enhance Reasoning Over Context

Yikun Wang*, Rui Zheng*, Haoming Li, Qi Zhang, Tao Gui, Fei Liu

ACL, 2024 (SRW)

PDF

arXiv

LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named Entity Recognition

Junjie Ye, Nuo Xu, Yikun Wang, Jie Zhou, Qi Zhang, Tao Gui, Bingning Wang, Xuanjing Huang

ArXiv Technical Report

PDF

Industry Experience

Tencent Hunyuan, Shanghai, China

Hunyuan Research Intern

Topic: Frontier visual reasoning model; supervised finetuning and reinforcement learning

Jul. 2025 ~ Dec. 2025