研究方向
我目前的研究方向为多模态学习, 计算机视觉, 具体包括:
- 组合式图像检索:结合视觉参考图像与自然语言修改的多模态指令中,准确检索符合用户意图的目标图像
- 多模态大语言模型:探索多模态大语言模型的感知、推理与交互能力,同时研究面向垂直领域的监督/指令微调以及基于强化学习的后训练方法
- 测试时自适应:通过持续学习和测试时自适应等技术,改进模型在部署后面对分布偏移、环境变化和未知数据时的鲁棒性与自适应能力
- 情感计算:建模并识别人脸表情、微表情及相关情感线索,提升模型对细粒度情绪变化的感知与理解能力
动态
近期动态
🎉🎉 一篇论文被 IEEE TMM 期刊接收(SCI,Q1,IF=9.7,CCF-A)
🎉🎉 入选中国科协青年科技人才培育工程博士生专项计划
🎉🎉 一篇论文被 Artificial Intelligence Review 期刊接收(SCI,Q1,IF=13.9)
🎉🎉 一篇论文被 AAAI 2026 会议接收(CCF-A)
🎉🎉 一篇论文被 IEEE TIP 期刊接收(SCI,Q1,IF=13.7,CCF-A)
🎉🎉 两篇论文被 Neurocomputing 期刊接收(SCI,Q1,IF=6.5)
🎉🎉 一篇论文被 IEEE TCSVT 期刊接收(SCI,Q1,IF=11.1,CCF-B)
🎉🎉 获得 硕士研究生国家奖学金
更多
学术论文
代表性论文
Enhancing Representation Inversion and Alignment for Zero-Shot Composed Image Retrieval
Emotion-aware Adaptation of CLIP model for Facial Expression Recognition
PSN: Parallel Spatiotemporal Network to Recognize Micro-Expression
CA-CLIP: Category-aware Adaptation of CLIP Model for Few-Shot Class-Incremental Learning
教育经历
教育经历
硕士 江苏科技大学
- 院系专业: 计算机学院, 软件工程
- 指导老师: 黄树成教授
- 专业排名: 1/12; 课程绩点: 4.1/5.0
- 荣誉称号: 研究生国家奖学金 (Top 3%)、一等奖学业学金 (连续3年)、优秀硕士学位论文、优秀毕业生 (Top 3%)、优秀研究生标兵 (Top 1.5%)等10余项荣誉称号
- 比赛获奖: 第四届江苏省研究生数学建模科研创新实践大赛省三等奖、第七届中国高校计算机大赛-网络技术挑战赛华东赛区三等奖、江苏科技大学研究生数学建模大赛一等奖
访问学生 加州州立大学圣贝纳迪诺分校
- 院系专业: 商业与公共管理学院, 管理信息系统
- 课程绩点: 3.9/4.0 (均获A级)
学士 江苏科技大学
- 院系专业: 经济管理学院, 信息管理与信息系统
- 专业排名: 5/72
- 荣誉称号: 优秀毕业生 (Top 3%)、一等奖学业学金、三好学生、优秀学生干部等10余项荣誉称号
- 比赛获奖: 江苏省大学生创新创业训练计划省级结题 (No. 201910289051Y)、“创青春-启航杯”创业设计大赛三等奖
荣誉称号
荣誉称号
中国科协青年科技人才培育工程博士生专项计划
天津理工大学研究生一等学业奖学金
江苏科技大学优秀硕士学位论文,研究生优秀毕业生(Top 3%),一等学业奖学金
硕士研究生国家奖学金(Top 3%)
江苏科技大学优秀研究生标兵(Top 1.5%),一等学业奖学金
第四届江苏省研究生数学建模科研创新实践大赛省三等奖
第七届中国高校计算机大赛-网络技术挑战赛华东赛区三等奖
江苏科技大学优秀毕业生(Top 3%),一等学业奖学金
更多
实习经历
研究经历
中国科学院自动化研究所 多模态人工智能系统全国重点实验室 多媒体计算组(MMC),客座学生(实习)
研究方向:跨模态图文检索,多模态大语言模型,测试时自适应,持续学习等
合作导师:徐常胜研究员(国家杰青,IEEE/IAPR/CCF/CSIG Fellow),张飞飞教授(青拔,天津市杰青)天津理工大学 智能媒体分析与计算实验室(IMAC Lab),客座学生(实习)
研究方向:人脸表情识别,视觉语言模型,多媒体计算
合作导师:徐常胜研究员(国家杰青,IEEE/IAPR/CCF/CSIG Fellow),张飞飞教授(青拔,天津市杰青)学术活动
学术活动
IEEE TPAMI/TCSVT/TMM, Information Sciences, MMSJ, SPIC, AJSE, SIVP。
IEEE CVPR/ICCV/ICME, AAAI, ACM MM, ChinaMM。
项目经历
项目经历
面向跨媒体查询的增量检索研究
国家自然科学基金面上项目,参与。主要研究跨媒体内容生成完备化、跨媒体语义融合透明化以及跨媒体关联推理持续化等关键问题。
基于鲁棒表观建模的行人检测方法研究
国家自然科学基金面上项目,技术骨干。主要研究复杂场景下的行人检测、跨域泛化与增量检测问题。
基于视觉自注意网络与跨模态特征融合的微表情识别
江苏省研究生科研创新计划项目,项目负责人。围绕人脸表情、微表情识别等情感计算相关领域开展研究。
基于鲁棒表观建模的目标跟踪方法研究
国家自然科学基金面上项目,技术骨干。研究复杂场景下的目标跟踪算法及视频时序定位等问题。
基于 MVC 的大学生就业软件设计与开发
江苏省大学生创新创业训练计划省级重点项目,第二完成人。主要负责数据库设计开发和前端开发工作。
更多
学生工作与专业能力
学生工作与专业能力
班级班长(2021-2024)
研究生会组织部部长(2021-2022)
学生会科技部部长(2018-2019)
班级团支书(2017-2021)
Python
PyTorch
Java
Matlab
Linux
LaTeX
Llamafactory
EasyR1
欢迎交流