模式识别实验室
中国科学院自动化研究所   联系我们    English
 
    学术讲座

面向多模态大模型的安全性与可信性

模式识别系列讲座
Lecture Series in Pattern Recognition 

    TITLE):面向多模态大模型的安全性与可信性

SPEAKER: 董胤蓬,清华大学

(CHAIR)刘强 副研究员

    (TIME)2025年4月16日(周三),10:00

    (VENUE) 智能化大厦1610会议室


报告摘要(ABSTRACT):

 

多模态大模型近年来取得了快速发展,深刻改变了人们理解和生成图像、文本等数据的方式,并催生了如GPT-4o、Gemini、Sora等代表性成果。然而,尽管多模态大模型取得了巨大成功,其在安全性和可信性方面仍然面临着严峻的挑战。例如,这些模型很容易被诱导生成有害内容,易受对抗性攻击的干扰,且存在显著的隐私风险。本报告将介绍多模态大模型所面临的安全风险以及基于红队对抗的大模型风险高效挖掘方法;进而讨论如何降低大模型的安全风险,提升其安全性;最后介绍面向多模态大模型的可信评测基准。


报告人简介(BIOGRAPHY):

 

董胤蓬,清华大学人工智能学院助理教授,本科和博士毕业于清华大学计算机系,主要研究方向为机器学习、人工智能基础理论与安全。发表国际顶级学术会议和期刊论文六十余篇,谷歌学术引用11000余次,担任国际学术会议ICML、NeurIPS、ICLR领域主席。曾获得CCF优秀博士学位论文激励计划、清华大学优秀博士后等。


友情链接
 
中国科学院自动化研究所 模式识别实验室
中国科学院自动化研究所  事业单位   京ICP备14019135号-3