我是孙浩,一名专注于人工智能(AI)领域的研究者,研究方向涵盖多模态学习、大语言模型 (LLMs)、视觉-语言-行动 (VLA) 模型、具身智能、强化学习与情感计算。我致力于推进通用人工智能(AGI)和变革性技术的发展,拓展人类知识与文明的边界。研究成果发表于 ACL、ACM Multimedia、Information Fusion、IEEE Transactions on Affective Computing 与 Pattern Recognition 等顶级国际会议与期刊,累计被引用 500 余次,并拥有多项授权专利。
教育与工作经历:
更多关于我的研究与论文的信息,请访问我的 Google Scholar 主页 或 ORCID 主页。
以下列出了我近期发表的代表性学术成果,涵盖多模态学习、大语言模型、视觉-语言-行动 (VLA) 智能体、具身智能与情感计算等方向。目前累计被引 500 余次,完整论文列表(20+)请参见我的 Google Scholar 主页。
第一作者或通讯作者论文:
在投稿件(第一作者):
共同一作 / 第二、第三作者论文:
近期专利:
软件著作权:
更多独立开发项目(30+)请访问我的 GitHub 主页。 2020 至 2021 年期间,我还在慕课网(IMOOC)发布了 TensorFlow 系列教程。
以下精选受邀报告,分享了我在具身智能、多模态学习与通用人工智能(AGI)方向的研究思考。
我积极参与了多个具有挑战性的科研项目,在多模态学习与实时监测等方向作出了贡献。以下为近期参与的代表性项目。
我积极投身学术共同体建设,担任人工智能、多模态学习与情感计算等方向多个权威期刊与会议的客座编辑与审稿人。
以下荣誉与奖项是对我在研究生与职业生涯中学术卓越、研究成果及领导贡献的认可。
本部分概述了我在科研与工程方面的核心能力,涵盖研究设计、算法开发、大规模模型训练与系统实现,重点聚焦于人工智能、大语言模型(LLMs)、多模态学习与具身智能等方向。