MIC-Lab

发布于 2025年09月12日

卡迪夫大学两位计算机视觉与图形学专家分享前沿研究成果

——聚焦“虚拟展开历史卷轴”与“可控生成式视觉内容编辑”

2025年9月12日，卡迪夫大学计算机科学与信息学院的两位杰出教授——Paul L. Rosin教授与来煜坤（Yukun Lai）教授，带来两场关于计算机视觉与生成式人工智能前沿研究的精彩学术报告，引发学界与公众广泛关注。

虚拟技术揭开尘封数百年的历史秘密

Paul L. Rosin教授在计算机视觉领域深耕四十余年，研究涵盖图像处理、形状分析、医学影像、非真实感渲染等多个方向，并长期推动跨学科合作。此次，他将聚焦一项极具挑战性的文化遗产数字化项目——“卷轴的虚拟展开”。

许多中世纪羊皮纸卷轴因极度脆弱而无法物理展开，其内容数百年来始终隐匿于层层卷曲之中。Rosin教授团队开发了一套基于X射线断层扫描的创新算法流程：首先通过专门设计的图像分割技术精准识别羊皮纸结构（即使存在孔洞或层间粘连），继而实现虚拟展平与墨迹密度恢复，最终成功还原出如15世纪布雷辛厄姆卷轴等珍贵文献的可读内容。更令人瞩目的是，该技术已拓展应用于胶片X光扫描，成功从损毁胶卷中恢复历史影像帧，为数字人文与档案修复开辟了全新路径。

迈向精细可控的AI视觉创作新时代

与此同时，来煜坤教授将围绕“面向可控视觉内容生成与编辑的深度生成模型”展开深入探讨。作为英国工程与自然科学研究理事会（EPSRC）生成模型AI研究中心卡迪夫负责人，以及多模态模型工作组联合领导者，来教授指出：尽管当前生成式AI仅凭文本提示即可快速生成图像，但其结果常因语义模糊而偏离用户意图，且难以在局部编辑时保持其余区域不变。

针对这一核心挑战，来教授团队提出一系列以用户为中心的交互式生成方法。通过引入涂鸦、草图等直观控制信号，用户可在图像上色、三维内容生成与编辑等任务中实现像素级或几何级的精细操控，同时兼顾生成质量与计算效率。相关成果已在计算机图形学与视觉顶级会议期刊发表百余篇，彰显其国际影响力。

强强联手，推动智能视觉技术边界

两位教授同属卡迪夫大学计算机科学与信息学院，分别在传统计算机视觉基础算法与新兴生成式AI应用领域取得卓越成就。他们的研究不仅深化了对图像理解与生成机制的理论认知，更在文化遗产保护、医疗影像、人机交互、数字创意产业等多个场景展现出巨大应用潜力。

本次系列报告不仅是一次学术思想的碰撞，更是向公众展示人工智能如何赋能人类探索历史、创造未来的重要窗口。随着技术持续演进，Rosin教授与来煜坤教授的工作将继续引领视觉智能走向更高精度、更强可控性与更广社会价值的新阶段。

← 返回列表