2025年05月27日 星期二
智能光场技术为高维视觉感知提供新途径

  文章:《一种基于对极约束注意力的光场图像超分辨率方法》

  期刊:华中科技大学学报(自然科学版),2025年第53卷第3期

  作者:杨敬钰、金满昌、胡昆澍、刘高生

  评荐:杨铀(华中科技大学电子信息与通信学院副院长、教授)

  人们眼睛看到的视觉信息是依托光而存在,因此图像是视觉信息的载体,也是光的客观记录。自1826年人类历史上第一张照片《窗外的风景》诞生以来,人们手里的照片经过了从模拟到数字、黑白到彩色、低分辨率到高分辨率的演变。下一步应该往何处去,这也许要回到光的本质来寻求答案。

  在信息领域,光是一种高维的信号,包括光源坐标、照射角度、光谱、发光时间等基本量。由这些变量构成的系统称为“光场”,光场信号的获取则被称为光场成像。近百年来,有17次诺贝尔奖都与“拍照”有关。然而,不论其获取方式、技术如何,都是对高维光信号的一种降维捕获,这成为了光场研究领域的一个“魔咒”。具体来看,我们通过照相机所拍摄的照片是二维的平面,然而所记录的光却是在三维空间中分布的。从三维降到二维,照片缺少了对空间距离的表达能力。如何通过低维的信息(二维的照片)重构高维的场景(三维的空间),这是一个典型的欠定问题,其解将有无穷多个。如何在无穷个解中找到令人满意的解,就是机器学习、人工智能的工作了。将人工智能与成像技术相结合,通过计算的方式来获得高维视觉信号,是计算成像的基本模式与任务,也是打破“魔咒”的有效途径。

  文章剖析了基于光场技术的高分辨率图像生成方法,提出要解决既多维度又高分辨率这种多目标问题的基本思路就是多视角成像。为此,该文深入探讨了多角度智能成像与生成式人工智能相结合的底层机制,并系统分析了其在高维视觉感知、高质量视频生成中的技术优势与发展前景,为未来移动终端的智能影像系统提供了关键理论支撑和实践路径。

  同时,该文还指出,在光场智能成像领域,生成式人工智能模型的超参数并非越复杂越好,而是应结合实际场景需求合理设定信息交互范围,才能实现图像的最优生成效果。

  该文提出的基于约束注意力机制的智能光场成像方法,不仅有效融合了光学硬件与人工智能的优势,也为实现更高质量、更多维度的视觉感知开辟了新思路。这一成果对于推动成像技术向“看得更清、看得更全、看得更深”迈进具有重要意义,有利于用户通过移动终端在复杂的成像环境中获得更高质量的影像。

京ICP备06005116