量子场论(Quantum Field Theory,QFT)是量子物理学的基础理论,在无数的经验证明中得到了广泛的认可,成功地重新解释了量子力学。它将粒子视为场上的激发态,即所谓的量子,而粒子之间的相互作用则是以相应的场之间的交互项或费曼图来表示,这些图成为用于计算粒子交互过程的重要数学工具。
「场」的概念可以很直观地来描述,如一个电磁场被定义为时空的一种属性,可以用标量、矢量、复数等来表示。因此,QFT 将场的激发态定义为能量大于基态的任何状态,如光子是电磁场的一种激发态。
规范场论与球形曲面卷积
传统摄像头是对有限的 3D 场景采样,并投影到 2D 平面上。而 360° 全向摄像头围绕其光学中心的整个观察球体场景进行采样,提供视觉世界的完整画面——全方位视野视图。360° 图像提供了更加身临其境的视觉内容体验。
这种摄像头摄入的不仅有球形曲面物体,还包含无人机、机器人、自动驾驶汽车、VR/AR、3D 游戏的多台摄像头等旋转的物体摄入的 360° 全向视觉,360° 图像被投射到围绕摄像头光学中心的单位球面上。此外,球面和曲面图像数据还常常出现在医学成像、蛋白质分析、天体物理学、全球气候预报等重要领域。
卷积神经网络(CNN)可以处理各种视觉任务,包括图像识别、物体检测、图像分割等。然而,到目前为止,现有的 CNN 都是基于作用于平面上的普通卷积,它的训练数据和卷积核都是透视投影到平面的产物,不能理解和处理球形曲面物体的图像数据,也不能处理旋转的图像。例如,如果把一部汽车或一张人脸旋转一个角度,CNN 就无法识别出来。现有的 CNN 也无法有效执行三维物体表面识别、弯曲表面上图像或文字的识别等任务。
一些研究人员提出了解决方案,用几何 CNN、球面 CNN 等一些方法来帮助 CNN 应对复杂图像的处理,包括识别和分类,但是几何转换相当烦琐和费时。当以某种模式在球面上移动时,必须处理 3D 旋转而不是像在平面情况下的简单平移。球面信号的旋转不能通过对平面投影的平移来模拟,因为会导致错误和严重失真。
把规范场论(Gauge Theory)的等变原理应用到 CNN,是解决这一问题的一条有效途径。高通的 AI 研究人员塔科·科恩(Taco S. C
(本章节未完结,点击下一页翻页继续阅读)