Skip to content

Introduction

约 1535 个字 预计阅读时间 8 分钟

Geometric Data Processing 可以从以下两个角度理解

SA_1_1.png

Toolbox

Mathematician's Toolkit

欧几里得几何所考虑的形状都过于简单,虽然圆规和直尺足以测量和构造多边形和圆,却难以从现代各种模型中得到同样精确的结果。

数个世纪以来,人们致力于拓展几何语言和理论,为测量和比较形状、维度、粗糙度和连通性不同的对象提供公理化体系。

Differential Geometry

  • 微分几何通过无穷小来理解形状,专注于几何结构的局部分析
  • 微分几何的基本研究对象是流形(manifold),即局部 k 维对象。
  • 微分几何中,很多内在量(intrinsic)只依赖于形状本身,而不依赖于坐标系或者某些参数化形式,例如曲率、切向量、测地线等
Manifold,流形

在小范围内看起来像欧几里得空间的空间。例如,圆整体是一个环(2D),但是在某一小段上看起来就是一段直线(1D);球面整体弯起来了(3D),但是在某个小块上看起来就是平面(2D)。

  • 一维流形:曲线(圆,直线,螺旋线)
  • 二维流形:曲面(球面,环面,纸片)
  • 高维流形:三维流形(我们生活的空间)、四维流形(时空模型)

Differential Equations

微分方程指的是定函数和导数之间的关系。常微分方程和偏微分方程都自然用作表达和分析流形及其它几何结构上不同量关系的工具。

  • 常微分方程(ODEs) 描述平行传输,即沿着流形拖动向量的同时,保持接触而不进行不必要旋转的过程
    • 在平面上:只需要把向量一起平移即可(因为切平面不变)。
    • 在曲面上:切平面会随着点的位置改变,所以向量的方向也必须调整,这个过程就满足一个 ODE。ODE 可以描述“如何沿着一条曲线移动向量”。
  • 偏微分方程(PDEs) PDE 能够“感受到”几何形状的不同。例如热方程:
    • 平板:热量沿平面扩散
    • 球体:热量扩散方式受到球面几何的影响

Riemannian Geometry

黎曼几何可以说是微分几何的一个分支,它将形状和拓扑(或连通性)分离

拓扑空间表示点与点之间的连通关系,关心的是连通性;而几何关注长度、角度、面积、曲率等

一个启发性的例子,考虑将世界地图平铺在桌子上,这张地图足以用来理解哪些大陆相互连接;另一方面,我们知道作为一张纸的地图的几何是没有意义的,在纸上以英寸测量的点之间的距离并不是地球表面的真实距离。

而黎曼的几何模型考虑了黎曼流形,它将拓扑空间(例如地图)与计算真实几何上的长度和角度的方法相结合(例如经纬线)。后者被封装为地图上每个点的内积函数,该函数因位置不同和变化。

在地图上的南美洲和南极洲画一个相同向量,它们的拉伸程度并不相同

Metric Geometry

度量几何包含度量空间的几何和允许度量函数的空间。

一个度量 \(d(x,y)\) 由以下几点性质区分:

\[\begin{array}l d(x,y) \gt 0 & (\text {nonnegativity}) \\ d(x,y)=0 \Leftrightarrow x=y & (\text{Leibniz's Law}) \\ d(x,y) = d(y,x) & (\text{symmetry}) \\ d(x,y) \le d(x,y) + d(y,z) & (\text{triangle inequality}) \end{array} \]

上面四个性质公理化的定义了“距离”的含义

许多空间即便不是流形也允许度量结构,在计算领域中的关键例子就是图或网络,它被描述为通过边连接的节点集合。尽管像图这样的对象不包含导数和切空间,但几何推理在设计和高效处理度量结构数据上可以发挥重要作用。

Optimal Transport

最优传输把点与点之间的距离推广到概率分布之间的距离,例如如果某个点的位置不是确定的,而是一个“模糊范围”内的概率分布,则我们可以通过最优传输来衡量分布之间的距离。

即最优传输能够处理不确定数据,现实中大多数数据都是有噪声、不完整的

最优传输在机器学习中有广泛应用。

Computational Themes

在几何系统中,形状的表示方式是一个核心设计决策,有以下几种选项:

  • Point Cloud: 即嵌入欧几里得空间中的点集合。
    • 点云是最容易获取和存储的几何表示,但它们是无结构的,例如它们并不指示哪些点构成了中心点周围的局部邻域。
  • Meshes: 由三角形或四面体的网格组成,提供了点云中不存在的连接信息
    • 网格的复杂度取决于数据的维度。
  • Computer Aided Design(CAD): CAD 受益于表面和体积的几何表示,例如平滑参数化函数(smooth parameterized functions)
    • 这种表示允许精确计算微分量,但设计师被限制在较小的形状空间。
  • Implict Methods: 将流形表示为 \(\{x\in R^n : f(x) = 0\}\)
    • 可以优雅地处理拓扑变化,但是如果需要在远离零水平集的地方存储 \(f(x)\) 会很浪费空间;以及在高分辨率下表达细节较为困难。
  • Graphic: 定义为一个有权图
    • 不依赖嵌入在 \(R^n\),适合分析网络结构;但只能表达路径和长度关系,缺少更丰富的几何性质
  • Metric Spaces: 是最通用的表示,对任意两点 \(i,j\),存储它们的距离 \(d(i,j)\)
    • 优点是通用性,缺点是空间复杂度为 \(O(n^2)\),并且不能直接做微积分或者精细几何计算
Comments: