面向软件工程师的卡尔曼滤波器

与我的朋友交谈时，我经常听到：“哦，卡尔曼(Kalman)滤波器……我经常学它，然后我什么都忘了”。好吧，考虑到卡尔曼滤波器(KF)是世界上应用最广泛的算法之一(如果环顾四周，你80％的技术可能已经在内部运行某种KF)，让我们尝试将其弄清楚。

在这篇文章的结尾，你将对KF的工作原理，其背后的想法，为什么需要多个变体以及最常见的变体有一个直观而详细的了解。

状态估计

KF是所谓的状态估计算法的一部分。什么是状态估计？假设你有一个系统(让我们将其视为黑箱)。黑箱可以是任何东西：你的风扇，化学系统，移动机器人。对于这些系统中的每一个，我们都可以定义一个状态。状态是我们关心的变量向量，可以描述系统处于特定时间点的“状态”(这就是为什么将其称为状态)。“可以描述”是什么意思？这意味着，如果你了解当时的状态向量k和提供给系统的输入，则可以了解当时的k+1的系统状态(与此同时使用系统工作原理的一些知识)。

因此，状态估计算法估计系统的状态。为什么要估算呢？因为在现实生活中，外部观察者永远无法访问系统的真实状态。通常有两种情况：你可以测量状态，但是测量结果会受到噪声的影响(每个传感器只能产生一定精度的读数，可能对你来说还不够)，或者你无法直接测量状态。一个例子可能是使用GPS计算上述移动机器人的位置(我们将位置确定为状态的一部分)，这可能会给你带来多达10米的测量误差，对于你可能想到的任何应用程序来说，这可能都不够精确。

通常，当你进行状态估计时，你可以放心地假设你知道系统的输入(因为是你给出的)和输出。由于测量了输出，因此它也会受到一定的测量噪声的影响。据此，我们将状态估计器定义为一个系统，该系统接收你要估计其状态的系统的输入和输出并输出系统状态的估计。

卡尔曼滤波器

你可能已经注意到，我们已经讨论了一些有关误差的内容：

你可以测量系统的输出，但是传感器会给出测量误差
你可以估计状态，但是作为状态估计它具有一定的置信度。

除此之外，我说过，你需要某种系统知识，你需要了解系统“行为”的模型(稍后会详细介绍)，你的模型当然并不完美，因此你将拥有另一个误差。

在KF中，你可以使用高斯分布来处理所有这些不确定性。高斯分布是表示你不确定的事物的一种好方法。你当前确定的东西可以用分布的均值表示，而标准差可以说明你对该确定的信心。

在KF中：

你的估计状态将是具有一定均值和协方差的高斯随机变量(它将告诉我们该算法“确定”其当前估计的程度)
你对原始系统的输出度量的不确定性将用均值为0和一定协方差的随机变量表示(这将告诉我们我们对度量本身的信任程度)
系统模型的不确定性将由均值为0和一定协方差的随机变量表示(这将告诉我们我们对使用的模型有多信任)。

让我们举一些例子来了解其背后的想法。

不良模型，好的传感器，让我们再次假设你要跟踪机器人的位置，并且你在传感器上花费了很多钱，它们为你提供厘米级的精度。另一方面，你根本不喜欢机器人技术，搜索了一下，发现了一个非常基本的运动模型：随机游走(基本上是一个仅由噪声给出运动的粒子)。很明显，你的模型不是很好，不能真正被信任，而你的测量结果却很好。在这种情况下，你可能将使用非常窄的高斯分布(小方差)来建模测量噪声，而使用非常宽的高斯分布(大方差)来建模不确定性。
传感器质量差，模型好，如果传感器质量不好(例如GPS)，但是你花费大量时间对系统进行建模，则情况恰好相反。在这种情况下，你可能将使用非常窄的高斯分布(小方差)来建模模型不确定性，而使用非常宽的高斯分布(大方差)来建模噪声。

估计的状态不确定性如何？

KF将根据估计过程中发生的事情进行更新，你唯一要做的就是将其初始化为足够好的值。“足够好”取决于你的应用程序，你的传感器，你的模型等。通常，KF需要一点时间才能收敛到正确的估计值。

KF如何工作？

正如我们所说，要让KF正常工作，你需要对系统有“一定的了解”。特别是对于KF，你需要两个模型：

状态转换模型：某些函数，给定时间步k的状态和输入，给出时间步k+1的状态。

测量模型：某个函数，给定时间步k的状态，即可为你提供同一时间的测量结果

稍后，我们将了解为什么需要这些功能，让我们首先查看一些示例以了解它们的含义。

状态转换模型

该模型告诉你系统如何随时间变化(如果你还记得的话，我们之前曾谈到状态必须具有足够的描述性以及时推断系统行为)。这在很大程度上取决于系统本身以及你对系统的关心。如果你不知道如何对系统建模，则可以使用一些Google搜索来提供帮助。对于运动的物体(如果以适当的采样率测量)，可以使用恒速模型(假定物体以恒定的速度运动)，对于车辆，可以使用单轮脚踏车模型，等等……让我们假设一种或另一种方式，我们建立了一个模型。我们在这里做出一个重要的假设，这对于KF的工作是必要的：你的当前状态仅取决于先例。换句话说，系统状态的“历史”会压缩为先前的状态，也就是说，给定先例状态，每个状态都独立于过去。这也称为马尔可夫假设。如果这不成立，你将无法仅根据先例来表达当前状态。

测量模型(Measurement model)

测量模型告诉你如何将输出和状态联系在一起。直观上，你需要这样做，因为你知道测量的输出，并且想要在估计期间从中推断出状态。同样，此模型因情况而异。例如，在移动机器人示例中，如果你的状态是位置并且你拥有GPS，则你的模型就是单位函数(identity function)，因为你已经在知道了状态的有噪声版本。

每个步骤的数学公式和解释如下：

那么，KF实际如何运作？该算法分两个步骤工作，称为预测和更新。假设我们在时间步k，并且那时我们具有估计状态。首先，我们使用状态转换模型，并使估计状态预测到下一个时刻。这相当于说：鉴于我目前对状态的信念，我所拥有的输入以及对系统的了解，我希望我的下一个状态是这样。这是预测步骤。

现在，由于我们还具有输出和测量模型，因此我们实际上可以使用实际测量“校正”预测。在更新步骤中，我们采用预期状态，我们计算输出(使用测量模型)(2)，并将其与实际测量的输出进行比较。然后，我们以“智能方式”使用两者之间的差异来校正状态估计(3)。

通常，我们在校正之前用apex -表示状态的估计，它来自于预测步骤。K是卡尔曼增益。这就是巧妙之处:K取决于我们对度量的信任程度，取决于我们对当前估计的信任程度(这取决于我们对模型的信任程度)，根据这些信息，K“决定”预测的估计在多大程度上被测量纠正。如果我们的测量噪声与我们对来自预测步骤的估计的信任程度相比是“小”的，我们将使用测量对估计进行大的校正，如果相反，我们将对其进行最小程度的校正。

注意：为简单起见，我写方程式时就好像在处理普通变量一样，但是你必须考虑到在每一步中我们都在处理随机的高斯变量，因此我们还需要通过函数传播变量的协方差，而不仅仅是均值。

让我们举例说明。假设我们正在(再次)跟踪一个机器人的位置。实际位置显示为灰色，k时刻我们认为机器人处于绿色位置，估计协方差表示为一个椭圆。粗略地说，你可以从椭圆的形状看出，我们的过滤器在这一步对横向定位比在向前运动方向的定位更“自信”。在使用状态转换模型让系统演进的预测步骤之后，我们认为新的位置是红色的。由于椭圆在横向上变大了，我们现在对新的估计位置不太确定(例如，因为我们不太相信模型)。然后我们读取GPS，得到黑色的位置。在更新步骤中，实际的位置估计将是深绿色的虚线部分。如果我们更信任模型(与测量噪声协方差相比，协方差更小)，估计值将更接近红色;如果我们更信任测量(与模型不确定性相比，噪声测量协方差更小)，估计值将更接近红色。

KF家族

根据所使用的模型类型(状态转换和测量)，可以将KF分为两个大类：如果模型是线性的，则具有线性卡尔曼滤波器，而如果它们是非线性的，则具有非线性卡尔曼滤波器。

为什么要区分？好吧，KF假设你的变量是高斯变量，当通过线性函数传递时，高斯变量仍然是高斯变量，如果通过非线性函数传递，则不正确。这打破了卡尔曼假设，因此我们需要找到解决方法。

历史上，人们发现了两种主要的方法:利用模型作弊和利用数据作弊。如果你在模型上做了弊你基本上是将当前估计周围的非线性函数线性化，这样你就回到了线性的情况下。这种方法称为扩展卡尔曼滤波(EKF)。这种方法的主要缺点是必须能够计算f()和h()的雅可比矩阵。或者，如果你在数据上作弊，你使用非线性函数，然后你尝试“高斯化”(如果这个词存在的话)你做出的非高斯分布。这是通过一种叫做无损变换的智能采样技术实现的。这个变换允许你用平均值和协方差来描述(近似地)一个分布(只有高斯分布才能被前两个矩完全描述)。这种方法称为无损卡尔曼滤波(UKF)。理论上，UKF优于EKF，因为无损变换比线性化模型得到的近似更接近结果分布。在实践中，你必须有相当大的非线性才能真正看到大的区别。