自适应蒙特卡洛定位

蒙特·卡罗方法¶

蒙特·卡罗方法，也称统计模拟方法，是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明，而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。是指使用随机数（或更常见的伪随机数）来解决很多计算问题的方法。与它对应的是确定性算法。蒙特·卡罗方法在金融工程学，宏观经济学，计算物理学（如粒子输运计算、量子热力学计算、空气动力学计算）等领域应用广泛。

蒙特卡罗方法是一种计算方法。原理是通过大量随机样本，去了解一个系统，进而得到所要计算的值。它非常强大和灵活，又相当简单易懂，很容易实现。对于许多问题来说，它往往是最简单的计算方法，有时甚至是唯一可行的方法。

我们我们把随机算法分成两类 - 蒙特卡罗算法：采样越多，越近似最优解； - 拉斯维加斯算法：采样越多，越有机会找到最优解；

举个例子，假如筐里有100个苹果，让我挑出最大的。于是我随机拿1个，再随机拿1个跟它比，留下大的，再随机拿1个重复下去。我每拿一次，留下的苹果都至少不比上次的小。拿的次数越多，挑出的苹果就越大，但我除非拿100次，否则无法肯定挑出了最大的。这个挑苹果的算法，就属于蒙特卡罗算法——尽量找好的，但不保证是最好的。

而拉斯维加斯算法，则是另一种情况。假如有一把锁，给我100把钥匙，只有1把是对的。于是我每次随机拿1把钥匙去试，打不开就再换1把。我试的次数越多，打开锁（找到最优解）的机会就越大，但在打开之前，那些错的钥匙都是没有用的。这个试钥匙的算法，就是拉斯维加斯算法——尽量找最好的，但不保证能找到。

马尔可夫聚类(MCL)¶

MCL是属于图聚类的一种，根据点之间的距离关系来将不同的点进行聚类

首先看下图

从图中，我们可以看到，位于同一簇的点，其内部的联系应当紧密，而和外部的联系则比较少。也就是说，如果你从一个点出发，到达其中的一个邻近点，那么你在簇内的可能性远大于离开当前簇，到达新簇的可能性。这就是MCL的核心思想，如果在一张图上进行多次的“Random Walks”，那么就有很大可能发现簇群，达到聚类的目的。而“Random Walks”的实现则是通过“Markov Chains”（马尔柯夫链）。

马尔科夫链¶

在此图中，我们可以分为两个子图：V(1,2,3,4)和V(5,6,7)，其中，V1是一簇，V2是另一簇。在同一簇群中，各点之间完全连接，在不同簇之间，仅有(2,5)一条边。现在，我们从V1出发，假设每条边都一样，那么则一步之后我们有1/3的概率到达V2，1/3的概率到达V3，1/3的概率到达V4，同时，有0的概率到达V5,V6,V7。对于V2，则有1/4的概率到达V1,V3,V4,V5，有0的概率到达V6,V7。通过计算每个点到达其余点的概率，我们可以得到如下的概率矩阵：

根据上述例子，我们已经接触到了马尔科夫链，那么现在就给其下一个定义：Markov Process——在给定当前知识或信息的情况下，过去（即历史状态）对于预测将来（即未来状态）是无关的。 Markov Chain——如果有由随机变量X1,X2,X3⋯组成的数列。这些变量的范围，即他们所有可能取值的集合，被称为“状态空间”。而Xn的值则是在时间n的状态，如果Xn+1对于过去状态的条件概率分布满足：P(Xn+1=x|X0,X1,X2,⋯,Xn)=P(Xn+1=x|Xn)，则我们称其是一条Markov Chain

有权图¶

之前的例子中，图的边是没有权值的，也就是所有的边都是一样的。现在，为每条边添加一个权重（可以理解为亲密程度），那么，就需要重新计算到达每个点的概率了。假设有如下的图：

首先，我们要计算得到邻接矩阵，即：

通过邻接矩阵，我们就可以计算得到概率矩阵了，具体计算公式如下

最后的概率矩阵如下：

自适应蒙特卡洛定位

蒙特·卡罗方法¶

马尔可夫聚类(MCL)¶

马尔科夫链¶

有权图¶

评论