15 | 从树到图：如何让计算机学会看地图？

你好，我是黄申。

我们经常使用手机上的地图导航App，查找出行的路线。那计算机是如何在多个选择中找到最优解呢？换句话说，计算机是如何挑选出最佳路线的呢？

前几节，我们讲了数学中非常重要的图论中的概念，图，尤其是树中的广度优先搜索。在广度优先的策略中，因为社交网络中的关系是双向的，所以我们直接用无向边来求解图中任意两点的最短通路。

这里，我们依旧可以用图来解决这个问题，但是，影响到达最终目的地的因素有很多，比如出行的交通工具、行驶的距离、每条道路的交通状况等等，因此，我们需要赋予到达目的地的每条边，不同的权重。而我们想求的最佳路线，其实就是各边权重之和最小的通路。

我们前面说了，广度优先搜索只测量通路的长度，而不考虑每条边上的权重。那么广度优先搜索就无法高效地完成这个任务了。那我们能否把它改造或者优化一下呢？

我们需要先把交通地图转为图的模型。图中的每个结点表示一个地点，每条边表示一条道路或者交通工具的路线。其中，边是有向的，表示单行道等情况；其次，边是有权重的。

假设你关心的是路上所花费的时间，那么权重就是从一点到另一点所花费的时间；如果你关心的是距离，那么权重就是两点之间的物理距离。这样，我们就把交通导航转换成图论中的一个问题：在边有权重的图中，如何让计算机查找最优通路？

基于广度优先或深度优先搜索的方法

我们以寻找耗时最短的路线为例来看看。

一旦我们把地图转换成了图的模型，就可以运用广度优先搜索，计算从某个出发点，到图中任意一个其他结点的总耗时。

基本思路是，从出发点开始，广度优先遍历每个点，当遍历到某个点的时候，如果该点还没有耗时的记录，记下当前这条通路的耗时。如果该点之前已经有耗时记录了，那就比较当前这条通路的耗时是不是比之前少。如果是，那就用当前的替换掉之前的记录。

实际上，地图导航和之前社交网络最大的不同在于，每个结点被访问了一次还是多次。在之前的社交网络的案例中，使用广度优先策略时，对每个结点的首次访问就能获得最短通路，因此每个结点只需要被访问一次，这也是为什么广度优先比深度优先更有效。

而在地图导航的案例中，从出发点到某个目的地结点，可能有不同的通路，也就意味着耗时不同。而耗时是通路上每条边的权重决定的，而不是通路的长度。因此，为了获取达到某个点的最短时间，我们必须遍历所有可能的路线，来取得最小值。这也就是说，我们对某些结点的访问可能有多次。

我画了一张图，方便你理解多条通路对最终结果的影响。这张图中有A、B、C、D、E五个结点，分别表示不同的地点。

从这个图中可以看出，从A点出发到目的地B点，一共有三条路线。

如果你直接从A点到B点，度数为1，需要50分钟。
从A点到C点再到B点，虽然度数为2，但总共只要40分钟。
从A点到D点，到E点，再到最后的B点，虽然度数为3，但是总耗时只有35分钟，比其他所有的路线更优。

这种情形之下，使用广度优先找到的最短通路，不一定是最优的路线。所以，对于在地图上查找最优路线的问题，无论是广度优先还是深度优先的策略，都需要遍历所有可能的路线，然后取最优的解。

在遍历所有可能的路线时，有几个问题需要注意。

第一，由于要遍历所有可能的通路，因此一个点可能会被访问多次。当然，这个“多次“是指某个结点出现在不同通路中，而不是多次出现在同一条通路中。因为我们不想让用户总是兜圈子，所以需要避免回路。

第二，如果某个结点x和起始点s之间存在多个通路，每当x到s之间的最优路线被更新之后，我们还需要更新所有和x相邻的结点之最优路线，计算复杂度会很高。

一个优化的版本：Dijkstra算法

无论是广度优先还是深度优先的实现，算法对每个结点的访问都可能多于一次。而访问多次，就意味着要消耗更多的计算机资源。那么，有没有可能在保证最终结果是正确的情况下，尽可能地减少访问结点的次数，来提升算法的效率呢？

首先，我们思考一下，对于某些结点，是不是可以提前获得到达它们的最终的解（例如最短耗时、最短距离、最低价格等等），从而把它们提前移出遍历的清单？如果有，是哪些结点呢？什么时候可以把它们移除呢？Dijkstra算法要登场了！它简直就是为了解决这些问题量身定制的。

Dijkstra算法的核心思想是，对于某个结点，如果我们已经发现了最优的通路，那么就无需在将来的步骤中，再次考虑这个结点。Dijkstra算法很巧妙地找到这种点，而且能确保已经为它找到了最优路径。

1.Dijkstra算法的主要步骤

让我们先来看看Dijkstra算法的主要步骤，然后再来理解，它究竟是如何确定哪些结点已经拥有了最优解。

首先你需要了解几个符号。

第一个是source，我们用它表示图中的起始点，缩写是s。

然后是weight，表示二维数组，保存了任意边的权重，缩写为w。w[m, n]表示从结点m到结点n的有向边之权重，大于等于0。如果m到n有多条边，而且权重各自不同，那么取权重最小的那条边。

接下来是min_weight，表示一维数组，保存了从s到任意结点的最小权重，缩写为mw。假设从s到某个结点m有多条通路，而每条通路的权重是这条通路上所有边的权重之和，那么mw[m]就表示这些通路权重中的最小值。mw[s]=0，表示起始点到自己的最小权重为0。

最后是Finish，表示已经找到最小权重的结点之集合，缩写为F。一旦结点被放入集合F，这个结点就不再参与将来的计算。

初始的时候，Dijkstra算法会做三件事情。第一，把起始点s的最小权重赋为0，也就是mw[s] = 0。第二，往集合F里添加结点s，F包含且仅包含s。第三，假设结点 s 能直接到达的边集合为M，对于其中的每一个对端节点m，则把mw[m]设为w[s, m]，同时对于所有其他s不能直接到达的结点，将通路的权重设为无穷大。

然后，Dijkstra算法会重复下列两个步骤。

第一步，查找最小mw。从mw数组选择最小值，则这个值就是起始点s到所对应的结点的最小权重，并且把这个点加入到F中，针对这个点的计算就算完成了。

比如，当前mw中最小的值是mw[x]=10，那么结点s到结点x的最小权重就是10，并且把结点x放入集合F，将来没有必要再考虑点x，mw[x]可能的最小值也就确定为10了。

第二步，更新权重。然后，我们看看，新加入F的结点x，是不是可以直接到达其他结点。如果是，看看通过x到达其他点的通路权重，是否比这些点当前的mw更小，如果是，那么就替换这些点在mw中的值。

例如，x可以直接到达y，那么把(mw[x] + w[x, y])和mw[y]比较，如果(mw[x] + w[x, y])的值更小，那么把mw[y]更新为这个更小的值，而我们把x称为y的前驱结点。

然后，重复上述两步，再次从mw中找出最小值，此时要求mw对应的结点不属于F，重复上述动作，直到集合F包含了图的所有结点，也就是说，没有结点需要处理了。

字面描述有些抽象，我用一个具体的例子来解释一下。你可以看我画的这个图。

我们把结点s放入集合F。同s直接相连的结点有a、b、c和d，我把它们的mw更新为w数组中的值，就可以得到如下结果：

然后，我们从mw选出最小的值0.2，把对应的结点c加入集合F，并更新和c直接相连的结点f、h的mw值，得到如下结果：

然后，我们从mw选出最小的值0.3，把对应的结点b加入集合F，并更新和b直接相连的结点a和f的mw值。以此逐步类推，可以得到如下的最终结果：

你可以试着自己从头到尾推导一下，看看结果是不是和我的一致。

说到这里，你可能会产生一个疑问：Dijkstra算法提前把一些结点排除在计算之外，而且没有遍历全部可能的路径，那么它是如何确保找到最优路径的呢？

下面，我们就来看看这个问题的答案。Dijkstra算法的步骤看上去有点复杂，不过其中最关键的两步是：第一个是每次选择最小的mw；第二个是，假设被选中的最小mw，所对应的结点是x，那么查看和x直接相连的结点，并更新它们的mw。

2.为什么每次都要选择最小的mw？

最小的、非无穷大的mw值，对应的结点是还没有加入F集合的、且和s有通路的那些结点。假设当前mw数组中最小的值是mw[x]，对应的结点是x。如果边的权重都是正值，那么通路上的权重之和是单调递增的，所以其他通路的权重之和一定大于当前的mw[x]，因此即使存在其他的通路，其权重也会比mw[x]大。

你可以结合这个图，来理解我刚才这段话。

图中的虚线表示省去了通路中间的若干结点。mw[x]是当前mw数组中的最小值，所以它小于等于任何一个mw[xn]，其中xn不等于x。

我们假设存在另一个通路，通过$x_{n}$达到x，那么通路的权重总和为mw[$x_{n}$] + w[$x_{n}$, x] ≥ mw[$x_{n}$] ≥ mw[x]。所以我们可以得到一个结论：拥有最小mw值的结点x不可能再找到更小的mw值，可以把它放入“已完成“的集合F。

这就是为什么每次都要选择最小的mw值，并认为对应的结点已经完成了计算。和广度优先或者深度优先的搜索相比，Dijkstra算法可以避免对某些结点，重复而且无效的访问。因此，每次选择最小的mw，就可以提升了搜索的效率。

3.为什么每次都要看x直接相连的结点？

我们已经确定mw[x]是从点s到点x的最小权重，那么就可以把这个确定的值传播到和x直接相连、而且不在F中的结点。通过这一步，我们就可以获得从点s到这些点、而且经过x的通路中最小的那个权重。我画了张图帮助你理解。

在这个图中，x直接相连$y_{1}$，$y_{2}$，…，$y_{n}$。从点s到点x的mw[x]已经确定了，那么对于从s到yn的所有通路，只有两种可能，经过x和不经过x。如果这条通路经过x，那么其权重的最小值就是mw’[$y_{i}$] = mw[x] + w[x, $y_{i}$]中的一个（1≤i≤n），我们只需要把这个值和其他未经过x结点的通路之权重对比就足够了。这就是为什么每次要更新和x直接相连的结点之mw。

这一步和广度优先策略中的查找某个结点的所有相邻结点类似。但是，之后，Dijkstra算法重复挑选最小权重的步骤，既没有遵从广度优先，也没有遵从深度优先。即便如此，它仍然保证了不会遗漏任意一点和起始点s之间、拥有最小权重的通路，从而保证了搜索的覆盖率。你可能会奇怪，这是如何得到保证的？我使用数学归纳法，来证明一下。

你还记得数学归纳法的一般步骤吗？刚好借由这个例子我们也来复习一下。

我们的命题是，对于任意一个点，Dijkstra算法都可以找到它和起始点s之间拥有最小权重的通路。

首先，当n=1的时候，也就是只有起始点s和另一个终止点的时候，Dijkstra算法的初始化阶段的第3步，保证了命题的成立。

然后，我们假设n=k-1的时候命题成立，同时需要证明n=k的时候命题也成立。命题在n=k-1时成立，表明从点s到k-1个终点的任何一个时，Dijkstra算法都能找到拥有最小权重的通路。那么再增加一个结点x，Dijkstra算法同样可以为包含x的k个终点找到最小权重通路。

这里我们只需要考虑x和这k-1个点连通的情况。因为如果不连通，就没有必要考虑x了。既然连通，x可能会指向之前k-1个结点，也有可能被这k-1个结点所指向。假设x指向了y，而z指向了x，y和z都是之前k-1个结点中的一员。

我们先来看x对y的影响。如果x不在从s到y的最小权重通路上，那么x的加入并不影响mw[y]的最终结果。如果x在从s到y的最小权重通路上，那么就意味着mw[x] + w[x, y]≤mw’[y]，mw’表示没有引入结点x的时候，mw的值。

所以有mw[x]≤mw’[y]，这就意味着Dijkstra算法在查找最小mw的步骤中，会在mw’[y]之前挑出mw[x]，也就是找到了从s到y，且经过x的最小权重通路。

我们再来看z对x的影响。假设有多个z指向x，分别是$z_{1}$, $z_{2}$, …,$z_{m}$，从s到x的通路必定会经过这m个z结点中的一个。Dijkstra算法中找最小mw的步骤，一定会遍历mw[$z_{i}$]（1<=i<=m），而更新权重的步骤，可以并保证从(mw[$z_{i}$] + w[$z_{i}$, x])中找出最小值，最终找到从s到x的最优通路。

有了详细的推导，想要写出代码就不难了。我这里只给你说几点需要注意的地方。

在自动生成图的函数中，你需要把广度优先搜索的相应代码做两处修改。第一，现在边是有向的了，所以生成的边只需要添加一次；第二，要给边赋予一个权重值，例如可以把边的权重设置为[0,1.0)之间的float型数值。

为了更好地模块化，你可以实现两个函数：findGeoWithMinWeight和updateWeight。它们分别对应于我之前提到的最重要的两步：每次选择最小的mw；更新和x直接相连的结点之mw。

每次查找最小mw的时候，我们需要跳过已经完成的结点，只考虑那些不在F集合中的点。这也是Dijkstra算法比较高效的原因。此外，如果你想输出最优路径上的每个结点，那么在updateWeight函数中就要记录每个结点的前驱结点。

如果你能跟着我进行一步步的推导，并且手写代码进行练习，相信你对Dijkstra算法会有更深刻的印象。

小结

我们使用Dijkstra算法来查找地图中两点之间的最短路径，而今天我所介绍的Dijkstra使用了更为抽象的“权重”。如果我们把结点作为地理位置，边的权重设置为路上所花费的时间，那么Dijkstra算法就能帮助我们找到，任意两个点之间耗时最短的路线。

除了时间之外，你也可以对图的边设置其他类型的权重，比如距离、价格，这样Dijkstra算法可以让用户找到地图任意两点之间的最短路线，或者出行的最低价格等等。有的时候，边的权重越大越好，比如观光车开过某条路线的车票收入。对于这种情况，Dijkstra算法就需要调整一下，每次找到最大的mw，更新邻近结点时也要找更大的值。所以，你只要掌握核心的思路就可以了，具体的实现可以根据情况去灵活调整。

思考题

今天的思考题和地图数据的特殊情况有关。

如果边的权重是负数，我们还能用今天讲的Dijkstra算法吗？
如果地图中存在多条最优路径，也就是说多条路径的权重和都是相等的，那么我刚刚介绍的Dijkstra算法应该如何修改呢？

欢迎在留言区交作业，并写下你今天的学习笔记。你可以点击“请朋友读”，把今天的内容分享给你的好友，和他一起精进。

精选留言

Being

2019-01-17 13:43:43

思考1: 如果边权值为负数就不能使用Dijkstra了，因为该算法是贪心算法，即每步都找最优解，在当前步的最优基础上找下一步最优，一定是单调递增的，而出现负权边，这样的前提就不满足了。
而且也不能有带负权值的环，这个样就会一直找当前最优，而且总是满足。
思考2:就在找最小值时返回最小值集合，更新集合内所有点的直连边权值的最小值，且把集合点都加入F。
（by the way这张封面图挺好看的🙂）

作者回复

回答思路很清晰，封面要感谢编辑帮忙 :)

2019-01-18 02:05:07
失火的夏天

2019-01-30 12:32:07

Dijkstra好像是基于贪心算法的思想，因为老师用数学归纳法证明了贪心选择可以得到最优，但是出现了负数，就不满足贪心选择了，算法思路应该就变成了动态规划

作者回复

Dijkstra是贪心，还是动态规划，确实有些不同意见。我个人觉得Dijkstra不算是贪心，因为贪心算法往往无法得到最优解，胜在简单和效率。而Dijkstra是可以找到最优的。我觉得Dijkstra更接近动态规划

2019-01-31 01:07:27
梦倚栏杆

2019-04-08 09:25:17

负数也可以吧，我们取负数的最小值，然后所有边全部加上这个负数的最小值，转换一下不就可以了吗？

作者回复

如果全都是负数也是可以的，只要保证单调性。如果同时有正有负就不行了，无法保证单调性，没法按照Dijkstra算法的方式进行优化。

2019-04-09 00:18:54
qinggeouye

2019-03-03 01:17:17

# python 实现
https://github.com/qinggeouye/GeekTime/blob/master/MathematicProgrammer/15_theShortestPath/lesson15_1.py

# 实现效果
用户 0 的好友: [5], 权重值 [0.42]
用户 1 的好友: [4, 9, 0, 6, 3], 权重值 [0.99, 0.16, 0.2, 0.6, 0.1]
用户 2 的好友: 不存在
用户 3 的好友: 不存在
用户 4 的好友: [2, 5, 3], 权重值 [0.17, 0.03, 0.03]
用户 5 的好友: [7], 权重值 [0.19]
用户 6 的好友: [4], 权重值 [0.38]
用户 7 的好友: [8, 1], 权重值 [0.86, 0.63]
用户 8 的好友: [7, 3], 权重值 [0.8, 0.19]
用户 9 的好友: [1], 权重值 [0.97]

------------- Dijkstra 单源最短路径算法 --------------
各下标节点对应的前驱节点： [1, None, 4, 1, 6, 0, 1, 5, 7, 1]
------------- 源点 1 到其它各节点的最短路径 ----------
源点 1 到 0 的最短路径：1 -> 0
源点 1 到 1 的最短路径：不存在
源点 1 到 2 的最短路径：1 -> 6 -> 4 -> 2
源点 1 到 3 的最短路径：1 -> 3
源点 1 到 4 的最短路径：1 -> 6 -> 4
源点 1 到 5 的最短路径：1 -> 0 -> 5
源点 1 到 6 的最短路径：1 -> 6
源点 1 到 7 的最短路径：1 -> 0 -> 5 -> 7
源点 1 到 8 的最短路径：1 -> 0 -> 5 -> 7 -> 8
源点 1 到 9 的最短路径：1 -> 9
caohuan

2019-01-22 19:00:47

黄老师说的老长了，如果给我们讲个故事听得会更有趣。
记得《大话数据结构》里面有说到广度优先和深度优先算法里，作者用找东西的例子，广度优先是到各个地方比如每个房价扫一眼，如果没有再慢慢深入到角落，深度优先就是因为有个大概记忆，然后跟随记忆从一个房间比如抽屉开始寻找，没有再去最有可能的角落找寻，所以广度优先是把所有的地方快速扫一眼，没有再慢慢进入小范围区域，深度优先就是去指定位置寻找。
本篇的 Dikstra 大概可以理解：把计算好的节点放入黑箱里，有新的节点加入只需要与箱子的节点连接，然后把新节点与箱子中临近的节点连接起来，计算新节点与临近节点的距离，更新最值，已有的节点间的距离不需要重复计算，总之 Dikstra算法是没有重复的计算，所以效率会很高，总的计算量会少很多，不像深度优先算法有大量重复的计算，广度优先算法在添加新节点时也会更新已有的计算。
所以Dijstra模块化的思想很节能，它包括 1.寻找MW的最小值或者最大值;2.update更新新节点时，再计算MW的最值。

回答老师的问题：问题一，权限值可以为正为负，例子：跑车游戏中，获胜方为规定时间内奔跑的路程最多，规则为路线中有不同奖励，其中有多增加时间的道路，也有减少跑车时间的路线，就是权限值有正有负。
问题二：多条优先路线，照样可以运用Dijkstra算法，把多条路线同时与接入新节点，然后计算距离，算出MW的值。

有个问题请教老师：一般地图搜索场景使用Dijkstra多一点还是动态规划多一点，还是其他算法，地图可以用百度地图、Google地图举例。

老师在专栏里会谈到机器学习算法在生活和产品中的运用吗?

作者回复

你的建议很好，我后面会注意用更形象的方式来讲解。

至于边的权重，至少在目前的Dijkstra算法中，权重必须是正的。因为只有正的，我们才可以不去考虑已经进入F集合的结点。这个在证明过程中也提到了为什么。

一般地图搜索还是用Dijkstra偏多，当然也有一些优化的算法。

最后，我在后面两大模块讲解时，也会使用工作中实际的案例，加强学习的体验。

2019-01-23 05:35:23
拉普达

2020-03-28 11:22:59

1.纯负数可以，否则不行。留言里那个所有权重加上最小负数绝对值的方法，没有考虑到路径中边的条数是不一样的。
2.如果有多条代价相等的最短路径，需要第二步修改，记录mw[y]=mw[x]+w(x，y)的解

作者回复

我理解留言里说的是所有的边权重都加上一个值，让所有权重的数值往坐标轴右移，直到没有负数。
第2点是可以的👍

2020-03-31 12:54:13
杨芸芸

2023-02-02 13:39:12

1、如果权重全为负值，可以使用Dijstra算法；如果有正有负则不可以，Dijstra算法的基础是通路的权重和是单调递增的，这样才能排除一个个节点。
2、修改方法：求出mv中所有值最小节点，将其一起排除和更新他们的直接连接节点mv值

作者回复

是的，可以通过合理的方式，将负的值转化为正的值

2023-03-03 02:28:22
跳刀躲梅肯

2020-07-02 14:57:01

文章最后这段话，”有的时候，边的权重越大越好，比如观光车开过某条路线的车票收入。对于这种情况，Dijkstra 算法就需要调整一下，每次找到最大的 mw，更新邻近结点时也要找更大的值“，应该是有问题的，Dijkstra算法不能用于求最长路径。

作者回复

确实是，因为车票是单调递增的，而不是递减，如果边上的权重都是负的，那么才能求最大值。我让编辑帮忙修改

2020-07-10 00:41:19
罗耀龙@坐忘

2020-04-07 18:30:03

茶艺师学编程

今天的主角，正是Dijkstra算法

思考题1：如果边的权重是负数，还能用Dijkstra 算法吗？

本来在计算的图是有向图，点到点是有方向的，那么负的边权重是什么意思?是向着相反方向走一段距离吗？但落地的点是不存在原来的图上的哦?到这时，算法就不能用了。

思考题2：如果地图中存在多条最优路径，也就是说多条路径的权重和都是相等的，那么Dijkstra 算法应该如何修改呢？

既然是相等的，那在选择候选项时限定数量。比如有10个候选的权重都是一样的，只要选其中的几个（看情况）输出为结果就好了。
013923

2022-07-28 12:12:02

谢谢！
张祈璟

2021-06-15 09:36:12

Dijkstra算法提出的最重要的一点：如果存在一个结点x，到它周边的所有结点中存在一个最小权值的点y，这个点x到点y的最优路径必是该路径。不可能还存在其他x到y的最小路径，原因是其他的路径在一开始已经大于了该路径。

作者回复

是的

2021-06-18 22:31:23
cheers !🍻

2021-06-11 16:56:23

思考1：负数就不能用Dijkstra算法了，而且我感觉Dijkstra算方法并不是贪心，因为贪心是只会获取当前情况的最优解，但是Dijkstra是可以求出整体最优解的，另外Dijkstra本身也是动态规划。
思考2：如果有多跳相同权重的结果，要看是什么需求了，如果需求只要一条权重最少的解那就直接返回并阻断搜索就好了，如果想得出最优解数组，那就在放入最优解数组时做比较判断，如果是当前最优-加入数组，不过是更有解那就清楚数组放入最优解，然后遍历所有路径返回数组
Geek_13e8db

2020-06-28 03:24:17

“第三，假设结点 s 能直接到达的边集合为 M，对于其中的每一条边 m，则把 mw[m]设为 w[s, m]”
我认为这里应该将“每一条边m”，改为“每一个对端节点m”

作者回复

对，这样描述更准确

2020-06-29 12:18:40
喻茂

2020-03-17 18:09:47

$nodesArr = [];// 节点列表
$nodeNum = 100;
$relation_num = 1000;
// 生成100个用户
for($i=0;$i<$nodeNum;$i++) {
$nodesArr[$i] = new Node($i);
}
// 随机生成各边权重和相邻关系
for($i=0;$i<$relation_num;$i++) {
$nodeIdA = mt_rand(0,$nodeNum-1);
$nodeIdB = mt_rand(0,$nodeNum-1);

if ($nodeIdA == $nodeIdB) { // 相同节点没必要建立相邻关系
continue;
}
$weight = mt_rand(1,1000); // 随机生成权重
$adjacent = $nodesArr[$nodeIdA]->adjacent;
if (!empty($adjacent[$nodeIdB])) { // a b已经建立相邻关系
continue;
}
$nodesArr[$nodeIdA]->adjacent[$nodeIdB] = $weight;
}

getMinWeightRoute($nodesArr,10,20);
喻茂

2020-03-17 18:09:35

// 选择权重最小的mv
function findGeoWithMinWeight($weightAll,&$findedNodeArr){
$nodeIdMin = -1;
$weightMin = -1;
foreach ($weightAll as $nodeId=>$weightAllOne) {
if (in_array($nodeId,$findedNodeArr)) { // 当前节点已经被选择过
continue;
}
if ($weightMin == -1 || $weightAllOne < $weightMin) {
$weightMin = $weightAllOne;
$nodeIdMin = $nodeId;
}
}
$findedNodeArr[] = $nodeIdMin;// 添加到已经被选择列表
return $nodeIdMin;

}

// 找出从nodeIdA到nodeIdB的权重最小路径和权重值
function getMinWeightRoute($nodesArr,$nodeIdA,$nodeIdB) {
if(empty($nodesArr[$nodeIdA]) || empty($nodesArr[$nodeIdB])) { // 节点a或者b不存在
echo "节点a或者b不存在<br>";
return;
}

$findedNodeArr = []; // 已经处理过的节点
$nodesArr[$nodeIdA]->weightAll[$nodeIdA] = 0; // 到自己本身的权重为0
$nodesArr[$nodeIdA]->routeArr[$nodeIdA] = "";
// $findedNodeArr[] = $nodeIdA;
while (true) {
$nodeIdMin = findGeoWithMinWeight($nodesArr[$nodeIdA]->weightAll,$findedNodeArr);// 取出最小权重节点，并加入到已经取出列表
if ($nodeIdMin == -1) { // 所有节点已经遍历完毕
break;
}
$undealNodeArr = $nodesArr[$nodeIdMin]->adjacent;// 查找最小节点的相邻节点
foreach ($undealNodeArr as $curNodeId=>$curNodeWeight) {
// 如果到当前子节点curNodeId还没有权重，
// 或者权重大于他到当前节点curDealnodeId权重+当前节点curDealnodeId到本相邻节点curNodeId
// 需要更新nodeIdA到curNodeId节点的权重和路径
if (empty($nodesArr[$nodeIdA]->weightAll[$curNodeId]) ||
($nodesArr[$nodeIdA]->weightAll[$curNodeId] >
$nodesArr[$nodeIdA]->weightAll[$nodeIdMin] + $curNodeWeight) ) {
$nodesArr[$nodeIdA]->weightAll[$curNodeId] =
$nodesArr[$nodeIdA]->weightAll[$nodeIdMin] + $curNodeWeight;
$nodesArr[$nodeIdA]->routeArr[$curNodeId] =
$nodesArr[$nodeIdA]->routeArr[$nodeIdMin] . ','.$curNodeId;
}
}
}

// 打印出a到b之间的权重和路径
if (!empty($nodesArr[$nodeIdA]->weightAll[$nodeIdB])) {
echo "节点{$nodeIdA}和节点{$nodeIdB}最小权重为：".$nodesArr[$nodeIdA]->weightAll[$nodeIdB]."<br>";
echo "路径为:".$nodesArr[$nodeIdA]->routeArr[$nodeIdB];

} else {
echo "节点{$nodeIdA}和节点{$nodeIdB}没有联通";
}

}
喻茂

2020-03-17 18:09:22

php示例
<?php
// 用户节点相关类
class Node {
public $nodeId;// 节点id
public $adjacent = []; // 相邻节点id和权重
public $weightAll;// 与所有节点之间的权重
public $routeArr = []; // 与所有节点之间的权重最小路径
public function __construct($nodeId) {
$this->nodeId = $nodeId;
}
}
建强

2020-01-18 23:28:27

思考题1：
如果边的权重是负数，运用Dijksta算法得到是任意两个点之间的最大距离，因为负数比较时，绝对值越大则其值越小，因此算法运行后，两个点之间距离的绝对值是这两个点的最大距离。

思考题2：
存在多条路径情况下，算法修改如下：
(1)增加一个一维数组，path，存贮从源点到各个节点的最优路径数，path[i]，即表示从源点S到节点i的最优路径数，除源节点path[s]=1外，其余各个节点的路径数都初始化为0。
(2)每当新加入一个节点i，则path[i]的值加1。
(3)每当新加入一个节点i，除了更新权重数组MW，还要对F集合中的节点进行检查，对于F中的某个节点k，如果有mw[i] + mw[i,k] = mw[k]，则说明从源点S到节点k至少存在着两条最优权重的路径，因此path[k]也要加1

最后path数组中即为源点到各节点的最优路径数。

作者回复

如果有负数是不能直接相加的

2020-01-19 12:10:54
cwtxz

2020-01-02 22:00:59

通过对《程序员的数学基础课》为期两周左右的系统性学习。大致理解了程序员学习数学的作用。那就是从最根本的思维方式来革新自己的编程手段，让你脱离重复而机械性的code，能从更宏观的层面来处理编程问题，成为一个thinker。让你从被业务驱动到驱动业务，这是根本性的改变。说得再直白来，就是让你能更快、更有效地完成工作，更随心所欲地驾驭编程这件事儿。总之，我已经有所领悟，数学，作为工具，很强大，其指导思维，很有用，所以，加油，争取再上一层楼！！！
南边

2019-10-31 20:15:35

有一个地方需要注意一下，应该有两个mw的映射，一个是findGeoWithMinWeight用的（这是个临时映射tempMw），用完了需要把找到的最小mw移除tempMw映射，否则findGeoWithMinWeight永远都只能找到那个固定的最小值（例子里是c点），另一个是已确定的mw映射（是结果映射resultMw），在updateWeight时候需要获取上一步的最小总权重值和更新到已确定的resultMw映射中

作者回复

很细致的点👍

2019-11-01 02:14:37
Paul Shan

2019-08-27 15:35:32

总结
广度优先：按照队列逐渐发现未知的点，遍历的顺序按照和源顶点的边数从小到大遍历。
深度优先：按照栈逐渐发现未知的点，遍历的顺序类似于树的后序遍历，先深入腹地，逐级后退。
最小距离遍历：按照距离的堆逐渐发现未知的点，遍历的顺序安装距离单调递增遍历所有点。