精确算法 MEASURE AND CONQUER

Maximum Independent Set
1. 重新设计问题实例并使用M&C分析
2. M&C 的一般策略
Feedback Vertex Set
1. FVS 的一个算法
  1. 前置定义与引理
  2. 朴素的 branching 思想
2. A more complicated one
  1. 详细算法流程
    1. Preprocessing
    2. Main Procedure
Dominating Set & Set Cover
1. 借助 M&C 分析
Lower Bound Analysis
总结: 使用 M&C 分析时间复杂度上界的一般步骤
Exercise

在 BRANCHING 中, 给出的分析时间复杂度的方法只能得到较为粗略的上界, 而 MEASURE AND CONQUER (简称为 M&C) 能够求出更紧的界.

设问题的 instance 为 , 的 measure 为 .

M&C 更注重于 measure 的选择, 而不是创造 branching 和 reduction rules. 一个 measure 需要满足下面的条件:

设是通过 reduction 得到的子问题, 则 .
对任意instance , .
input 的 measure 以为上界.

更复杂的 measure 可以给时间复杂度提供更好的上界.

Maximum Independent Set

将以下面的算法为例来分析其复杂度. 基于 BRANCHING 中的各个引理, 下面的算法正确性显然, 其中甚至为树时多项式地求的最大独立集是已知的事实.

上述算法中唯一的分支在 (3), 此时 branching vector 为至少为 , 则 , 得到了的时间复杂度, 但这只是一个最坏情况的上界.

求解树的最大独立集的多项式时间算法: 由于树的叶子结点度数总为 , 因此设的叶子集合为 , 那么 , 可以地求出树的最大独立集 (最坏情况是为链的情形).

重新设计问题实例并使用M&C分析

首先已经知道 branching 的运行时间以多项式搜索树的叶子结点数为界, 而叶子节点完全由分支规则 (3) 产生, 因此 branch 是(在运行时间上) “costly” 的, reduction 是“cheap” 的也就是说度数大于等于3的点是 “costly” 的, 度数不超过2的的点是 “cheap” 的, 为其分别定义权重和 .

因此定义图 (的 instance) 的 measure 为表示中度数至少为 3 的点的个数.

事实上是所有结点的权重和. 前述 instance 为的情况相当于每个点的权重都为 .

分析和有关的 branching vectors, 在下面也会把称为 weight of instance.

"和有关"的含义: 在前面以的结点数为问题的 instance, 分支后得到的子问题的 instance 为 , 在这里将作为问题的 instance, 那么得到的子问题的 instance 为 , branching vector 的写法并不改变.

首先需要分析的是, branching rule (3) 是如何具体改变的:

当丢弃时, 对于 , 的权也会从变为 , 因此 instance 的 measure 减少 , 至少为 .
当选择时, 中的点的权重可能会改变. 很不幸的是如果的存在度数为 2 的邻接点或者全部的邻接点度数都为 2, 那么选择造成的删点有可能不会影响的大小(只删去了权重为的点), 这就意味着 branching vector 为 , , 并没有达到目的.

显然并不是一个好的 measure, 需要重新设计.

问题在于度数为 2 的结点. 度数为 0 或 1 的结点可以被立刻由 reduction 移除掉, 度数至少为 3 的结点会进行 branch, 只有度数为 2 的结点留在图中, 因此应该有三种权重. 这很好修改, 令表示结点度数为 2 的权重, 那么设计 measure 我们不关心取何值时可以得到最好的结果 (通过更细致的分析和算力可以做到), 只需要知道改变 measure 可以得到一个更好的界即可, 这就是 M&C 的基本思想.

定理 1 当时, 以为 measure 进行 M&C 可以得到算法 mis3 的运行时间为 .

PROOF

M&C 的一般策略

就像上述例子一样, 在用 M&C 时设计问题实例的方法就是给问题中不同性质的成分赋不同的权, 后文中几乎所有的复杂度分析都是用这种方法.

Feedback Vertex Set

Feedback Vertex Set 简称为 FVS.

给定图 , 若满足不含有 cycle ( 为森林), 则称为 FVS. FVS 问题目的是找到最小的 FVS, 即删去最少数目的点使原图成为树/森林.

FVS 的一个算法

前置定义与引理

称点集是无环的如果是森林, 那么最大无环集与最小 FVS 是的一个划分, 所以求最小 FVS 等价于求最大无环集.

朴素的 branching 思想

在算法的某个过程中, 假如得到了一个无环集 , 那么很自然地就会考虑中的点能否添加到中, 这便是一个分支规则, 对于 , 设与中的相邻:

直接删去
选择 , 并删去中的所有满足下面条件的 : 对于 , .

对于这种分支规则, 一个很好的 measure 是 , 在这个 maesure 下, ?

A more complicated one

现在定义对的非平凡连通分量的收缩(contract)操作 (非平凡的含义是树的结点数至少为 2):

表示将收缩为结点 , 保留与相连的所有的边, 并删去缩点后与 有重边相连的结点.

对于无环集定义是的所有以为子集的最大无环集 (对于 , 且是最大无环集). 置 , 那么 FVS 问题转化为求的一个元素, 一个更一般的问题是对任意找到的一个元素.

收缩操作的目的是对图进行简化而不影响最大无环集, 且收缩操作必然可以将变为独立集, 那么收缩之后问题就转化为给定独立集求包含的最大无环集, 这会降低问题的求解难度.

现在需要论证最大无环集收缩得到的独立集是收缩后的图的最大无环集(如果给收缩定义一个逆操作“展开”, 也要论述展开后得到的是原图的最大无环集, 当然, 不关注展开之后的图是什么样子的, 毕竟收缩是丢失信息的), 表述为下面的引理:

Lemma 1 设是无环集且是的非平凡连通分量, 令是做操作后得到的图, 那么 PROOF 这个证明全部依托于反证法, 且证了一个方向之后另一个方向就是相似的方法.

当时, 需要证明的是: 是的最大无环集, 且 , 后面是显然的, 因为 .

首先若收缩后与有重边相连, 则就含有环, 这意味着 , 于是收缩删除的点不会包括中的点, 于是是的顶点集的子集.

证明是无环的. 令 , 假设有环 , 由于是无环的, 那么在环中, 可以将写成的形式, 其中与相邻且是中的一条路径. 现在再展开 , 那么中有使得与相邻, 与相邻, 且之间有路径 , 这意味着在中是一个环, 这个环是的子图, 显然与的无环性相悖.

通过假设有环, 构造出一个环为的子图以得到矛盾.

证明是最大的. 假设存在使得 , 那么在中就是一个比更大的无环集, 这与的最大性质相悖.

因此当我们在求的包含的最大无环集时, 总可以假定是独立集, 如若不然, 收缩即可.

下面的引理是后续分支算法的 branching rules 的主要依据.

Lemma 2 设是的一个独立集, 且恰与中的一个顶点相邻, 则存在使得或者中的两个顶点在中.

PROOF 分类讨论一下即可, 首先假设中没有点在中(它们也不在中), 则 , 且中 , 那么也是无环的同时是的最大无环集, 这与的最大性矛盾, 因此中至少有一个点在中, 有两种情况:

当中有两个点在中时, 引理成立;
当仅有一个满足时, 首先 , 那么有环, 且中 , 则中所有的环都包括 , 这就意味着是无环的, 它的大小等于 , 命题得证.

下面再给三个新定义.

active vertex: 算法执行过程中的一个顶点 .

令 , 为 active vertex, 再令 , 由于是独立集, 则 , 那么中可能存在非平凡连通分量, 令为执行之后得到的图.

generalized neighbor: 如果在中则称中的为的 generalized neighbor, 的含义如上.
generalized degree: 在中, 的 generalized neighbor 的个数称作 generalized degree, 记作 .

对于 generalized neighbor, 只有两种情况:

1: 若不与中除外的任何点相邻, 则仍然是独立集, 那么无需执行收缩操作(或者说执行收缩操作不改变 ), 的 generalized neighbor 就是它的 neighbor.

2: 若与相邻, 则中存在非平凡连通分量 , 将收缩为之后, , 也就是说为的 generalized neighbor 的集合.

这里也可以是多个点, 也就是中的非平凡连通分量是形如的图.

详细算法流程

设 , 给出下面的 branch 算法, 分为 preprocessing 和 main procedure.

Preprocessing

若不连通, 设其连通分量分别为则若不是独立集, 则对其非平凡连通分量做操作得到 , 满足如果中存在 active vertex 则将为 active vertex.

Main Procedure

预处理部分保证了下面的是连通的且是的独立集.

若 , 显然 , .

若 :

. 则中不存在环, 于是 .
, 选择满足 , 在上做分支, 要么选 , 要么不选 , 则

如果中没有 active vertex, 则任意选定 active vertex , 后文中的都指本步骤选择的 active vertex.

对于 , 若

, 则直接把加到中即 ;
, 要么选要么丢掉 ,
, 设的 generalized neighbor 为 , 由 Lemma 2 可得如果选择导致了环的存在, 直接忽略掉该分支即可.

最 trivial 的分支规则的正确性显然, 上面算法中的4的第一三条的正确性需要再说明一下:

执行操作后, 在中将恰与中的一个顶点相邻, 此时在中, 对于 , 要么 , 要么中的两个点在中, 而本身是由中的一些点和收缩而来, 的 neighbor 是的generalize neighbor, 那么在中以及 , 一定有或者 , 这分别对应了和的情形.

Theorem 1 FVS 问题可以在的时间内解决.

PROOF 设计 measure 为其中为 active vertex. 这实际上是中的点权为 , 中的点的点权为 , 剩余的点的点权为 , 且 , 若在 measure 为的条件下得到了复杂度上界为 , 那么可以得到最终的运行时间为 . 接下来考虑三个分支规则的 branching vector.

对于 2 的第 2条, , 那么所有的点的权重为 , 若直接丢弃 , 总权重减少 , 若选择 , 将成为 active vertex, 那么的权重将变为 , 中的两个顶点的权重将减为 , 总权减少了 , 因此 branching vector 为 .

对于 4 的第 2 条,

对于 4 的第 3 条, , 其中表示的 generalized

neighbor 中的权重为的点的个数.

通过搜索得到 , 则 .

In undirected graphs of maximum degree three, the feedback vertex set problem can be solved in polynomial time, by transforming it into an instance of the matroid parity problem for linear matroids.

Dominating Set & Set Cover

对于 MSC 的 set cover , 会说是的集合覆盖. 令 , 将求解 MDS 转化为求解 MSC, 即是的支配集当且仅当是的集合覆盖.

定义的频率为 , 即中含有的集合的个数.

两个比较显然的用来 reduction 的引理.

Lemma 1 若满足 , 则存在一个不包含的 MSC.

Lemma 2 若某个满足仅有唯一的使得 , 那么所有的 set cover 都包含 .

定义 , 即将中的每个集合删去中的元素.

Algorithm

1: 若则

2: 若存在 , 则

3: 若某个满足且 , 则 .

4: 选择中基数最大的集合 , 若 , 则在多项式时间内求解 ; 若 , 则要么在 MSC 中, 要么不在, 有分支定义 , 对于 MSC 的实例 , 定义其 measure 为 , 那么分支规则的 branching factor 为 , 因为选择之后中的元素至少减少 3 个, 于是用该算法求解 MDS 的复杂度为 .

事实上, 设计一个好的 measure 后, 对于同一个算法, 可以得到更好的复杂度上界为 .

借助 M&C 分析

注意到前述的分支规则是不断删掉中的集合, 并且每次是选择基数最大的集合, 这样的选择是合理的, 因为这样可以将中尽可能多的元素的频率减少 , 当频率减少到时便可以使用 reduction 而无需再分支.

除此之外移除中频率较高的元素可以让中更多的元素的基数减少 , 当的基数减少到的时候, 很容易就能判断是否要选择而无需再分支.

当选择一个集合时, 中所有的元素的频率都会减少至 .

因此显然可以赋予不同频率的元素和不同基数的集合不同的权重, 且偏好出现频率高的元素和基数大的集合, 于是令 , ,

设计 measure 其中表示权重, 且都是递增的(这符合前面分析的直觉), 且 .

为了便于分析具体的复杂度上界, 对权重做如下的赋值:

, 这是因为对于频率为 1 的元素或者是基数为 1 的子集无需再做分支
.

并假定 , 其中为的差分, 这个不等式衡量了序列的增长速度, 是逐渐减缓的, 这个假定是基于经验得到的, 同时它也确实能简化分析.

求两个分支的 .

删去的分支:

分别考虑频率和基数的减少量. 删去使基数为的集合数目减少了 1, 对 measure 的减少为 ; 删去使中每个元素的频率都从减少到了 , 那么 measure 总共减少了注意假定中 , 因此 , 于是令 , 表示中频率为的元素的个数, 那么有个元素的频率将从降为 , 于是然而仅仅考虑这两部分还不够, 删去之后会导致出现频率为的元素, 那么可以直接进行 reduction, 问题的 size 还会继续缩小, 于是还要再考虑的值.

设表示不等于且至少含有一个中的频率为 2 的元素的集合, 删去之后, 就必然要选 , 设 , 表示中的中的频率为 2 的元素的个数, 选择将问题的 size 减少了 , 同时

Lower Bound Analysis

分析下界的一般方法是构造一个实例, 该实例的复杂度作为整个问题最坏情况复杂度的下界.

最大独立集: 构造 .

MDS: 构造 , 是若干三角形的并, 如下所示

总结: 使用 M&C 分析时间复杂度上界的一般步骤

Exercise

2023-09-04 该篇文章被 Baoduo Xu 归为分类: Exact Exponential Algorithm

以上