# 组合问题 ## [77. 组合](https://leetcode.cn/problems/combinations/description/) ![combinations](https://paste.sainnhe.dev/Cytj.png) 每个节点存储的数据是什么?是一个 `vector` 类型的数据,代表当前节点的路径。 下一个节点的路径需要基于上一个节点的路径来获得,因此传入参数应该有一个 `vector path`。另外,还需要有一个 `vector> &result` 用来存放结果。 终止条件是什么?回溯法中的每个节点并不是真的树状节点,没有 `nullptr` ,因此用空指针来判断是否到了叶子节点并不合理。 本题中我们可以通过高度来判断是否达到了叶子节点,如果 `path.size() == k` 则说明到达了叶子节点,则停止迭代,并把当前路径添加到结果变量中。 因此我们还需要高度 `k`,`int k` 也应该是一个传入参数。 为了防止重复,我们需要在 `[1, n]` 中的一个子区间 `[begin, n]` 中选择一个数,`[1, begin]` 是我们已经选过了的,因此我们需要 `int n` 和 `int begin` 来作为传入参数。 在每次迭代中,我们从 `[begin, n]` 中挨个选一个数加到上一轮迭代传递进来的 `path` 中,然后进行下一轮迭代。 ```cpp void combineDFS(int n, int k, int begin, vector &path, vector> &result) { // 当 path 长度等于 k 时停止迭代,并将加入结果 if (path.size() == k) { result.push_back(path); return; } // 遍历可能的搜索起点 for (int i = begin; i <= n; ++i) { // 将 i 加入路径 path.push_back(i); // 下一轮搜索 combineDFS(n, k, i + 1, path, result); // 回溯,撤销处理的节点 path.pop_back(); } } ``` 我们现在来看看能不能优化。 ![optimization](https://paste.sainnhe.dev/NzcF.png) 在上图的这种情况中,每一层其实都可以剪掉一些不可能的分支,我们可以对每一层循环的终止条件进行限制,从而剪枝。 优化后的代码如下: ```cpp void combineDFS(int n, int k, int begin, vector &path, vector> &result) { // 当 path 长度等于 k 时停止迭代,并将加入结果 if (path.size() == k) { result.push_back(path); return; } // 遍历可能的搜索起点 // 在这一步中,每一次循环都可以对末尾进行限制来剪枝 for (int i = begin; i <= n - (k - path.size()) + 1; ++i) { // 将 i 加入路径 path.push_back(i); // 下一轮搜索 combineDFS(n, k, i + 1, path, result); // 回溯,撤销处理的节点 path.pop_back(); } } ``` ## [216. 组合总和 III](https://leetcode.cn/problems/combination-sum-iii/) ## [39. 组合总和](https://leetcode.cn/problems/combination-sum/) ## [40. 组合总和 II](https://leetcode.cn/problems/combination-sum-ii/) 最难的一个组合总和,因为 `candidates` 有重复元素,而要求最终结果不能重复。 e.g. 1 ```text Input: candidates = [10,1,2,7,6,1,5], target = 8 Output: [ [1,1,6], [1,2,5], [1,7], [2,6] ] ``` 如果你只是单纯地在 s0039 的基础上在下一次递归中将 `startIndex` 设为 `i + 1` 那么最终结果就会出现两个 `[1, 2, 5]`。 如果你直接排除 `candidates[i] == candidates[i - 1]` 的情形,那么最终结果就没有 `[1, 1, 6]`。 正确的逻辑应该是如果 `candidates[i] == candidates[i - 1]` 且 `candidates[i - 1]` 使用过,则剪枝。 ![demo](https://paste.sainnhe.dev/DMfz.png) 那么我们现在要来定义一下什么叫“使用过”。这张图里面有两种“使用过”,第一种使用过是“在树枝上使用过”,第二种使用过是“在数层上使用过”。 第一种“使用过”显然是合法的,我们允许元素在一条树枝上重复出现。而第二种“使用过”是不合法的,生成的结果重复了。 因此我们只需要对第二种“使用过”进行剪枝,而保留第一种“使用过”。 怎么做呢?我们创建一个 `vector used` 用来记录元素是否在树枝上出现过,初始化为 `false`。 ```cpp used[i] = true; combinationSum2DFS(candidates, target, i + 1, path, sum + candidates[i], used, result); used[i] = false; ``` 那么 `used[i - 1] == true` 说明 `candidates[i - 1]` 在树枝上出现过,我们需要保留这种情况,不剪枝。 ```cpp // 剪枝,但保留树枝重复的情况 if (i > 0 && candidates[i] == candidates[i - 1] && used[i - 1] == false) continue; ``` 另外需要注意一点,为了进行剪枝,我们需要对 `candidates` 进行排序: ```cpp // 对 candidates 进行升序排序,这是为了进行剪枝 sort(candidates.begin(), candidates.end()); ```