# 组合问题 ## [77. 组合](https://leetcode.cn/problems/combinations/description/) ![combinations](https://paste.sainnhe.dev/Cytj.png) 每个节点存储的数据是什么？是一个 `vector` 类型的数据，代表当前节点的路径。下一个节点的路径需要基于上一个节点的路径来获得，因此传入参数应该有一个 `vector path`。另外，还需要有一个 `vector> &result` 用来存放结果。终止条件是什么？回溯法中的每个节点并不是真的树状节点，没有 `nullptr` ，因此用空指针来判断是否到了叶子节点并不合理。本题中我们可以通过高度来判断是否达到了叶子节点，如果 `path.size() == k` 则说明到达了叶子节点，则停止迭代，并把当前路径添加到结果变量中。因此我们还需要高度 `k`，`int k` 也应该是一个传入参数。为了防止重复，我们需要在 `[1, n]` 中的一个子区间 `[begin, n]` 中选择一个数，`[1, begin]` 是我们已经选过了的，因此我们需要 `int n` 和 `int begin` 来作为传入参数。在每次迭代中，我们从 `[begin, n]` 中挨个选一个数加到上一轮迭代传递进来的 `path` 中，然后进行下一轮迭代。 ```cpp void combineDFS(int n, int k, int begin, vector &path, vector> &result) { // 当 path 长度等于 k 时停止迭代，并将加入结果 if (path.size() == k) { result.push_back(path); return; } // 遍历可能的搜索起点 for (int i = begin; i <= n; ++i) { // 将 i 加入路径 path.push_back(i); // 下一轮搜索 combineDFS(n, k, i + 1, path, result); // 回溯，撤销处理的节点 path.pop_back(); } } ``` 我们现在来看看能不能优化。 ![optimization](https://paste.sainnhe.dev/NzcF.png) 在上图的这种情况中，每一层其实都可以剪掉一些不可能的分支，我们可以对每一层循环的终止条件进行限制，从而剪枝。优化后的代码如下： ```cpp void combineDFS(int n, int k, int begin, vector &path, vector> &result) { // 当 path 长度等于 k 时停止迭代，并将加入结果 if (path.size() == k) { result.push_back(path); return; } // 遍历可能的搜索起点 // 在这一步中，每一次循环都可以对末尾进行限制来剪枝 for (int i = begin; i <= n - (k - path.size()) + 1; ++i) { // 将 i 加入路径 path.push_back(i); // 下一轮搜索 combineDFS(n, k, i + 1, path, result); // 回溯，撤销处理的节点 path.pop_back(); } } ``` ## [216. 组合总和 III](https://leetcode.cn/problems/combination-sum-iii/) ## [39. 组合总和](https://leetcode.cn/problems/combination-sum/) ## [40. 组合总和 II](https://leetcode.cn/problems/combination-sum-ii/) 最难的一个组合总和，因为 `candidates` 有重复元素，而要求最终结果不能重复。 e.g. 1 ```text Input: candidates = [10,1,2,7,6,1,5], target = 8 Output: [ [1,1,6], [1,2,5], [1,7], [2,6] ] ``` 如果你只是单纯地在 s0039 的基础上在下一次递归中将 `startIndex` 设为 `i + 1` 那么最终结果就会出现两个 `[1, 2, 5]`。如果你直接排除 `candidates[i] == candidates[i - 1]` 的情形，那么最终结果就没有 `[1, 1, 6]`。正确的逻辑应该是如果 `candidates[i] == candidates[i - 1]` 且 `candidates[i - 1]` 使用过，则剪枝。 ![demo](https://paste.sainnhe.dev/DMfz.png) 那么我们现在要来定义一下什么叫“使用过”。这张图里面有两种“使用过”，第一种使用过是“在树枝上使用过”，第二种使用过是“在数层上使用过”。第一种“使用过”显然是合法的，我们允许元素在一条树枝上重复出现。而第二种“使用过”是不合法的，生成的结果重复了。因此我们只需要对第二种“使用过”进行剪枝，而保留第一种“使用过”。怎么做呢？我们创建一个 `vector used` 用来记录元素是否在树枝上出现过，初始化为 `false`。 ```cpp used[i] = true; combinationSum2DFS(candidates, target, i + 1, path, sum + candidates[i], used, result); used[i] = false; ``` 那么 `used[i - 1] == true` 说明 `candidates[i - 1]` 在树枝上出现过，我们需要保留这种情况，不剪枝。 ```cpp // 剪枝，但保留树枝重复的情况 if (i > 0 && candidates[i] == candidates[i - 1] && used[i - 1] == false) continue; ``` 另外需要注意一点，为了进行剪枝，我们需要对 `candidates` 进行排序： ```cpp // 对 candidates 进行升序排序，这是为了进行剪枝 sort(candidates.begin(), candidates.end()); ```