C++ partial_sort()函数详解
假设这样一种情境,有一个存有 100 万个元素的容器,但我们只想从中提取出值最小的 10 个元素,该如何实现呢?
通过前面的学习,读者可能会想到使用 sort() 或者 stable_sort() 排序函数,即通过对容器中存储的 100 万个元素进行排序,就可以成功筛选出最小的 10 个元素。但仅仅为了提取 10 个元素,却要先对 100 万个元素进行排序,可想而知这种实现方式的效率是非常低的。
对于解决类似的问题,C++ STL 标准库提供了更高效的解决方案,即使用 partial_sort() 或者 partial_sort_copy() 函数,本节就对这 2 个排序函数的功能和用法做详细的讲解。
首先需要说明的是,partial_sort() 和 partial_sort_copy() 函数都位于 <algorithm> 头文件中,因此在使用这 2 个函数之前,程序中应引入此头文件:
#include <algorithm>
C++ partial_sort()排序函数
要知道,一个函数的功能往往可以从它的函数名中体现出来,以 partial_sort() 函数为例,partial sort 可直译为“部分排序”。partial_sort() 函数的功能确是如此,即该函数可以从指定区域中提取出部分数据,并对它们进行排序。
但“部分排序”仅仅是对 partial_sort() 函数功能的一个概括,如果想彻底搞清楚它的功能,需要结合该函数的语法格式。partial_sort() 函数有 2 种用法,其语法格式分别为:
//按照默认的升序排序规则,对 [first, last) 范围的数据进行筛选并排序 void partial_sort (RandomAccessIterator first, RandomAccessIterator middle, RandomAccessIterator last); //按照 comp 排序规则,对 [first, last) 范围的数据进行筛选并排序 void partial_sort (RandomAccessIterator first, RandomAccessIterator middle, RandomAccessIterator last, Compare comp);
其中,first、middle 和 last 都是随机访问迭代器,comp 参数用于自定义排序规则。
partial_sort() 函数会以交换元素存储位置的方式实现部分排序的。具体来说,partial_sort() 会将 [first, last) 范围内最小(或最大)的 middle-first 个元素移动到 [first, middle) 区域中,并对这部分元素做升序(或降序)排序。
需要注意的是,partial_sort() 函数受到底层实现方式的限制,它仅适用于普通数组和部分类型的容器。换句话说,只有普通数组和具备以下条件的容器,才能使用 partial_sort() 函数:
- 容器支持的迭代器类型必须为随机访问迭代器。这意味着,partial_sort() 函数只适用于 array、vector、deque 这 3 个容器。
- 当选用默认的升序排序规则时,容器中存储的元素类型必须支持 <小于运算符;同样,如果选用标准库提供的其它排序规则,元素类型也必须支持该规则底层实现所用的比较运算符;
- partial_sort() 函数在实现过程中,需要交换某些元素的存储位置。因此,如果容器中存储的是自定义的类对象,则该类的内部必须提供移动构造函数和移动赋值运算符。
举个例子:
#include <iostream> // std::cout #include <algorithm> // std::partial_sort #include <vector> // std::vector using namespace std; //以普通函数的方式自定义排序规则 bool mycomp1(int i, int j) { return (i > j); } //以函数对象的方式自定义排序规则 class mycomp2 { public: bool operator() (int i, int j) { return (i > j); } }; int main() { std::vector<int> myvector{ 3,2,5,4,1,6,9,7}; //以默认的升序排序作为排序规则,将 myvector 中最小的 4 个元素移动到开头位置并排好序 std::partial_sort(myvector.begin(), myvector.begin() + 4, myvector.end()); cout << "第一次排序:\n"; for (std::vector<int>::iterator it = myvector.begin(); it != myvector.end(); ++it) std::cout << *it << ' '; cout << "\n第二次排序:\n"; // 以指定的 mycomp2 作为排序规则,将 myvector 中最大的 4 个元素移动到开头位置并排好序 std::partial_sort(myvector.begin(), myvector.begin() + 4, myvector.end(), mycomp2()); for (std::vector<int>::iterator it = myvector.begin(); it != myvector.end(); ++it) std::cout << *it << ' '; return 0; }
程序执行结果为:
第一次排序:
1 2 3 4 5 6 9 7
第二次排序:
9 7 6 5 1 2 3 4
值得一提的是,partial_sort() 函数实现排序的平均时间复杂度为N*log(M)
,其中 N 指的是 [first, last) 范围的长度,M 指的是 [first, middle) 范围的长度。
C++ partial_sort_copy()排序函数
partial_sort_copy() 函数的功能和 partial_sort() 类似,唯一的区别在于,前者不会对原有数据做任何变动,而是先将选定的部分元素拷贝到另外指定的数组或容器中,然后再对这部分元素进行排序。
partial_sort_copy() 函数也有 2 种语法格式,分别为:
//默认以升序规则进行部分排序 RandomAccessIterator partial_sort_copy ( InputIterator first, InputIterator last, RandomAccessIterator result_first, RandomAccessIterator result_last); //以 comp 规则进行部分排序 RandomAccessIterator partial_sort_copy ( InputIterator first, InputIterator last, RandomAccessIterator result_first, RandomAccessIterator result_last, Compare comp);
其中,first 和 last 为输入迭代器;result_first 和 result_last 为随机访问迭代器;comp 用于自定义排序规则。
partial_sort_copy() 函数会将 [first, last) 范围内最小(或最大)的 result_last-result_first 个元素复制到 [result_first, result_last) 区域中,并对该区域的元素做升序(或降序)排序。
值得一提的是,[first, last] 中的这 2 个迭代器类型仅限定为输入迭代器,这意味着相比 partial_sort() 函数,partial_sort_copy() 函数放宽了对存储原有数据的容器类型的限制。换句话说,partial_sort_copy() 函数还支持对 list 容器或者 forward_list 容器中存储的元素进行“部分排序”,而 partial_sort() 函数不行。
但是,介于 result_first 和 result_last 仍为随机访问迭代器,因此 [result_first, result_last) 指定的区域仍仅限于普通数组和部分类型的容器,这和 partial_sort() 函数对容器的要求是一样的。
举个例子:
#include <iostream> // std::cout #include <algorithm> // std::partial_sort_copy #include <list> // std::list using namespace std; bool mycomp1(int i, int j) { return (i > j); } class mycomp2 { public: bool operator() (int i, int j) { return (i > j); } }; int main() { int myints[5] = { 0 }; std::list<int> mylist{ 3,2,5,4,1,6,9,7 }; //按照默认的排序规则进行部分排序 std::partial_sort_copy(mylist.begin(), mylist.end(), myints, myints + 5); cout << "第一次排序:\n"; for (int i = 0; i < 5; i++) { cout << myints[i] << " "; } //以自定义的 mycomp2 作为排序规则,进行部分排序 std::partial_sort_copy(mylist.begin(), mylist.end(), myints, myints + 5, mycomp2()); cout << "\n第二次排序:\n"; for (int i = 0; i < 5; i++) { cout << myints[i] << " "; } return 0; }
程序执行结果为:
第一次排序:
1 2 3 4 5
第二次排序:
9 7 6 5 4
可以看到,程序中调用了 2 次 partial_sort_copy() 函数,其作用分别是:
- 第 20 行:采用默认的升序排序规则,在 mylist 容器中筛选出最小的 5 个元素,然后将它们复制到 myints[5] 数组中,并对这部分元素进行升序排序;
- 第 27 行:采用自定义的 mycomp2 降序排序规则,从 mylist 容器筛选出最大的 5 个元素,同样将它们复制到 myints[5] 数组中,并对这部分元素进行降序排序;
值得一提的是,partial_sort_copy() 函数实现排序的平均时间复杂度为N*log(min(N,M))
,其中 N 指的是 [first, last) 范围的长度,M 指的是 [result_first, result_last) 范围的长度。