2022年

2022年发布的文章
  • C++序列容器存储智能指针详解

    通常用容器保存指针比保存对象更好,而且大多数时候,保存智能指针比原生指针好。下面是一些原因:

    • 在容器中保存指针需要复制指针而不是它所指向的对象。复制指针通常比复制对象快。
    • 在容器中保存指针可以得到多态性。存放元素基类指针的容器也可以保存其派生类型的指针。当要处理有共同基类的任意对象序列时,这种功能是非常有用的。应用这一特性的一个常见示例是展示一个含有直线、曲线和几何形状的对象序列。
    • 对指针容器的内容进行排序的速度要比对对象排序快;因为只需要移动指针,不需要移动对象。
    • 保存智能指针要比保存原生指针安全,因为在对象不再被引用时,自由存储区的对象会被自动删除。这样就不会产生内存泄漏。不指向任何对象的指针默认为 nullptr。

    如你所知,主要有两种类型的智能指针:unique_ptr<T>shared_ptr<T>,其中 unique_ptr<T> 独占它所指向对象的所有权,而 shared_ptr<T> 允许多个指针指向同一个对象。还有weak_ptr<T> 类型,它是一类从 shared_ptr<T> 生成的智能指针,可以避免使用 shared_ptrs<T> 带来的循环引用问题。unique_ptr<T> 类型的指针可以通过移动的方式保存到容器中。例如,下面的代码可以通过编译:

    std::vector<std::unique_ptr<std::string>> words;
    words.push_back(std::make_unique<std::string>("one"));
    words.push_back(std::make_unique<std::string>("two"));

    vector 保存了 unique_ptr<string> 类型的智能指针。make_unique<T>() 函数可以生成对象和智能指针,并且返回后者。因为返回结果是一个临时 unique_ptr<string> 对象,这里调用一个有右值引用参数的 push_back() 函数,因此不需要拷贝对象。另一种添加 unique_ptr 对象的方法是,先创建一个局部变量 unique_ptr ,然后使用 std::move() 将它移到容器中。然而,后面任何关于拷贝容器元素的操作都会失败,因为只能有一个 unique_ptr 对象。如果想能够复制元素,需要使用 shared_ptr 对象;否则就使用 unique_ptr 对象。

    在序列容器中保存指针

    下面首先解释一些在容器中使用原生指针会碰到的问题,然后再使用智能指针(这是推荐的使用方式)。下面是一段代码,用来从标准输入流读取单词,然后将指向自由存储区的字符串对象的指针保存到 vector 容器中:

    std::vector<std::string*> words;
    std::string word;
    std::cout << "Enter words separated by spaces, enter Ctrl+Z on a separate line to end: \n";
    while (true)
    {
        if ((std::cin >> word).eof())
        {
            std::cin. clear();
            break;
        }
    
        words.push_back(new std::string {word});// Create object and store its address
    }

    push_back() 的参数表达式在自由存储区生成了一个字符串对象,因此 push_back() 的参数是一个对象的地址。可以按如下方式输出 words 中的内容:

    for (auto& w : words)
        std: : cout << w <<" ";
    std::cout << std::endl;

    如果想使用迭代器来访问容器中的元素,输出字符串的代码可以这样写:

    for (auto iter = std::begin(words);iter != std::end(words); ++iter)
        std::cout << **iter <<" ";
    std::cout << std::endl;

    iter 是一个迭代器,必须通过解引用来访问它所指向的元素。这里,容器的元素也是指针,因此必须解引用来获取 string 对象。因此表达式为:**iter。注意,在删除元素时,需要先释放它所指向的内存。如果不这样做,在删除指针后,就无法释放它所指向的内存,除非保存了指针的副本。这是容器中的原生指针常见的内存泄漏来源。下面演示它如何在 words 中发生:

    for (auto iter = std::begin(words);iter != std::end(words);)
    {
        if (**iter == "one")
            words.erase (iter); // Memory leak!
        else
            ++iter;
    }

    这里删除了一个指针,但它所指向的内存仍然存在。无论什么时候删除一个是原生指针的元素,都需要首先释放它所指向的内存:

    for (auto iter = std::begin(words); iter != std::end(words);)
    {
        if (**iter == "one")
        {
            delete *iter;//Release the memory...
            words.erase (iter);    //... then delete the pointer
        }
        else
            ++iter;
    }

    在离开 vector 的使用范围之前,记住要删除自由存储区的 string 对象。可以按如下方式来实现:

    for (auto& w : words)
        delete w; // Delete the string pointed to
    words.clear(); // Delete all the elements from the vector

    用索引来访问指针,这样就可以使用 delete 运算符删除 string 对象。当循环结束时,vector 中的所有指针元素都会失效,因此不要让 vector 处于这种状态。调用 dear() 移除所有元素,这样 size() 会返回 0。当然,也可以像下面这样使用迭代器:

    for (auto iter = std::begin(words);iter != std::end(words); ++iter)
        delete *iter;

    如果保存了智能指针,就不用担心要去释放自由存储区的内存。智能指针会做这些事情。下面是一个读入字符串,然后把 shared_ptr<string> 保存到 vector 中的代码片段:

    std::vector<std::shared_ptr<std::string>> words; std::string word;
    std::cout << "Enter words separated by spaces, enter Ctrl+Z on a separate line to end:\n";
    while (true)
    {
        if ((std::cin >> word).eof())
        {
            std::cin. clear ();
            break;
        }
        words.push_back(std::make_shared<string>(word)); // Create smart pointer to string & store it
    }

    这和使用原生指针的版本没有什么不同。vector 模板现在的类型参数是 std::shared_ptr<std::string>,push_back() 的参数会调用 make_shared(),在自由存储区生成 string 对象和一个指向它的智能指针。因为智能指针由参数表达式生成,这里会调用一个右值引用参数版的 push_back() 来将指针移到容器中。

    模板类型参数可能有些冗长,但是可以使用 using 来简化代码。例如:

    using PString = std::shared_ptr<std::string>;

    使用 using 后,可以这样定义:

    std::vector<PString> words;

    可以通过智能指针元素来访问字符串,这和使用原生指针相同。前面那些输出 words 内容的代码片段都可以使用智能指针。当然,不需要删除自由存储区的 string 对象;因为智能指针会做这些事情。执行 words.clear() 会移除全部的元素,因此会调用智能指针的析构函数;这也会导致智能指针释放它们所指向对象的内存。

    为了阻止 vector 太频繁地分配额外内存,可以先创建 vector,然后调用 reserve() 来分配一定数量的初始内存。例如:

    std::vector<std::shared_ptr<std::>>words;
    words.reserve(100); // Space for 100 smart pointers

    这样生成 vector 比指定元素个数来生成要好,因为每一个元素都是通过调用 shared_ptr<string> 构造函数生成的。不这样做也不是什么大问题,但会产生一些不必要的额外开销,即使开销很小。通常,每个智能指针所需要的空间远小于它们所指向对象需要的空间,因此可以大方地使用 reserve() 来分配空间。

    可以在外面使用保存的 shared_ptr<T> 对象的副本。如果不需要这种功能,应该使用 unique_ptr<T> 对象。下面展示如何在 words 中这样使用:

    std::vector<std::unique_ptr<std::string>>words;
    std::string word;
    std::cout << "Enter words separated by spaces, enter Ctrl+Z on a separate line to end:\n";
    while (true)
    {
        if ((std::cin >> word).eof())
        {
            std::cin.clear();
            break;
        }
        words.push_back(std::make_unique<string>(word));
        //Create smart pointer to string & store it
    }

    在上面的代码中,用 unique 代替 shared 是没有差别的。

    我们看一下,如何使用智能指针来实现前面章节中的超市结账模拟程序。 Customer 类的定义和之前的版本相同,但是 Checkout 类的定义中使用了智能指针,因而产生了一些变化,我们也可以在 main() 中使用智能指针。在整个程序中,我们都不需要使用智能指针的副本,因此我们选择使用 unique_ptr<T>。下面是 Checkout.h 头文件中的新内容:

    // Supermarket checkout - using smart pointers to customers in a queue
    #ifndef CHECKOUT_H
    #define CHECKOUT_H
    #include <queue> // For queue container
    #include <memory> // For smart pointers
    #include "Customer.h"
    using PCustomer = std::unique_ptr<Customer>;
    
    class Checkout
    {
    private:
        std::queue<PCustomer> customers;                // The queue waiting to checkout
    
    public:
        void add(PCustomer&& customer) { customers.push(std::move(customer)); }
        size_t qlength() const { return customers.size(); }
    
        // Increment the time by one minute
        void time_increment()
        {
            if (customers.front()->time_decrement().done())  // If the customer is done...
            customers.pop();                               // ...remove from the queue
        };
    
        bool operator<(const Checkout& other) const { return qlength() < other.qlength(); }
        bool operator>(const Checkout& other) const { return qlength() < other.qlength(); }
    };
    #endif

    我们需要直接包含 memory 头文件,这样就可以使用智能指针类型的模板。queue 容器保存 PCustomer 元素,用来记录排队结账的顾客。使用 using 为 std::unique_ptr<Customer> 定义了一个别名 PCustomer,这可以节省大量的输入。PCustomer 对象不能被复制,因而当调用 add() 函数时,它的参数是右值引用,参数会被移到容器中。以 unique 指针作为元素时,也会以同样的方式被移到容器中;当然,参数不能是 const。做了这些修改后,就可以使用 unique_ptr 了,不再需要修改其他的内容。

    // Using smart pointer to simulate supermarket checkouts
    #include <iostream>                              // For standard streams
    #include <iomanip>                               // For stream manipulators
    #include <vector>                                // For vector container
    #include <string>                                // For string class
    #include <numeric>                               // For accumulate()
    #include <algorithm>                             // For min_element & max_element
    #include <random>                                // For random number generation
    #include <memory>                                // For smart pointers
    #include "Checkout.h"
    #include "Customer.h"
    
    using std::string;
    using distribution = std::uniform_int_distribution<>;
    using PCheckout = std::unique_ptr<Checkout>;
    
    // Output histogram of service times
    void histogram(const std::vector<int>& v, int min)
    {
        string bar (60, '*');                          // Row of asterisks for bar
        for (size_t i {}; i < v.size(); ++i)
        {
            std::cout << std::setw(3) << i+min << " "    // Service time is index + min
            << std::setw(4) << v[i] << " "             // Output no. of occurrences
            << bar.substr(0, v[i])                     // ...and that no. of asterisks
            << (v[i] > static_cast<int>(bar.size()) ? "...": "")
            << std::endl;
        }
    }
    
    int main()
    {
        std::random_device random_n;
    
        // Setup minimum & maximum checkout periods - times in minutes
        int service_t_min {2}, service_t_max {15};
        std::uniform_int_distribution<> service_t_d {service_t_min, service_t_max};
    
        // Setup minimum & maximum number of customers at store opening
        int min_customers {15}, max_customers {20};
        distribution n_1st_customers_d {min_customers, max_customers};
    
        // Setup minimum & maximum intervals between customer arrivals
        int min_arr_interval {1}, max_arr_interval {5};
        distribution arrival_interval_d {min_arr_interval, max_arr_interval};
    
        size_t n_checkouts {};
        std::cout << "Enter the number of checkouts in the supermarket: ";
        std::cin >> n_checkouts;
        if(!n_checkouts)
        {
            std::cout << "Number of checkouts must be greater than 0. Setting to 1." << std::endl;
            n_checkouts = 1;
        }
    
        std::vector<PCheckout> checkouts;
        checkouts.reserve(n_checkouts);                // Reserve memory for pointers
    
        // Create the checkouts
        for (size_t i {}; i < n_checkouts; ++i)
            checkouts.push_back(std::make_unique<Checkout>());
        std::vector<int> service_times(service_t_max-service_t_min+1);
    
        // Add customers waiting when store opens
        int count {n_1st_customers_d(random_n)};
        std::cout << "Customers waiting at store opening: " << count << std::endl;
        int added {};
        int service_t {};
    
        // Define comparison lambda for pointers to checkouts
        auto comp = [](const PCheckout& pc1, const PCheckout& pc2){ return *pc1 < *pc2; };
        while (added++ < count)
        {
            service_t = service_t_d(random_n);
            auto iter = std::min_element(std::begin(checkouts), std::end(checkouts), comp);
            (*iter)->add(std::make_unique<Customer>(service_t));
            ++service_times[service_t - service_t_min];
        }
    
        size_t time {};                                // Stores time elapsed
        const size_t total_time {600};                 // Duration of simulation - minutes
        size_t longest_q {};                           // Stores longest checkout queue length
    
        // Period until next customer arrives
        int new_cust_interval {arrival_interval_d(random_n)};
    
        // Run store simulation for period of total_time minutes
        while (time < total_time)                      // Simulation loops over time
        {
            ++time;                                      // Increment by 1 minute
    
            // New customer arrives when arrival interval is zero
            if (--new_cust_interval == 0)
            {
                service_t = service_t_d(random_n);         // Random customer service time
                (*std::min_element(std::begin(checkouts), std::end(checkouts), comp))->add(std::make_unique<Customer>(service_t));
                ++service_times[service_t - service_t_min];  // Record service time
       
                // Update record of the longest queue length
                for (auto& pcheckout : checkouts)
                    longest_q = std::max(longest_q, pcheckout->qlength());
    
                new_cust_interval = arrival_interval_d(random_n);
            }
    
            // Update the time in the checkouts - serving the 1st customer in each queue
            for (auto& pcheckout : checkouts)
                pcheckout->time_increment();
        }
    
        std::cout << "Maximum queue length = " << longest_q << std::endl;
        std::cout << "\nHistogram of service times:\n";
        histogram(service_times, service_t_min);
    
        std::cout << "\nTotal number of customers today: "
                    << std::accumulate(std::begin(service_times), std::end(service_times), 0)
                    << std::endl;
    }

    vector 容器现在保存的是指向 Checkout 对象的 unique 指针。vector 的迭代器指向 Checkout 对象,即 unique_ptr<Checkout> 对象的指针,因而可以通过迭代器来调用 Checkout 的成员函数。首先必须解引用迭代器,然后用间接成员选择运算符来调用函数。可以看到,我们已经修改了 main() 中的相关代码。min_element() 默认使用 < 运算符来从迭代器指向的元素中获取结果。默认会比较智能指针,但是并不能得到正确的结果。我们需要为 min_element() 提供第 3 个参数作为它所使用的比较函数。这个函数是由名为 comp 的 lambda 表达式定义的。因为我们想在后面继续使用这个表达式,所以对它做命名。

    为了访问 Checkout 对象,这个 lambda 表达式解引用了智能指针参数,然后使用 Checkout 类的成员函数 operator<() 来比较它们。所有的 Checkout 和 Customer 对象都是在自由储存区生成的。智能指针会维护它们所使用的内存。这个版本的模拟程序的输出和之前版本的相同。在这个示例中也可以使用 shared_ptr<T>,但是它们会执行得慢一些。就执行时间和内存使用而言, unique_ptr<T> 对象相对于原生指针的开销最小。

更多...

加载中...