本篇內容主要講解“多線程并發的特征有哪些”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“多線程并發的特征有哪些”吧!
多線程和并發
在使用C++開發的服務端程序中多線程還是主流,一般來說會有個線程池來處理接收的請求,這樣可以有效提供服務器的并發能力和CPU的利用率。
但是,多線程也是一把雙刃劍。
單線程模式下,一切都是那么單調而穩定,所有的資源都是自己的,我的資源我做主。
多線程模式下,一個進程下裝載了多個線程,每個線程除了部分資源是獨享外,多個線程對大部分系統資源是共享的。
多個線程共享的進程資源:
內存
文件描述符
地址空間
全局數據
...
每個線程獨享的資源:
線程寄存器
線程棧
線程ID、錯誤返回碼、信號屏蔽碼
...
敲黑板劃重點:
1.進程是系統進行資源分配和調度的基本單位,線程是CPU調度和分派的基本單位;
2.進程是線程的載體,進程有獨立地址空間,所有線程共享所在進程的地址空間;
3.進程是系統資源的大股東,而線程基本上不擁有系統資源,只占用少量在運行中必不可少的資源,比如程序計數器、一組寄存器和調用棧;
同一個進程中的多個線程有點像合租,大家共用大部分資源,自己獨占一小部分資源,相互影響,然而但單進程單線程就是整租,自己獨占所有資源,誰也不影響。
掌握多線程中資源共享和相互影響的特點之后,再來看看線程安全和可重入就容易很多。
什么是線程安全
計算機中所謂的安全大多是指結果的正確且可預測性。
前面我們知道,多線程運行起來雖然可以提高并發能力,但是多個線程會共享很多資源,比如寫全局數據,這種情況下就需要額外干預,否則將引發錯亂的結果。
線程安全是在擁有共享數據的多條線程并行執行的進程中,可以正常且正確的執行,不會出現數據污染等意外情況,反之則稱為線程不安全。
通俗一點講,線程安全就怎么跑都不亂,線程不安全就是一跑就可能五花八門。
所以可能產生線程不安全根本原因在于:共享數據且共享數據可變。
這些共享數據包括全局變量、局部靜態變量等,每個線程都可能對這個數據進行操作,并且操作結果會影響其他線程。
我們還經常提到另外一個術語:線程安全函數/線程安全類。
線程安全函數的一些特征:
無任何共享的數據,都是局部數據;
存在寫共享數據,但是進行了加鎖處理,可以實現多線程的同步調用;
存在讀但無寫共享數據,無需加鎖;
從圖中可以看到:
同一進程內有四個工作線程;
公共函數A 只執行打印操作,無論何時何線程調用,結果都是確定且正確的,因此是線程安全函數;
公共函數B 使用了全局變量Count,并對其進行遞增1操作,但是沒有進行加鎖同步處理,因此結果是不確定的,為線程不安全函數;
公共函數C 使用了全局變量Factor,并對其進行遞增2操作,使用了互斥鎖進行同步確保結果的正確,是線程安全函數;
在編寫多線程程序時,如果涉及多個線程操作一個公共函數,如果該函數本身不是線程安全的。
例如當一個函數F是線程安全函數,但是F調用線程不安全函數G時,同樣需要對G進行加鎖處理,否則函數F也將不安全。
在《深入理解計算機系統》一書中深入指出了線程不安全函數的分類:
不保護共享產量的函數
保持跨越多個調用狀態的函數
返回指向靜態變量的指針的函數
調用線程不安全函數的函數
前面介紹的幾個例子大部分都是全局變量的不加鎖控制相關的,還有兩種就是:
函數本次調用依賴于上次調用結果,也就是所謂的跨狀態,典型的Linux中的rand()函數;
函數將結果放在一個全局的指針中,典型的gethostbyname、localtime、strtok等;
// 函數原型 struct tm * localtime(const time_t *clock); /* localtime example */ #include <stdio.h> #include <time.h> int main () { time_t rawtime; struct tm * timeinfo; time (&rawtime); timeinfo = localtime (&rawtime); return 0; }
在localtime中將結果存放在timeinfo中,這個全局變量可以被任意的線程操作,因此將引發線程不安全。
對于Linux中線程不安全的函數可以查閱:
https://man7.org/linux/man-pages/man7/pthreads.7.html
可重入函數
在理解了線程安全的相關定義和形成原因之后,我們來看下什么是可重入。
先來看看可重入的相關定義:
一個程序可以在任意時刻被中斷,然后系統去執行另外一段代碼,結束后又調用繼續原來的子程序不會出錯,則稱其為可重入(reentrant或re-entrant)。
從根本上來說:
可重入函數只使用自己棧上的變量,不依賴任何外部數據,可以允許有該函數的多個副本在運行,因為每個調用者產生的函數棧都是相互獨立的;
不可重入函數使用了一些系統資源,如果被中斷的話,可能會出現問題;
可重入函數又分為兩大類:
顯式可重入:所有函數的參數都是值傳遞,并且只使用本地棧變量,那么函數就是顯示可重入的,無論如何調用,都是可重入的,是絕對無條件的。
隱式可重入:可重入函數中的一些參數是引用傳遞,只有在調用線程的時候傳遞指向非共享數據的指針時,它才是可重入的,是相對有條件的。
可重入函數需要滿足以下幾個條件:
函數內部不使用靜態或者全局數據
函數不返回靜態或全局數據,數據的產生都由調用者提供
不調用不可重入函數
從本質上來說,可重入函數實現了算法和數據的分離,函數內部的計算不依賴于外部,不影響也不受外部影響,是一種高效且安全的函數。
可重入函數都是線程安全函數,線程安全不一定是可重入函數。
不可重入函數可以遵守可重入規則去改造,從而變為可重入函數。
到此,相信大家對“多線程并發的特征有哪些”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。