一個printf(結構體指針)引發的血案

2021-03-25 09:02

編譯、執行，打印結果如下：

示例3：參數類型是 char＊，但是參數個數不固定＃include ＜unistd．h＞＃include ＜stdio．h＞＃include ＜stdlib．h＞＃include ＜stdarg．h＞
void my＿printf＿string（char ＊first，．．．）｛ char ＊str ＝ first； va＿list arg； va＿start（arg， first）； do ｛ printf（＂％s ＂， str）； str ＝ va＿arg（arg， char＊）；｝ while （str ！＝ NULL ）； va＿end（arg）； printf（＂＂）；｝
int main（）｛ char ＊a ＝＂aaa＂，＊b ＝＂bbb＂，＊c ＝＂ccc＂； my＿printf＿string（a， b， c， NULL）；｝

編譯、執行，打印結果如下：

注意：以上這3個示例中，雖然傳入的參數個數是不固定的，但是參數的類型都必須是一樣的！

另外，處理函數中必須能夠知道傳入的參數有多少個，處理 int 和 float 的函數是通過第一個參數來判斷的，處理 char＊的函數是通過最后一個可變參數NULL來判斷的。

2．可變參數的原理2．1 可變參數的幾個宏定義typedef char ＊ va＿list；
＃define va＿start ＿crt＿va＿start＃define va＿arg ＿crt＿va＿arg ＃define va＿end ＿crt＿va＿end
＃define ＿crt＿va＿start（ap，v）（ ap ＝（va＿list）＿ADDRESSOF（v）＋＿INTSIZEOF（v））＃define ＿crt＿va＿arg（ap，t）（＊（t ＊）（（ap ＋＝＿INTSIZEOF（t））－＿INTSIZEOF（t）））＃define ＿crt＿va＿end（ap）（ ap ＝（va＿list）0 ）

注意：va＿list 就是一個 char＊型指針。

2．2 可變參數的處理過程

我們以剛才的示例 my＿printf＿int 函數為例，重新貼一下：

void my＿printf＿int（int num，．．．）／／ step1｛ int i， val； va＿list arg； va＿start（arg， num）；／／ step2 for（i ＝ 0； i ＜ num； i＋＋）｛ val ＝ va＿arg（arg， int）；／／ step3 printf（＂％d ＂， val）；｝ va＿end（arg）；／／ step4 printf（＂＂）；｝
int main（）｛ int a ＝ 1， b ＝ 2， c ＝ 3； my＿printf＿int（3， a， b， c）；｝

Step1：函數調用時

C語言中函數調用時，參數是從右到左、逐個壓入到棧中的，因此在進入 my＿printf＿int 的函數體中時，棧中的布局如下：

Step2：執行 va＿start

va＿start（arg， num）；

把上面這語句，帶入下面這宏定義：

＃define ＿crt＿va＿start（ap，v）（ ap ＝（va＿list）＿ADDRESSOF（v）＋＿INTSIZEOF（v））

宏擴展之后得到：

arg ＝（char ＊）num ＋ sizeof（num）；

結合下面的圖來分析一下：首先通過＿ADDRESSOF 得到 num 的地址 0x01020300，然后強轉成 char＊類型，再然后加上 num 占據的字節數（4個字節），得到地址 0x01020304，最后把這個地址賦值給 arg，因此 arg 這個指針就指向了棧中數字 1 的那個地址，也就是第一個參數，如下圖所示：

Step3：執行 va＿arg

val ＝ va＿arg（arg， int）；

把上面這語句，帶入下面這宏定義：

＃define ＿crt＿va＿arg（ap，t）（＊（t ＊）（（ap ＋＝＿INTSIZEOF（t））－＿INTSIZEOF（t）））

宏擴展之后得到：

val ＝（＊（int ＊）（（arg ＋＝＿INTSIZEOF（int））－＿INTSIZEOF（int）））

結合下面的圖來分析一下：先把 arg 自增 int 型數據的大小（4個字節），使得 arg ＝ 0x01020308；然后再把這個地址（0x01020308）減去4個字節，得到的地址（0x01020304）里的這個值，強轉成 int 型，賦值給 val，如下圖所示：

簡單理解，其實也就是：得到當前 arg 指向的 int 數據，然后把 arg 指向位于高地址處的下一個參數位置。

va＿arg 可以反復調用，直到獲取棧中所有的函數傳入的參數。

Step4：執行 va＿end

va＿end（arg）；

把上面這語句，帶入下面這宏定義：

＃define ＿crt＿va＿end（ap）（ ap ＝（va＿list）0 ）

宏擴展之后得到：

arg ＝（char ＊）0；

這就好理解了，直接把指針 arg 設置為空。因為棧中的所有動態參數被提取后，arg 的值為 0x01020310（最后一個參數的上一個地址），如果不設置為 NULL 的話，下面使用的話就得到未知的結果，為了防止誤操作，需要設置為NULL。

3． printf利用可變參數打印信息

理解了 C 語言中可變參數的處理機制，再來思考 printf 語句的實現機制就很好理解了。

3．1 GNU 中的 printf 代碼＿＿printf （const char ＊format，．．．）｛ va＿list arg； int done；
va＿start （arg， format）； done ＝ vfprintf （stdout， format， arg）； va＿end （arg）；
return done；｝

可見，系統庫中的 printf 也是這樣來處理動態參數的，vfprintf 函數最終會調用系統函數 sys＿write，把數據輸出到 stdout 設備上（顯示器）。vfprintf 函數代碼看起來還是有點復雜，不過稍微分析一下就可以得到其中的大概實現思路：

逐個比對格式化字符串中的每一個字符；如果是普通字符就直接輸出；如果是格式化字符，就根據指定的數據類型，從可變參數中讀取數據，輸出顯示；

以上只是很粗略的思路，實現細節肯定復雜的多，需要考慮各種細節問題。下面是 2 個簡單的示例：

void my＿printf＿format＿v1（char ＊fmt，．．．）｛ va＿list arg； int d； char c，＊s；
va＿start（arg， fmt）； while （＊fmt）｛ switch （＊fmt）｛ case ＇s＇： s ＝ va＿arg（arg， char ＊）； printf（＂％s＂， s）； break；
case ＇d＇： d ＝ va＿arg（arg， int）； printf（＂％d＂， d）； break；
case ＇c＇： c ＝（char） va＿arg（arg， int）； printf（＂％c＂， c）； break； default： if （＇％＇！＝＊fmt ｜｜（＇s＇！＝＊（fmt ＋ 1）＆＆＇d＇！＝＊（fmt ＋ 1）＆＆＇c＇！＝＊（fmt ＋ 1））） printf（＂％c＂，＊fmt）； break；｝ fmt＋＋；｝ va＿end（arg）；｝
int main（）｛ my＿printf＿format＿v1（＂age ＝％d， name ＝％s， num ＝％d ＂， 20，＂zhangsan＂， 98）；｝

編譯、執行，輸出結果：

完美！但是再測試下面代碼（把格式化字符串最后面的 num 改成 score）：

my＿printf＿format＿v1（＂age ＝％d， name ＝％s， score ＝％d ＂， 20，＂zhangsan＂， 98）；

編譯、執行，輸出結果：

因為普通字符串 score 中的字符 s 被第一個 case 捕獲到了，所以發生錯誤。稍微改進一下：

void my＿printf＿format＿v2（char ＊fmt，．．．）｛ va＿list arg； int d； char c， lastC ＝＇＇，＊s；
va＿start（arg， fmt）； while （＊fmt）｛ switch （＊fmt）｛ case ＇s＇： if （＇％＇＝＝ lastC）｛ s ＝ va＿arg（arg， char ＊）； printf（＂％s＂， s）；｝ else ｛ printf（＂％c＂，＊fmt）；｝ break；
case ＇d＇： if （＇％＇＝＝ lastC）｛ d ＝ va＿arg（arg， int）； printf（＂％d＂， d）；｝ else ｛ printf（＂％c＂，＊fmt）；｝ break；
case ＇c＇： if （＇％＇＝＝ lastC）｛ c ＝（char） va＿arg（arg， int）； printf（＂％c＂， c）；｝ else ｛ printf（＂％c＂，＊fmt）；｝ break； default： if （＇％＇！＝＊fmt ｜｜（＇s＇！＝＊（fmt ＋ 1）＆＆＇d＇！＝＊（fmt ＋ 1）＆＆＇c＇！＝＊（fmt ＋ 1））） printf（＂％c＂，＊fmt）； break；｝ lastC ＝＊fmt； fmt＋＋；｝ va＿end（arg）；｝
int main（）｛ my＿printf＿format＿v2（＂age ＝％d， name ＝％s， score ＝％d ＂， 20，＂zhangsan＂， 98）；｝

編譯、執行，打印結果：