一個printf(結構體指針)引發的血案
編譯、執行,打印結果如下:

示例3:參數類型是 char*,但是參數個數不固定#include <unistd.h>#include <stdio.h>#include <stdlib.h>#include <stdarg.h>
void my_printf_string(char *first, ...){ char *str = first; va_list arg; va_start(arg, first); do { printf("%s ", str); str = va_arg(arg, char*); } while (str != NULL ); va_end(arg); printf("");}
int main(){ char *a = "aaa", *b = "bbb", *c = "ccc"; my_printf_string(a, b, c, NULL);}
編譯、執行,打印結果如下:

注意:以上這3個示例中,雖然傳入的參數個數是不固定的,但是參數的類型都必須是一樣的!
另外,處理函數中必須能夠知道傳入的參數有多少個,處理 int 和 float 的函數是通過第一個參數來判斷的,處理 char* 的函數是通過最后一個可變參數NULL來判斷的。
2. 可變參數的原理2.1 可變參數的幾個宏定義typedef char * va_list;
#define va_start _crt_va_start#define va_arg _crt_va_arg #define va_end _crt_va_end
#define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) ) #define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) ) #define _crt_va_end(ap) ( ap = (va_list)0 )
注意:va_list 就是一個 char* 型指針。
2.2 可變參數的處理過程
我們以剛才的示例 my_printf_int 函數為例,重新貼一下:
void my_printf_int(int num, ...) // step1{ int i, val; va_list arg; va_start(arg, num); // step2 for(i = 0; i < num; i++) { val = va_arg(arg, int); // step3 printf("%d ", val); } va_end(arg); // step4 printf("");}
int main(){ int a = 1, b = 2, c = 3; my_printf_int(3, a, b, c);}
Step1: 函數調用時
C語言中函數調用時,參數是從右到左、逐個壓入到棧中的,因此在進入 my_printf_int 的函數體中時,棧中的布局如下:

Step2: 執行 va_start
va_start(arg, num);
把上面這語句,帶入下面這宏定義:
#define _crt_va_start(ap,v) ( ap = (va_list)_ADDRESSOF(v) + _INTSIZEOF(v) )
宏擴展之后得到:
arg = (char *)num + sizeof(num);
結合下面的圖來分析一下:首先通過 _ADDRESSOF 得到 num 的地址 0x01020300,然后強轉成 char* 類型,再然后加上 num 占據的字節數(4個字節),得到地址 0x01020304,最后把這個地址賦值給 arg,因此 arg 這個指針就指向了棧中數字 1 的那個地址,也就是第一個參數,如下圖所示:

Step3: 執行 va_arg
val = va_arg(arg, int);
把上面這語句,帶入下面這宏定義:
#define _crt_va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
宏擴展之后得到:
val = ( *(int *)((arg += _INTSIZEOF(int)) - _INTSIZEOF(int)) )
結合下面的圖來分析一下:先把 arg 自增 int 型數據的大小(4個字節),使得 arg = 0x01020308;然后再把這個地址(0x01020308)減去4個字節,得到的地址(0x01020304)里的這個值,強轉成 int 型,賦值給 val,如下圖所示:

簡單理解,其實也就是:得到當前 arg 指向的 int 數據,然后把 arg 指向位于高地址處的下一個參數位置。
va_arg 可以反復調用,直到獲取棧中所有的函數傳入的參數。
Step4: 執行 va_end
va_end(arg);
把上面這語句,帶入下面這宏定義:
#define _crt_va_end(ap) ( ap = (va_list)0 )
宏擴展之后得到:
arg = (char *)0;
這就好理解了,直接把指針 arg 設置為空。因為棧中的所有動態參數被提取后,arg 的值為 0x01020310(最后一個參數的上一個地址),如果不設置為 NULL 的話,下面使用的話就得到未知的結果,為了防止誤操作,需要設置為NULL。
3. printf利用可變參數打印信息
理解了 C 語言中可變參數的處理機制,再來思考 printf 語句的實現機制就很好理解了。
3.1 GNU 中的 printf 代碼__printf (const char *format, ...){ va_list arg; int done;
va_start (arg, format); done = vfprintf (stdout, format, arg); va_end (arg);
return done;}
可見,系統庫中的 printf 也是這樣來處理動態參數的,vfprintf 函數最終會調用系統函數 sys_write,把數據輸出到 stdout 設備上(顯示器)。vfprintf 函數代碼看起來還是有點復雜,不過稍微分析一下就可以得到其中的大概實現思路:
逐個比對格式化字符串中的每一個字符;如果是普通字符就直接輸出;如果是格式化字符,就根據指定的數據類型,從可變參數中讀取數據,輸出顯示;
以上只是很粗略的思路,實現細節肯定復雜的多,需要考慮各種細節問題。下面是 2 個簡單的示例:
void my_printf_format_v1(char *fmt, ...){ va_list arg; int d; char c, *s;
va_start(arg, fmt); while (*fmt) { switch (*fmt) { case 's': s = va_arg(arg, char *); printf("%s", s); break;
case 'd': d = va_arg(arg, int); printf("%d", d); break;
case 'c': c = (char) va_arg(arg, int); printf(" %c", c); break; default: if ('%' != *fmt || ('s' != *(fmt + 1) && 'd' != *(fmt + 1) && 'c' != *(fmt + 1))) printf("%c", *fmt); break; } fmt++; } va_end(arg);}
int main(){ my_printf_format_v1("age = %d, name = %s, num = %d ", 20, "zhangsan", 98);}
編譯、執行,輸出結果:

完美!但是再測試下面代碼(把格式化字符串最后面的 num 改成 score):
my_printf_format_v1("age = %d, name = %s, score = %d ", 20, "zhangsan", 98);
編譯、執行,輸出結果:

因為普通字符串 score 中的字符 s 被第一個 case 捕獲到了,所以發生錯誤。稍微改進一下:
void my_printf_format_v2(char *fmt, ...){ va_list arg; int d; char c, lastC = '', *s;
va_start(arg, fmt); while (*fmt) { switch (*fmt) { case 's': if ('%' == lastC) { s = va_arg(arg, char *); printf("%s", s); } else { printf("%c", *fmt); } break;
case 'd': if ('%' == lastC) { d = va_arg(arg, int); printf("%d", d); } else { printf("%c", *fmt); } break;
case 'c': if ('%' == lastC) { c = (char) va_arg(arg, int); printf(" %c", c); } else { printf("%c", *fmt); } break; default: if ('%' != *fmt || ('s' != *(fmt + 1) && 'd' != *(fmt + 1) && 'c' != *(fmt + 1))) printf("%c", *fmt); break; } lastC = *fmt; fmt++; } va_end(arg);}
int main(){ my_printf_format_v2("age = %d, name = %s, score = %d ", 20, "zhangsan", 98);}
編譯、執行,打印結果:

五、總結
我們來復盤一下上面的分析過程,開頭的第一個代碼本意是測試關于指針的,結果到最后一直分析到 C 語言中的可變參數問題。可以看出,分析問題-定位問題-解決問題是一連串的思考過程,把這個過程走一遍之后,理解才會更深刻。
我還有另外一個感受:如果我沒有寫公眾號,就不會寫這篇文章;如果不寫這篇文章,就不會研究的這么較真。也許在中間的某個步驟,我就會偷懶對自己說:理解到這個層次就差不多了,不用繼續深究了。所以說以文章的形式來把自己的思考過程進行輸出,是技術提升是非常有好處的,也強烈建議各位小伙伴嘗試一下這么做。
而且,如果這些思考過程能得到你們的認可,那么我就會更有動力來總結、輸出文章。因此,如果這篇總結對你能有一絲絲的幫助,請轉發、分享給你的技術朋友,在此表示衷心的感謝!
【原創聲明】
作者:道哥
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













