開發與維運

【趣話編程】進入編譯器後,一個函數經歷了什麼?

1.jpg

原文鏈接

我是一個函數

我是一個函數,名叫str_upper,我可以把輸入的字符串從小寫變成大寫。不信你看,我長這樣:

char* str_upper(char* str, int len) {
  
  char upper[256];
  
  if (len >= 256 || len <= 0) 
    return nullptr;
  for (int i = 0; i < len; i++) {
    if (str[i] >= 'a' && str[i] <= 'z') {
      upper[i] = str[i] - 32;
    } else {
      upper[i] = str[i];
    }
  }
  
  return upper;
}

上面是我的源代碼形式,聽我的好朋友str_lower說,一會兒我們就要一起被送到一個叫編譯器的地方加工處理了,我心裡害怕極了。

編譯器之旅

沒多久,我們就來到了這裡,一座很龐大到高樓,裡面有好多精密的機器在不停的運轉著。
一進入大廳,好多函數代碼在這裡排隊等待。
我抬頭向上望去,不知道有多少層樓,每一層都有一個指示牌,從下往上分別寫著:

  • 預處理
  • 詞法分析
  • 語法分析
  • 語義分析
  • ···

再往上太遠就看不太清楚了。
所有的函數代碼按照文件為單位排好隊,靜靜地等待著。
不過沒有等太久,就輪到了我們這一隊。
來了一個工作人員把我們帶到了一個房間,讓我們都好好躺著,一臺機器快速的從頭到尾掃描了一遍,將我們所在文件中出現的#include#define全部給替換掉了。
接著,通過房間裡的電梯,將我們送上了二樓。
接下來的一段時間,我們在好幾層樓都做了“體檢”,每個函數都被那些像CT一樣的機器照了個遍。
不一會兒,來到了編譯層,這一層有一個特別奇怪的機器,我看到一個個函數被送了進去,出來的時候都變了樣子。不僅如此,接待處的工作人員看起來很凶,我這下更加緊張了。

函數調用約定

工作人員拿到了我的資料,瞅了幾眼,問到:“請問你的調用約定是什麼?”
我有些懵,不太懂他的意思,小聲問到:“不好意思,你剛問什麼?”
工作人員有點不耐煩了,提高了音量,“我是問你調用約定是什麼?調用約定啊!”
看見我仍然一臉茫然,工作人員直接給我的資料上調用約定那一欄蓋上了一個標記:cdecl
我有點摸不著頭腦,同行的小夥伴str_lower拽了我一下說到:“他是在問你函數的調用約定,就是約定調用函數的方式,涉及怎麼傳遞參數,誰來恢復調用棧等”
他這一說我才反映過來,“這個調用約定都有哪些可選的呢?”
“一般有三種:”

  • cdcel,參數從右往左入棧,主調函數負責恢復棧平衡
  • stdcall,參數從右往左入棧,被調函數負責恢復棧平衡
  • fastcall,參數通過寄存器傳遞,寄存器不夠再用棧傳遞

“他剛才看你沒有顯式聲明,就默認給你cdecl的方式了”,小夥伴繼續說到。
我點了點頭,原來調用個函數還有這麼多講究吶!

Stack Canary

“別閒聊了,快進去吧!”,工作人員催我了。
我準備走向那臺可怕的機器。
“唉,等一下”,正緊張著,工作人員又叫住了我。
我回頭看去,工作人員正招手讓我過去。
“你好,是我的代碼有什麼問題嗎?”,我緊張的問到,生怕有錯誤被打回去,連累我們整個文件都要被遣返。
“不是,是我注意到你的函數裡有一個局部數組,需要給你加一下棧溢出保護”,工作人員說到。
我看了下我的代碼,確實有一個局部字符數組:

char upper[256];

“棧溢出保護是什麼啊?”,我小聲問到。
工作人員沒有搭理我,忙著給我的資料上加東西。
旁邊的小夥伴又把我拽了過去,說到:“咱們函數裡面定義的局部變量、參數是存放在線程棧裡面的。線程要不斷遊走在不同的函數中,調用函數後為了能回到原來的地方,調用之前把返回地址也放在了線程棧裡。就像這樣,你看會不會有什麼問題:”
image.png
我仔細看了下,“哦,要是越界訪問我的upper數組,那就可以修改返回地址,那可就危險了!”
“很聰明嘛!”
“那這個怎麼加保護呢?”,我問到。
“你看,函數進來之前,先在局部變量和返回地址之間設置一個數值,函數返回之前再去檢查一下,如果棧裡的數據被破壞了,檢查這個數值就能發現,提前拋出異常!”,小夥伴耐心的解釋到。
“這樣啊,那豈不是要把我打回去加上你說的這些設置和檢查代碼?”,我繼續提問。
這時,工作人員聽到了我們的閒聊,“不用,我們編譯器自動添加好了,快去吧,已經處理好了”
我瞥了一眼,看到我的資料上增加了一個叫Stack Canary的標記。
我小心翼翼的走進了那架奇怪的機器,立刻就失去了知覺,等我醒來時,我的身體已經發生了變化,變成了一堆奇怪的代碼,現在我長這樣了:
image.png

鏈接

沒過一會兒,我們這一隊的所有函數代碼都編譯完成,大家從原來的.c文件都搬到了新家:一個.o文件,我也再次見到了小夥伴str_lower。
“咱們是不是已經完成了編譯,可以離開這裡了吧?”
“還不行,編譯雖然是完成了,還差鏈接這一步呢!”
又過了一小會兒,和我們一起過來的其他文件的函數代碼也編譯完成了,咱們一堆.o文件一起被送到了編譯器大廈的頂樓:鏈接層。
這一層也有一個巨大的機器,機器背後連接了一個管道,不知通向了哪裡。
我們這一批的所有.o文件挨個走進了這個巨大的機器,像是一條時空隧道一般,穿行於其間,我感覺到了巨大的壓力把我們擠壓在了一起,很快我們再一次失去了意識。
醒來之後,我發現所有的函數們都被合在了一個文件中,這是一個可執行文件,而我的身體也再次發生了變化,變成了一段段的二進制指令,現在我長這樣了:
image.png

終於離開了編譯器,真是一趟難忘的旅程,不過我再也不想來了······

彩蛋

沒想到命運跟我開了一個玩笑,我的第一次運行就出了錯!
我又要被打回去重新改造,再走一遍這魔鬼般的旅程。
你能幫我看看,我的代碼哪裡有錯嗎?

作者 | 軒轅之風O
來源 | 編程技術宇宙

Leave a Reply

Your email address will not be published. Required fields are marked *