本文的主要內(nèi)容以下:
本地的進(jìn)程間通訊(IPC)有很多種方式,但可以總結(jié)為下面4類:
但這些都不是本文的主題!我們要討論的是網(wǎng)絡(luò)中進(jìn)程之間如何通訊?重要解決的問題是如何唯1標(biāo)識(shí)1個(gè)進(jìn)程,否則通訊無從談起!在本地可以通過進(jìn)程PID來唯1標(biāo)識(shí)1個(gè)進(jìn)程,但是在網(wǎng)絡(luò)中這是行不通的。其實(shí)TCP/IP協(xié)議族已幫我們解決了這個(gè)問題,網(wǎng)絡(luò)層的“ip地址”可以唯1標(biāo)識(shí)網(wǎng)絡(luò)中的主機(jī),而傳輸層的“協(xié)議+端口”可以唯1標(biāo)識(shí)主機(jī)中的利用程序(進(jìn)程)。這樣利用3元組(ip地址,協(xié)議,端口)就能夠標(biāo)識(shí)網(wǎng)絡(luò)的進(jìn)程了,網(wǎng)絡(luò)中的進(jìn)程通訊就能夠利用這個(gè)標(biāo)志與其它進(jìn)程進(jìn)行交互。
使用TCP/IP協(xié)議的利用程序通常采取利用編程接口:UNIX BSD的套接字(socket)和UNIX System V的TLI(已被淘汰),來實(shí)現(xiàn)網(wǎng)絡(luò)進(jìn)程之間的通訊。就目前而言,幾近所有的利用程序都是采取socket,而現(xiàn)在又是網(wǎng)絡(luò)時(shí)期,網(wǎng)絡(luò)中進(jìn)程通訊是無處 不在,這就是我為何說“1切皆socket”。
上面我們已知道網(wǎng)絡(luò)中的進(jìn)程是通過socket來通訊的,那甚么是socket呢?socket起源于 Unix,而Unix/Linux基本哲學(xué)之1就是“1切皆文件”,都可以用“打開open –> 讀寫write/read –> 關(guān)閉close”模式來操作。我的理解就是Socket就是該模式的1個(gè)實(shí)現(xiàn),socket即是1種特殊的文件,1些socket函數(shù)就是對(duì)其進(jìn)行的操作 (讀/寫IO、打開、關(guān)閉),這些函數(shù)我們?cè)诤竺孢M(jìn)行介紹。
socket1詞的起源
在組網(wǎng)領(lǐng)域的首次使用是在1970年2月12日發(fā)布的文獻(xiàn)IETF RFC33中 發(fā)現(xiàn)的,撰寫者為Stephen Carr、Steve Crocker和Vint Cerf。根據(jù)美國計(jì)算機(jī)歷史博物館的記載,Croker寫道:“命名空間的元素都可稱為套接字接口。1個(gè)套接字接口構(gòu)成1個(gè)連接的1端,而1個(gè)連接可完 全由1對(duì)套接字接口規(guī)定。”計(jì)算機(jī)歷史博物館補(bǔ)充道:“這比BSD的套接字接口定義早了大約12年。”
既然socket是“open—write/read—close”模式的1種實(shí)現(xiàn),那末socket就提供了這些操作對(duì)應(yīng)的函數(shù)接口。下面以TCP為例,介紹幾個(gè)基本的socket接口函數(shù)。
socket函數(shù)對(duì)應(yīng)于普通文件的打開操作。普通文件的打開操作返回1個(gè)文件描寫字,而socket()用于創(chuàng)建1個(gè)socket描寫符(socket descriptor),它唯1標(biāo)識(shí)1個(gè)socket。這個(gè)socket描寫字跟文件描寫字1樣,后續(xù)的操作都有用到它,把它作為參數(shù),通過它來進(jìn)行1些讀寫操作。
正如可以給fopen的傳入不同參數(shù)值,以打開不同的文件。創(chuàng)建socket的時(shí)候,也能夠指定不同的參數(shù)創(chuàng)建不同的socket描寫符,socket函數(shù)的3個(gè)參數(shù)分別為:
注意:其實(shí)不是上面的type和protocol可以隨便組合的,如SOCK_STREAM不可以跟IPPROTO_UDP組合。當(dāng)protocol為0時(shí),會(huì)自動(dòng)選擇type類型對(duì)應(yīng)的默許協(xié)議。
當(dāng)我們調(diào)用socket創(chuàng)建1個(gè)socket時(shí),返回的socket描寫字它存在于協(xié)議族(address family,AF_XXX)空間中,但沒有1個(gè)具體的地址。如果想要給它賦值1個(gè)地址,就必須調(diào)用bind()函數(shù),否則就當(dāng)調(diào)用connect()、listen()時(shí)系統(tǒng)會(huì)自動(dòng)隨機(jī)分配1個(gè)端口。
正如上面所說bind()函數(shù)把1個(gè)地址族中的特定地址賦給socket。例如對(duì)應(yīng)AF_INET、AF_INET6就是把1個(gè)ipv4或ipv6地址和端口號(hào)組合賦給socket。
函數(shù)的3個(gè)參數(shù)分別為:
通常服務(wù)器在啟動(dòng)的時(shí)候都會(huì)綁定1個(gè)盡人皆知的地址(如ip地址+端口號(hào)),用于提供服務(wù),客戶就能夠通過它來接連服務(wù)器;而客戶端就不用指定,有系統(tǒng)自動(dòng)分配1個(gè)端口號(hào)和本身的ip地址組合。這就是為何通常服務(wù)器端在listen之前會(huì)調(diào)用bind(),而客戶端就不會(huì)調(diào)用,而是在connect()時(shí)由系統(tǒng)隨機(jī)生成1個(gè)。
網(wǎng)絡(luò)字節(jié)序與主機(jī)字節(jié)序
主機(jī)字節(jié)序就是我們平常說的大端和小端模式:不同的CPU有不同的字節(jié)序類型,這些字節(jié)序是指整數(shù)在內(nèi)存中保存的順序,這個(gè)叫做主機(jī)序。援用標(biāo)準(zhǔn)的Big-Endian和Little-Endian的定義以下:
a) Little-Endian就是低位字節(jié)排放在內(nèi)存的低地址端,高位字節(jié)排放在內(nèi)存的高地址端。
b) Big-Endian就是高位字節(jié)排放在內(nèi)存的低地址端,低位字節(jié)排放在內(nèi)存的高地址端。
網(wǎng)絡(luò)字節(jié)序:4個(gè)字節(jié)的32 bit值以下面的次序傳輸:首先是0~7bit,其次8~15bit,然后16~23bit,最后是24~31bit。這類傳輸次序稱作大端字節(jié)序。由于TCP/IP首部中所有的2進(jìn)制整數(shù)在網(wǎng)絡(luò)中傳輸時(shí)都要求以這類次序,因此它又稱作網(wǎng)絡(luò)字節(jié)序。字節(jié)序,顧名思義字節(jié)的順序,就是大于1個(gè)字節(jié)類型的數(shù)據(jù)在內(nèi)存中的寄存順序,1個(gè)字節(jié)的數(shù)據(jù)沒有順序的問題了。
所以: 在將1個(gè)地址綁定到socket的時(shí)候,請(qǐng)先將主機(jī)字節(jié)序轉(zhuǎn)換成為網(wǎng)絡(luò)字節(jié)序,而不要假定主機(jī)字節(jié)序跟網(wǎng)絡(luò)字節(jié)序1樣使用的是Big-Endian。由于 這個(gè)問題曾引發(fā)過血案!公司項(xiàng)目代碼中由于存在這個(gè)問題,致使了很多稀里糊涂的問題,所以請(qǐng)謹(jǐn)記對(duì)主機(jī)字節(jié)序不要做任何假定,務(wù)勢(shì)必其轉(zhuǎn)化為網(wǎng)絡(luò)字節(jié)序再 賦給socket。
如果作為1個(gè)服務(wù)器,在調(diào)用socket()、bind()以后就會(huì)調(diào)用listen()來監(jiān)聽這個(gè)socket,如果客戶端這時(shí)候調(diào)用connect()發(fā)出連接要求,服務(wù)器端就會(huì)接收到這個(gè)要求。
listen函數(shù)的第1個(gè)參數(shù)即為要監(jiān)聽的socket描寫字,第2個(gè)參數(shù)為相應(yīng)socket可以排隊(duì)的最大連接個(gè)數(shù)。socket()函數(shù)創(chuàng)建的socket默許是1個(gè)主動(dòng)類型的,listen函數(shù)將socket變成被動(dòng)類型的,等待客戶的連接要求。
connect函數(shù)的第1個(gè)參數(shù)即為客戶真?zhèn)€socket描寫字,第2參數(shù)為服務(wù)器的socket地址,第3個(gè)參數(shù)為socket地址的長(zhǎng)度。客戶端通過調(diào)用connect函數(shù)來建立與TCP服務(wù)器的連接。
TCP服務(wù)器端順次調(diào)用socket()、bind()、listen()以后,就會(huì)監(jiān)聽指定的socket地址了。TCP客戶端順次調(diào)用socket()、connect()以后就想TCP服務(wù)器發(fā)送了1個(gè)連接要求。TCP服務(wù)器監(jiān)聽到這個(gè)要求以后,就會(huì)調(diào)用accept()函數(shù)取接收要求,這樣連接就建立好了。以后就能夠開始網(wǎng)絡(luò)I/O操作了,即類同于普通文件的讀寫I/O操作。
accept函數(shù)的第1個(gè)參數(shù)為服務(wù)器的socket描寫字,第2個(gè)參數(shù)為指向struct sockaddr *的指針,用于返回客戶真?zhèn)€協(xié)議地址,第3個(gè)參數(shù)為協(xié)議地址的長(zhǎng)度。如果accpet成功,那末其返回值是由內(nèi)核自動(dòng)生成的1個(gè)全新的描寫字,代表與返回客戶的TCP連接。
注意:accept的第1個(gè)參數(shù)為服務(wù)器的socket描寫字,是服務(wù)器開始調(diào)用socket()函數(shù)生成的,稱為監(jiān)聽socket描寫字;而accept函數(shù)返回的是已連接的socket描寫字。1個(gè)服務(wù)器通常通常僅僅只創(chuàng)建1個(gè)監(jiān)聽socket描寫字,它在該服務(wù)器的生命周期內(nèi)1直存在。內(nèi)核為每一個(gè)由服務(wù)器進(jìn)程接受的客戶連接創(chuàng)建了1個(gè)已連接socket描寫字,當(dāng)服務(wù)器完成了對(duì)某個(gè)客戶的服務(wù),相應(yīng)的已連接socket描寫字就被關(guān)閉。
萬事具有只欠東風(fēng),至此服務(wù)器與客戶已建立好連接了。可以調(diào)用網(wǎng)絡(luò)I/O進(jìn)行讀寫操作了,即實(shí)現(xiàn)了網(wǎng)咯中不同進(jìn)程之間的通訊!網(wǎng)絡(luò)I/O操作有下面幾組:
我推薦使用recvmsg()/sendmsg()函數(shù),這兩個(gè)函數(shù)是最通用的I/O函數(shù),實(shí)際上可以把上面的其它函數(shù)都替換成這兩個(gè)函數(shù)。它們的聲明以下:
read函數(shù)是負(fù)責(zé)從fd中讀取內(nèi)容.當(dāng)讀成功時(shí),read返回實(shí)際所讀的字節(jié)數(shù),如果返回的值是0表示已讀到文件的結(jié)束了,小于0表示出現(xiàn)了毛病。如果毛病為EINTR說明讀是由中斷引發(fā)的,如果是ECONNREST表示網(wǎng)絡(luò)連接出了問題。
write函數(shù)將buf中的nbytes字節(jié)內(nèi)容寫入文件描寫符fd.成功時(shí)返回寫的字節(jié)數(shù)。失敗時(shí)返回⑴,并設(shè)置errno變量。 在網(wǎng)絡(luò)程序中,當(dāng)我們向套接字文件描寫符寫時(shí)有倆種可能。1)write的返回值大于0,表示寫了部份或是全部的數(shù)據(jù)。2)返回的值小于0,此時(shí)出現(xiàn)了 毛病。我們要根據(jù)毛病類型來處理。如果毛病為EINTR表示在寫的時(shí)候出現(xiàn)了中斷毛病。如果為EPIPE表示網(wǎng)絡(luò)連接出現(xiàn)了問題(對(duì)方已關(guān)閉了連接)。
其它的我就不逐一介紹這幾對(duì)I/O函數(shù)了,具體參見man文檔或baidu、Google,下面的例子中將使用到send/recv。
在服務(wù)器與客戶端建立連接以后,會(huì)進(jìn)行1些讀寫操作,完成了讀寫操作就要關(guān)閉相應(yīng)的socket描寫字,好比操作完打開的文件要調(diào)用fclose關(guān)閉打開的文件。
close1個(gè)TCP socket的缺省行動(dòng)時(shí)把該socket標(biāo)記為以關(guān)閉,然后立即返回到調(diào)用進(jìn)程。該描寫字不能再由調(diào)用進(jìn)程使用,也就是說不能再作為read或write的第1個(gè)參數(shù)。
注意:close操作只是使相應(yīng)socket描寫字的援用計(jì)數(shù)⑴,只有當(dāng)援用計(jì)數(shù)為0的時(shí)候,才會(huì)觸發(fā)TCP客戶端向服務(wù)器發(fā)送終止連接要求。
我們知道tcp建立連接要進(jìn)行“3次握手”,即交換3個(gè)分組。大致流程以下:
只有就完了3次握手,但是這個(gè)3次握手產(chǎn)生在socket的那幾個(gè)函數(shù)中呢?請(qǐng)看下圖:
圖1、socket中發(fā)送的TCP3次握手
從圖中可以看出,當(dāng)客戶端調(diào)用connect時(shí),觸發(fā)了連接要求,向服務(wù)器發(fā)送了SYN J包,這時(shí)候connect進(jìn)入阻塞狀態(tài);服務(wù)器監(jiān)聽到連接要求,即收到SYN J包,調(diào)用accept函 數(shù)接收要求向客戶端發(fā)送SYN K ,ACK J+1,這時(shí)候accept進(jìn)入阻塞狀態(tài);客戶端收到服務(wù)器的SYN K ,ACK J+1以后,這時(shí)候connect返回,并對(duì)SYN K進(jìn)行確認(rèn);服務(wù)器收到ACK K+1時(shí),accept返回,至此3次握手終了,連接建立。
總結(jié):客戶真?zhèn)€connect在3次握手的第2個(gè)次返回,而服務(wù)器真?zhèn)€accept在3次握手的第3次返回。
上面介紹了socket中TCP的3次握手建立進(jìn)程,及其觸及的socket函數(shù)。現(xiàn)在我們介紹socket中的4次握手釋放連接的進(jìn)程,請(qǐng)看下圖:
圖2、socket中發(fā)送的TCP4次握手
圖示進(jìn)程以下:
這樣每一個(gè)方向上都有1個(gè)FIN和ACK。
說了這么多了,動(dòng)手實(shí)踐1下。下面編寫1個(gè)簡(jiǎn)單的服務(wù)器、客戶端(使用TCP)——服務(wù)器端1直監(jiān)聽本機(jī)的6666號(hào)端口,如果收到連接要求,將接收要求并接收客戶端發(fā)來的消息;客戶端與服務(wù)器端建立連接并發(fā)送1條消息。
服務(wù)器端代碼:
客戶端代碼: