我們總希望能在內(nèi)核空間和用戶空間自由交換數(shù)據(jù),傳統(tǒng)的方式是采用內(nèi)核提供的vma機制,通過copy_to/from_user之類的方法來實現(xiàn)。這對于高速數(shù)據(jù)塊傳送是不可取的。
其實kswapd有時交換數(shù)據(jù)至外存時,性能相當差,一般而言,你的PC主存并不見得就用盡了,而且很多應(yīng)用并是你所關(guān)心的,但卻實實在在消耗你的計算資源,此時,你可能會想到采用實地址操作你的應(yīng)用(盡管有MMU的支持),在uClinux中,當沒有MMU時,工作起來是挺爽的。
方便的,效的,無非是實地址下,操作物理內(nèi)存,相當于DMA。盡管Linux 2.6內(nèi)核在VMA方面的性能要優(yōu)于2.4,但swap機制有一定的缺限。在VxWorks中,對內(nèi)存的管理是很細致且精確的。如果你在Linux下申請大塊內(nèi)存操作時,當觸發(fā)kswap快速交換回主存時,你會發(fā)現(xiàn)你的計算機
哪一段時間,幾乎要休息幾分鐘,盡管你看起來free輸出的頁面已經(jīng)很多了,但此時的外存幾乎一直忙著,且CPU負荷相當重,這時也可能你根本就沒做任何操作。
有沒有辦法既在VMA機制下工作,又能直接處理主存數(shù)據(jù)呢?
回答是肯定的:
內(nèi)核啟動后,會將主存映射為/dev/mem,當我們在VMA中申請一塊邏輯區(qū)間后,將轉(zhuǎn)換的物理地址傳與用戶空間,用戶空間就可以線性操作這段區(qū)間了,直接采用mmap就可以在物理主存中讀寫。
還有更快的方式嗎?不采用mmap行嗎?
當然有,當VMA將物理區(qū)塊地址及大小傳與用戶空間后,用戶完全可以采用地址讀寫模式,這幾近于機器指令操作了。(可以獨立于OS之外)
此種實現(xiàn)方式很簡單,首先打開/dev/mem,直接定位至VMA傳上來的地址就可以操作了,無需mmap。通知用戶空間,可以采用procfs/sysfs等。
強烈建議:在邊界控制上,一定要精確細致,不推薦初學(xué)者采用,一旦越界,可能引起“Kernel Panic”
更有可能就DOWN了。
對于此實現(xiàn)方式,建議參考mapper(LDD3)程序。
同時,也可以用mapper檢查讀寫是否正確。
新的IA32中,PAGE_SIZE = 4K MAX_ORDER = 11
gfp申請4M線性邏輯空間,減去PAGE_OFFSET即可得到物理地址。
如果采用了HIMEM和NUMA,請參見Kernel關(guān)于內(nèi)存映射的算法。
當主存達到1G或超過時,請減小用戶空間大小。
隨著硬件技術(shù)的發(fā)展,VMA在主存相當大時,可以考慮進行修正,完全可以集中采用物理映射方式。沒必要交換了。否則,反而影響性能。
32位平臺,如果主存2G,采用SWAP會使得性能有較大下降。
而在大容量數(shù)據(jù)傳輸時,也不可能采用SWAP方式的,不允許換出。
建議Linus在VMA中加入進程分類,不平類別的應(yīng)用,分配不同的內(nèi)存塊。
小數(shù)據(jù)PAGE_SIZE = 4K/大數(shù)據(jù)4M/128M
地址模式全轉(zhuǎn)換為64位,兼容32位,當應(yīng)用于Embedded系統(tǒng)時,直接使用32位模式。
如將做成多個微系統(tǒng),不同微核,運行不同應(yīng)用(不同的進程管理,內(nèi)存管理,文件管理),只是接口可以統(tǒng)一,不同標志而已。