ARM開發(fā)步步深入之MMU初窺
實驗目的:啟用MMU,映射SDRAM的地址空間,操作虛擬地址實現(xiàn)“點燈大法”,借此掌握MMU的使用。
本文引用地址:http://2s4d.com/article/201612/340976.htm實 驗環(huán)境及說明:恒頤S3C2410開發(fā)板H2410。H2410核心板擴展有64MB的K4S561632 SDRAM(4M*16bit*4BANK),地址范圍是0x30000000~0x33FFFFFF。GPIO端口的地址范圍是 0x56000000~0X560000B0。
實 驗思路:開發(fā)板上電啟動后,自動將NandFlash開始的4K數(shù)據(jù)復制到SRAM中,然后跳轉到0地址開始執(zhí)行,然后初始化存儲控制器SDRAM,把 2K后的代碼從SRAM中復制到SDRAM中(存放在0x30004000,前16KB用來存放頁表)、設置頁表、啟動MMU實現(xiàn)虛擬地址映射GPIO寄 存器和SDRAM,最后跳轉到SDRAM中(地址0xB0004000)運行。重新設置棧指針,跳到點燈代碼的入口點實現(xiàn)點燈操作。
知識掌握:MMU地址轉換、內(nèi)存訪問權限檢查、TLB及Cache的使用
一、MMU地址轉換:
1. 首先弄清除為什么要使用MMU納?MMU即內(nèi)存管理單元,直白一點的講,就像食堂的餐具,所有的學生一起吃飯時不夠用,但食堂又不想再出資購買新的餐具 (原因很明顯:一方面要成本,另一方面又占地方。這就像增加內(nèi)存一樣),那么有沒有解決辦法?根據(jù)以往經(jīng)驗得知不可能全學校的學習一起都到食堂吃飯,于是 食堂就找?guī)讉€人負責餐具的管理(相當于MMU),他們一方面發(fā)放餐具,保證來的同學有餐具可用,另一方面又回收用完的餐具(這就相當于虛擬地址到物理地址 之間建立了一個映射一樣,內(nèi)存還是那么多,但從任意單個程序角度都好像用不完一樣)。當然如果有同學一個人拿好幾套餐具肯定不允許的(這就相當于內(nèi)存的權 限檢查)。MMU在地址轉換過程中涉及到三種地址:(VA---Virtual Address,虛擬地址)---這個就相當于餐具存放的地方(大家都可以領到餐具)。CPU核心看到和用到的只是虛擬地址VA,至于VA如果去對應物理 地址PA,CPU核心不理會,大家也不會去關心總共有多少餐具吧;(MVA---Modified Virtual Address,變換后的虛擬地址)---這個相當于放假的時候,人很少,只發(fā)餐具好了,用過的就不先回收了,節(jié)省人員了。Caches和MMU看不到 VA,他們利用MVA轉換得到PA,放假了回收餐具的人也不需要一直尋找用完的餐具;(PA---Physical Address,物理地址)---實際的餐具量,就那些。實際設備看不到VA、MVA,讀寫它們使用的是物理地址PA,同學們就餐一般會領到餐具。
2. 虛擬地址到物理地址的轉換過程。ARM使用頁表來進行轉換,S3C2410最多會用到兩級頁表,以段(Section,1M)的方式進行轉換時只用到一級 頁表,以頁(Page)的方式進行轉換時用到兩級頁表。頁的大小有3種:大頁(64KB)、小頁(4KB)和極小頁(1KB)。本文只是以段地址轉換過程 為例來講解一下,頁的轉換大同小異。
★首先有個頁表基址寄存器(位置為協(xié)處理器CP15的寄存器C2),它里面寫入的就是一級頁表的地址,通過讀 取它就可以找到一級頁表存放的起始位置。一級頁表的地址是16K對齊(所以[13:0]為0,使用[31:14]存儲頁表基址)。一級頁表使用4096個 描述符來表示4GB空間,所以每個描述符對應1MB的虛擬地址,存儲它對應的1MB物理空間的起始地址,或者存儲下一級頁表的地址。使用 MVA[31:20]來索引一級頁表(31-20一共12位,2^12=4096,所以是4096個描述符),得到一個描述符,每個描述符占4個字節(jié)。
★ 描述符最后兩位為0B10時,即是段的方式映射。[31:20]為段基址,此描述符低20位填充0后就是一塊1MB物理地址空間的起始地址。 MVA[19:0]用來在這1MB空間中尋址。描述符的位[31:20]和MVA[19:0]構成了這個虛擬地址MVA對應的物理地址。以段的方式進行映 射時,虛擬地址MVA到物理地址PA的轉換過程如下:①頁表基址寄存器位[31:14]和MVA[31:20]組成一個低兩位為0的32位地址,MMU利 用這個地址找到段描述符;②取出段描述符的位[31:20](段基址),它和MVA[19:0]組成一個32位的物理地址(這就是MVA對應的PA)。
'700')this.width='700';if(this.offsetHeight>'700')this.height='700';" src="http://www.arm79.com/attachment/Mon_1005/73_67_c19a93f3ccea9b3.jpg" onclick="if(this.width>=700) window.open('http://www.arm79.com/attachment/Mon_1005/73_67_c19a93f3ccea9b3.jpg');" border="0" width="700">
'700')this.width='700';if(this.offsetHeight>'700')this.height='700';" src="http://www.arm79.com/attachment/Mon_1005/73_67_ba0dd29d824d17a.jpg" onclick="if(this.width>=700) window.open('http://www.arm79.com/attachment/Mon_1005/73_67_ba0dd29d824d17a.jpg');" border="0" width="700">
二、內(nèi)存的訪問權限檢查
內(nèi) 存的訪問權限檢查決定一塊內(nèi)存是否允許讀/寫。這由CP15寄存器C3(域訪問控制)、描述符的域(Domain)、CP15寄存器C1的R/S/A位和 描述符的AP位共同決定?!坝颉睕Q定是否對某塊內(nèi)存進行權限檢查,"AP"決定如何對某塊內(nèi)容進行權限檢查。S3C2440有16個域,CP15寄存器 C3中每兩位對應一個域(一共32位),用來表示這個域是否進行權限檢查。
每兩位數(shù)據(jù)的含義:00---無訪問權限(任何訪問都將導 致"Domain fault"異常);01---客戶模式(使用段描述符、頁描述符進行權限檢查);10---保留(保留,目前相當于“無訪問權限”);11---管理模 式(不進行權限檢查,允許任何訪問)。"Domain"占用4位,用來表示內(nèi)存屬于0-15哪一個域。
三、TLB和Cache
首先說兩者都是利用程序訪問的局部性原理,通過設置高速、小容量的存儲器來提高性能。
1.(TLB---Translation Lookaside Buffers,轉譯查找緩存):由于從MVA到PA的轉換需要訪問多次內(nèi)存,大大降低了CPU的性能,故提出TLB辦法改進。當CPU發(fā)出一個虛擬地址 時,MMU首先訪問TLB。如果TLB中含有能轉換這個虛擬地址的描述符,則直接利用此描述符進行地址轉換和權限檢查,否則MMU訪問頁表找到描述符后再 進行地址轉換和權限檢查,并將這個描述符填入TLB中,下次再使用這個虛擬地址時就直接使用TLB用的描述符。使用TLB需要保證TLB中的內(nèi)容與頁表一 致,在啟動MMU之前,頁表中的內(nèi)容發(fā)生變化后,尤其要注意。一般的做法是在啟動MMU之前使整個TLB無效,改變頁表時,使所涉及的虛擬地址對應的 TLB中條目無效。
2.(Cache,高速緩存):為提高程序的運行速度,在主存和CPU通用寄存器之間設置一個高速的、容量相對較小的存儲器,把正在執(zhí)行的指令地址附近的一部分指令或數(shù)據(jù)從主存調(diào)入這個存儲器,供CPU在一段時間內(nèi)使用。
★ 寫數(shù)據(jù)的兩種方式:①(Write Through,寫穿式)---任一CPU發(fā)出寫信號送到Cache的同時,也寫入主存,保證主存的數(shù)據(jù)同步更新。優(yōu)點是操作簡單,但由于主存速度慢,降 低了系統(tǒng)的寫速度并占用了總線的時間。②(Write Back,回寫式)---數(shù)據(jù)一般只寫到Cache,這樣可能出現(xiàn)Cache中的數(shù)據(jù)得到更新而主存中的數(shù)據(jù)不變(數(shù)據(jù)陳舊)的情況。此時可在Cache 中設一個標志地址及數(shù)據(jù)陳舊的信息,只有當Cache中的數(shù)據(jù)被換出或強制進行”清空“操作時,才將原更新的數(shù)據(jù)寫入主存響應的單元中,保證了Cache 和主存中數(shù)據(jù)一致。
★Cache有以下兩個操作:①(Clean,清空)---把Cache或Write buffer中已經(jīng)臟的(修改過,但未寫入主存)數(shù)據(jù)寫入主存。②(Invalidate,使無效)---使之不能再使用,并不將臟的數(shù)據(jù)寫入主存。
★S2C2440 內(nèi)置了(ICaches,指令Cache)、(DCaches,數(shù)據(jù)Cache)和(Write buffer,寫緩存),操作時需要用到描述符中的C位(Ctt)和B位(Btt)。①(ICaches,指令Cache)---系統(tǒng)剛上電或復位 時,ICaches中的內(nèi)容是無效的,并且ICaches功能關閉。往Icr位(CP15協(xié)處理器中寄存器1的第12位)寫1可以啟動ICaches,寫 0停止ICaches。ICaches一般在MMU開啟后使用,此時描述符的C位用來表示一段內(nèi)存是否可以被Cache。若Ctt=1,允許Cache, 否則不允許。如果MMU沒有開啟,ICaches也可以被使用,此時CPU讀取指令時所涉及的內(nèi)存都被當做允許Cache。ICaches關閉時,CPU 每次取指都要讀取主存,性能低,所以通常盡早啟動ICaches。ICaches開啟后,CPU每次取指時都會先在ICaches中查看是否能找到所用指 令,而不管Ctt是0還是1。如果找到成為Cache命中,找不到稱為Cache丟失,ICaches被開啟后,CPU的取指有如下三種情況:Cache 命中且Ctt為1時,從ICaches中取指,返回CPU;Cache丟失且Ctt為1時,CPU從主存中取指,并且把指令緩存到Cache中;Ctt為 0時,CPU從主存中取指。②(DCaches,數(shù)據(jù)Cache)---與ICaches相似,系統(tǒng)剛上電或復位時,DCaches中的內(nèi)容無效,并且 DCaches功能關閉,Write buffer中的內(nèi)容也是被廢棄不用的。往Ccr位(CP15協(xié)處理器 中寄存器1的第二位)寫1啟動DCaches,寫0停止DCaches。Write buffer和DCaches緊密結合,額米有專門的控制來開啟和停止它。與ICaches不同,DCaches功能必須在MMU開啟之后才能被使用。 DCaches被關閉時,CPU每次都去內(nèi)存取數(shù)據(jù)。DCaches被開啟后,CPU每次讀寫數(shù)據(jù)時都會先在DCaches中查看是否能找到所要的數(shù)據(jù), 不管Ctt是0還是1,找到了稱為Cache命中,找不到稱為Cache丟失。
★使用Cache時需要保證Cache、Write buffer的內(nèi)容和主存內(nèi)容一致,保證下面兩個原則:①清空DCaches,使主存數(shù)據(jù)得到更新。②使無效ICaches,使CPU取指時重新讀取主存。
在 實際編寫程序時,要注意如下幾點:①開啟MMU前,使無效ICaches,DCaches和Write buffer。②關閉MMU前,清空ICaches、DCaches,即將“臟”數(shù)據(jù)寫到主存上。③如果代碼有變,使無效ICaches,這樣CPU取指 時會從新讀取主存。④使用DMA操作可以被Cache的內(nèi)存時:將內(nèi)存的數(shù)據(jù)發(fā)送出去時,要清空Cache;將內(nèi)存的數(shù)據(jù)讀入時,要使無效Cache。⑤ 改變頁表中地址映射關系時也要慎重考慮。⑥開啟ICaches或DCaches時,要考慮ICaches或DCaches中的內(nèi)容是否與主存保持一致。⑦ 對于I/O地址空間,不使用Cache和Write buffer。
四、MMU、TLB及Cache的控制指令
S3C2410除了ARM920T的CPU核心外,還有若干個協(xié)處理器,用來幫助主CPU完成一些特殊功能,對MMU、TLB及Cache等的操作就涉及到協(xié)處理器。格式如下:
{條件} 協(xié)處理器編碼,協(xié)處理器操作碼1,目的寄存器,源寄存器1,源寄存器2,協(xié)處理器操作碼2
{cond} p#,,Rd,cn,cm{,}
MRC //從協(xié)處理器獲得數(shù)據(jù),傳給ARM920T CPU核心寄存器
MCR //數(shù)據(jù)從ARM920T CPU核心寄存器傳給協(xié)處理器
{cond} //執(zhí)行條件,省略時表示無條件執(zhí)行
p# //協(xié)處理器序號
//一個常數(shù)
Rd //ARM920T CPU核心的寄存器
cn和cm //協(xié)處理器中的寄存器
//一個常數(shù)
其中,、cn、cm、僅供協(xié)處理器使用,它們的作用如何取決于具體的協(xié)處理器。
示例代碼解析:
開 啟MMU,并將虛擬地址0xA0000000~0xA0100000映射到物理地址0x56000000~0x56100000(GPFCON物理地址為 0x56000050,GPFDAT物理地址為0x56000054);將虛擬地址0xB0000000~0xB3FFFFFF映射到物理地址 0x30000000~0x33FFFFFF。本示例以段的方式進行地址映射,只使用一級頁表,通過上面內(nèi)容可知一級頁表使用4096個描述符來表示4G 空間(每個描述符對應1MB),每個描述符占4字節(jié),所以一級頁表占16KB。使用SDRAM的開始16KB存放一級頁表,所以剩下的內(nèi)存開始地址就為 0x30004000,這個地址最終會對應虛擬地址0xB0004000(所以代碼運行地址為0xB0004000)。
★程序執(zhí)行主要流程的示例代碼。
.text
.global _start
_start:
bl disable_watch_dog @ 關閉WATCHDOG,否則CPU會不斷重啟
bl mem_control_setup @ 設置存儲控制器以使用SDRAM
ldr sp, =4096 @ 設置棧指針,以下是C函數(shù)調(diào)用前需要設好棧
bl copy_2th_to_sdram @ 將第二部分代碼復制到SDRAM
bl create_page_table @ 設置頁表
bl mmu_init @ 啟動MMU,啟動以后下面代碼都用虛擬地址
ldr sp, =0xB4000000 @ 重設棧指針,指向SDRAM頂端(使用虛擬地址)
ldr pc, =0xB0004000 @ 跳到SDRAM中繼續(xù)執(zhí)行第二部分代碼
halt_loop:
b halt_loop
★設置頁表。
void create_page_table(void)
{
/*
* 用于段描述符的一些宏定義:[31:20]段基址,[11:10]AP,[8:5]Domain,[3]C,[2]B,[1:0]0b10為段描述符
*/
#define MMU_FULL_ACCESS (3 << 10) /* 訪問權限AP */
#define MMU_DOMAIN (0 << 5) /* 屬于哪個域 Domain*/
#define MMU_SPECIAL (1 << 4) /* 必須是1 */
#define MMU_CACHEABLE (1 << 3) /* cacheable C位*/
#define MMU_BUFFERABLE (1 << 2) /* bufferable B位*/
#define MMU_SECTION (2) /* 表示這是段描述符 */
#define MMU_SECDESC (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | MMU_SECTION)
#define MMU_SECDESC_WB (MMU_FULL_ACCESS | MMU_DOMAIN | MMU_SPECIAL | MMU_CACHEABLE | MMU_BUFFERABLE | MMU_SECTION)
#define MMU_SECTION_SIZE 0x00100000 /*每個段描述符對應1MB大小空間*/
unsigned long virtuladdr, physicaladdr;
unsigned long *mmu_tlb_base = (unsigned long *)0x30000000; /*SDRAM開始地址存放頁表*/
/*
* Steppingstone的起始物理地址為0,第一部分程序的起始運行地址也是0, 為了在開啟MMU后仍能運行第一部分的程序, 將0~1M的虛擬地址映射到同樣的物理地址
*/
virtuladdr = 0;
physicaladdr = 0;
/*虛擬地址[31:20]用于索引一級頁表,找到它對應的描述符,對應于(virtualaddr>>20)。段描述符中[31:20]保存段的物理地址,對應(physicaladdr & 0xFFF00000)*/
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | MMU_SECDESC_WB;
/*
* 0x56000000是GPIO寄存器的起始物理地址,GPBCON和GPBDAT這兩個寄存器的物理地址0x56000010、0x56000014, 為了在第二部分程序中能以地址0xA0000010、0xA0000014來操作GPBCON、GPBDAT,
* 把從0xA0000000開始的1M虛擬地址空間映射到從0x56000000開始的1M物理地址空間
*/
virtuladdr = 0xA0000000;
physicaladdr = 0x56000000;
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | MMU_SECDESC;
/*
* SDRAM的物理地址范圍是0x30000000~0x33FFFFFF, 將虛擬地址0xB0000000~0xB3FFFFFF映射到物理地址0x30000000~0x33FFFFFF上, 總共64M,涉及64個段描述符
*/
virtuladdr = 0xB0000000;
physicaladdr = 0x30000000;
while (virtuladdr < 0xB4000000)
{
*(mmu_tlb_base + (virtuladdr >> 20)) = (physicaladdr & 0xFFF00000) | MMU_SECDESC_WB;
virtuladdr += MMU_SECTION_SIZE;
physicaladdr += MMU_SECTION_SIZE;
}
}
★ 啟動MMU。
void mmu_init(void)
{
unsigned long ttb = 0x30000000;
__asm__(
"mov r0, #0n"
"mcr p15, 0, r0, c7, c7, 0n" /* 使無效ICaches和DCaches */
"mcr p15, 0, r0, c7, c10, 4n" /* drain write buffer on v4 */
"mcr p15, 0, r0, c8, c7, 0n" /* 使無效指令、數(shù)據(jù)TLB */
"mov r4, %0n" /* r4 = 頁表基址 */
"mcr p15, 0, r4, c2, c0, 0n" /* 設置頁表基址寄存器 */
"mvn r0, #0n"
"mcr p15, 0, r0, c3, c0, 0n" /* 域訪問控制寄存器設為0xFFFFFFFF, 不進行權限檢查*/
/*
* 對于控制寄存器,先讀出其值,在這基礎上修改感興趣的位,然后再寫入
*/
"mrc p15, 0, r0, c1, c0, 0n" /* 讀出控制寄存器的值 */
/* 控制寄存器的低16位含義為:.RVI ..RS B... .CAM
* R : 表示換出Cache中的條目時使用的算法,0 = Random replacement;1 = Round robin replacement
* V : 表示異常向量表所在的位置,0 = Low addresses = 0x00000000;1 = High addresses = 0xFFFF0000
* I : 0 = 關閉ICaches;1 = 開啟ICaches
* R、S : 用來與頁表中的描述符一起確定內(nèi)存的訪問權限
* B : 0 = CPU為小字節(jié)序;1 = CPU為大字節(jié)序
* C : 0 = 關閉DCaches;1 = 開啟DCaches
* A : 0 = 數(shù)據(jù)訪問時不進行地址對齊檢查;1 = 數(shù)據(jù)訪問時進行地址對齊檢查
* M : 0 = 關閉MMU;1 = 開啟MMU
*/
/*
* 先清除不需要的位,往下若需要則重新設置它們
*/
/* .RVI ..RS B... .CAM */
"bic r0, r0, #0x3000n" /* ..11 .... .... .... 清除V、I位 */
"bic r0, r0, #0x0300n" /* .... ..11 .... .... 清除R、S位 */
"bic r0, r0, #0x0087n" /* .... .... 1... .111 清除B/C/A/M */
/*
* 設置需要的位
*/
"orr r0, r0, #0x0002n" /* .... .... .... ..1. 開啟對齊檢查 */
"orr r0, r0, #0x0004n" /* .... .... .... .1.. 開啟DCaches */
"orr r0, r0, #0x1000n" /* ...1 .... .... .... 開啟ICaches */
"orr r0, r0, #0x0001n" /* .... .... .... ...1 使能MMU */
"mcr p15, 0, r0, c1, c0, 0n" /* 將修改的值寫入控制寄存器 */
: /* 無輸出 */
: "r" (ttb) );
}
評論