SAM4E單片機之旅——23、在AS6(GCC)中使用FPU
浮點單元(Floating Point Unit,FPU),是用于處理浮點數(shù)運算的單元。
本文引用地址:http://2s4d.com/article/201705/358649.htm為使用FPU,除了需要啟用FPU外,還需要對編譯器進行設(shè)置,以使其針對浮點運算生成特殊的指令。雖然在Atmel Studio 6中,開發(fā)板使用的工程模板中默認就完成了這兩部分工作,但這次仍然對設(shè)置的方法進行介紹,同時簡單測試一下FPU的效率。
一、 編譯器設(shè)置
AS6.1 SP2中,使用的編譯器為arm-none-eabi-gcc.exe,版本為4.7.3。其中“none”表示沒有指定操作系統(tǒng),“eabi”表示使用的二進制文件接口是eabi。
在ARM GCC中,可以使用-mfloat-abi選項設(shè)置浮點數(shù)的ABI:
soft: 調(diào)用軟浮點庫對浮點運算進行支持。在GCC中采用常用的指令來模擬浮點運算。
softfp: 使用FPU進行浮點數(shù)運算。但是在函數(shù)調(diào)用時,仍然使用通用的寄存器傳遞浮點數(shù)參數(shù)。這需要額外的類型轉(zhuǎn)換的開銷。
hard: 使用FPU進行浮點數(shù)運算。而且在函數(shù)調(diào)用時,使用FPU的寄存器傳遞浮點數(shù)參數(shù)。
AS6.1使用的編譯器,默認情況下即使用soft選項。而為了使用FPU,這里將使用softfp選項。
使用-mfpu選項設(shè)置FPU硬件的類型。
SAM4E搭載了Cortex-M4F FPU,它實現(xiàn)了FPv4-SP版本(SP表示單精度)的浮點數(shù)擴展。另外,它也搭載了32個32位的單精度寄存器,而這些寄存器也可以被當(dāng)作16個64位的雙精度寄存器以進行l(wèi)oad,store和move操作。
所以需要將-mfpu賦值為fpv4-sp-d16。其中d16表示有16個64位寄存器。
AS6中的設(shè)置。
在解決方案管理器中,右鍵點擊工程,進入屬性頁面。然后選中“Toolchain”選項卡,再選擇“ARM/GUN C Complier”下的“Miscellaneous”選項,就可以看到自定義的編譯器的選項了。
可以看到,默認情況下已經(jīng)追加了“-mfloat-abi=softfp -mfpu=vfpv4”的選項了。vfpv4默認表示vfpv4-D32,表示實現(xiàn)了完全的FPV4的版本,且配有32個64位寄存器。很明顯,這是一個不怎么正確的設(shè)置,所以需要更改為“-mfloat-abi=softfp -mfpu= fpv4-sp-d16”:
注意,在Release版本的配置中也需要進行修改。
二、 啟用FPU
開發(fā)板重置時,F(xiàn)PU是禁止訪問的。但是AS6中使用的startup文件會根據(jù)編譯器設(shè)置啟用FPU。
啟用FPU的方法
向FPU的CPACR寄存器的CP10和CP11字段寫入0b11即可開放FPU的完全訪問權(quán)限。另外,在特權(quán)模式下才能讀寫該寄存器。
在CMSIS中該寄存器的地址被定義成了保留地址。但是在fpu.h 中提供了相應(yīng)的API:
#include
fpu_enable();
fpu_enable() 的實現(xiàn)如下:
/** CPACR寄存器 */
#define ADDR_CPACR 0xE000ED88
#define REG_CPACR (*((volatile uint32_t *)ADDR_CPACR))
/** 保存CPU當(dāng)前中斷的狀態(tài),并屏蔽之 */
irqflags_t flags;
flags = cpu_irq_save();
/** 修改CPACR寄存器*/
REG_CPACR |= (0xFu << 20);
__DSB(); /** 等待寄存器修改完成*/
__ISB(); /** 清空處理器流水線 */
/** 根據(jù)設(shè)置決定是否重新啟用中斷 */
cpu_irq_restore(flags);
AS6中已經(jīng)完成的工作
開發(fā)板使用的AS6的工程模板中,程序的入口函數(shù)是Reset_Handler() 。
該函數(shù)在調(diào)用main() 函數(shù)之前,會執(zhí)行以下代碼:
#if __FPU_USED
fpu_enable();
#endif
__FPU_USED在以下代碼中定義:
//...
/* 判斷使用的編譯器是否為GCC */
#elif defined ( __GNUC__ )
/* 判斷是否啟用浮點運算,且運算不是用軟件實現(xiàn)的 */
#if defined (__VFP_FP__) && !defined(__SOFTFP__)
/* 判斷目標(biāo)平臺是否有FPU */
#if (__FPU_PRESENT == 1)
#define __FPU_USED 1
#else
//...
__FPU_PRESENT 在sam4e16e.h 中定義:
/**< SAM4E16E does provide a FPU */
#define __FPU_PRESENT 1
所以,只需要設(shè)置好了編譯器的參數(shù),就可以自動啟用FPU了。
PS:__GNUC__ 在GCC編譯器預(yù)定義的宏,__VFP_FP__ 在GCC啟用浮點運算時預(yù)定義,__SOFTFP__ 是使用軟模擬浮點運算時預(yù)定義。GCC可以使用“-dM –E”參數(shù)打印出預(yù)定義的宏。
三、 測試
在第一次示例教程中,我們使用了空循環(huán)來進行延時,來完成LED的閃爍工作。在這里,我們將這個空循環(huán)的循環(huán)體修改為對一個浮點數(shù)的運算。然后觀察在是否使用硬件FPU時,LED閃爍的頻率的差別。
將延時函數(shù)修改如下:
void Delay(int num)
{
volatile float f = 1.0f;
for (volatile int i = 0; i < 1024 * 64 * num; ++i )
f *= 1.1f;
}
然后分別使用“-mfloat-abi=softfp ”和“-mfloat-abi=soft ”選項編譯并執(zhí)行程序,觀察LED閃爍的頻率。
評論