與傳統的4/8位單片機相比,ARM的性能和處理能力是遙遙領先的。但與之相應,ARM的系統設計復雜度和難度,較之傳統的設計方法也大大提升了,同時也大大拓展了針對ARM芯片特性進行優化的空間,例如針對指令流水線的優化、針對寄存器分配進行的優化等。
    ARM在硬件上不支持除法指令">

欧美成人aaaaa免费视频_亚洲欧美激情小说另类_欧美激情一区二区三区视频_一级在线|欧洲

技術頻道

基于ARM的除法運算優化策略

與傳統的4/8位單片機相比,ARM的性能和處理能力是遙遙領先的。但與之相應,ARM的系統設計復雜度和難度,較之傳統的設計方法也大大提升了,同時也大大拓展了針對ARM芯片特性進行優化的空間,例如針對指令流水線的優化、針對寄存器分配進行的優化等。
ARM在硬件上不支持除法指令,編譯器是通過調用C庫函數來實現除法運算的,有許多不同類型的除法程序來適應不同的除數和被除數。但直接利用C庫函數中的標準整數除法程序,根據執行情況和輸入操作數的范圍,要花費20~100個周期,消耗較多的軟件運行時間。在實時嵌入式應用中,對時間參數較為敏感,故可以考慮如何優化避免除法消耗過多的CPU運行時間。
除法和模運算(/和%)執行起來比較慢,所以應盡量避免使用。但是,除數是常數的除法運算和用同一個除數的重復除法,執行效率會比較高。在ARM中,可以利用單條MUL指令實現乘法操作。本文將闡述如何用乘法運算代替除法運算,以及如何使除法的次數最少化。
1 避免除法運算
在非嵌入式領域,因為CPU運算速度快、存儲器容量大,除法操作通常都是不加考慮直接使用的。但在嵌入式領域,首先需要考慮的是這些除法操作是否是必須的。以對環形緩沖區操作為例,經常要用到除法,其實完全可以避免這些除法運算。
假定有一個buffer_size大小的環形緩沖區,如圖1所示,0ffset指定目前所在的位置。通過increment字節來增加offset的值,一般是這樣寫的:
0ffset=(Offset+increment)%buffer_size;
效率更高的寫法是:
offset+=increment;
if(offset>=buffer_size){
offset一=buffer_size;
}
第一種寫法要花費50個周期,而第二種因為沒有除法運算,只須花費3個周期。這里假定increment<buff_er_size,在實際應用中這點應該是保證的。
如果不能避免除法運算,那么就應盡量使除數和被除數是無符號的整數。有符號的除法程序執行起來更加慢,因為它們先要取得除數和被除數的絕對值,再調用無符號除法運算,最后再確定結果的符號。
2 充分利用商和余數
許多C語言庫中的除法函數返回商和余數。換句話說,每一個除法運算,余數是可以無償得到的,反之亦然。例如,要在屏幕緩沖區找到偏移量為offset的屏幕位置(x,y),可以這樣寫:
typeclef struct{
int x;
int y;
}point;
point getxy_v1(unsigned int offset,unslgned int bytes_per_line){
point p;
p.y=offset/lt)ytes_per_line;
p.x=offset - p.y* bytcs_per_line;
return p;
}


這里,似乎對p.x使用減法和乘法,少了一次除法運算;但是,實際上使用模運算或者取余操作效率更高,對
getxy_vl改進如下:
point getxy_v2(unsigned int offset,unsigned int bytes_per_line){
point P;
P.x=offset%bytes_per_1ine;
P.y=offset/bytes_per_line;
return P;
從下面編譯器的輸出結果可以看到,只有一次除法調用。實際上,這個程序要比前面的getxy_vl少4條指令(注意,并不是對所有的編譯器和C庫都有這樣的結果)。getxy_v2
STMFD r13!,{r4,r14};保存r4,lr人堆棧
MOV r4,rO ;賦值后r4保存的為點P基址
MOV rO,r2 ;rO=bytes_per_line
BL rt_udiv ;調用無符號除法例程
(r0.;r1)=(rl/rO,rl%rO)
STR r0,[r4,#4] ;P.y=offset/bytes_per_line
STR rl,[r4,#o] ;P.x=offset%bytes_per_line
LDMFD r13!,(r4,pc);恢復上下文,返回
3 把除法轉換為乘法
在程序中,同一個除數的除法經常會出現很多次。在前面的例子中,bytes_per_line的值在整個程序中都是固定不變的。又如3到2笛卡爾坐標變換,其中就使用了同一個除數兩次:
(x,Y,x)→(x/z,y/z)
這種情況下,使用cache指令中的值1/z,并使用1/z的乘法來代替除法運算,效率會更高。另外,要盡可能使用int類型的運算,避免使用浮點運算。
下面將更加偏重于從數學和理論的角度分析,把重復除法轉換成乘法運算。
下面來區分精確數學意義上的除法和整型除法運算:
◇n/d,即整數n被分成整數d份,結果趨向于O(與C語言相同);
◇n%d,即n被d除之后的余數,就是n--d(n/d);
◇n/d=n·d-1,即真正數學意義上的n被d除。
當使用整型除法時,最容易估算d-1值的方法是計算232/d。然后,就可以估算n/d為:
(n(232/d))/232 (1)
在執行n的乘法時,需要精確到64位。對于這種方法,會出現如下問題:
◇為了計算232/d,由于一個unsigned int類型的數據放不下232,編譯器要使用64位long long類型的數,而且必須指定除法為(1 ull<<32)/d。這種64位的除法比32位的除法執行起來要慢得多。
◇如果d碰巧是1,那么232/d就不再適合于un—signed int數據類型。
上面的做法似乎很好,而且解決了這兩個問題。那么,再來看一下用(232一1)/d代替232/d。

s=0xffffffff ul/d (2)


以上n/d-2,q,n/d+1為整數值,所以可得q=n/d或q=(n/d)一1,即初步估計的結果q與正確值n/d有可能存在偏差1。可以發現,通過計算余數r=n—q·d(O≤r<2d)是比較容易的。下面的代碼糾正了這個結果:
r=n--q*d;/*初步估計結果余數r的范圍為O≤r<2d*/
if(r>=d){/*若需要校正*/
r-=d;/*校正r,使O≤r<d為正確余數范圍*/
n++;/*相應商加1進行校正*/
} /*得正確結果q=n/d和r=n%d*/
下面給出一個實例,用上面的算法完成了N個元素的數組被d除。首先,計算上面所說的s值,然后用乘以5來代替每個被d除的除法。64位的乘是很容易實現的,因為ARM中有一條指令UMULL,可以進行2個32位數相乘,給出一個64位的結果。
void scale(
unsigned int*dest; /*目的數據*/
unsigned int*src; /*源數據*/
unsignedInt d; /*分母d*/
urlslglaedInt N;) /*數據長度*/
{
unsigned int s=0xFFFFFFFFu/d;
do{
unsigned int n,q,r;
n=*(src++);
q=(urtslgrted int)(((unsined tong long)n*s)>>32);
r=n*d;
if(r>=d){ /*若需要對商進行校正*/
q++;
}
*(dest++)=q;
}while(一一N);
}
這里假定除數和被除數都是32位的無符號整數。當然,使用32位乘法進行16位的無符號數計算,或者使用1 28位乘法進行64位數計算,運算規則是一樣的。可以為特定的數據選擇最窄的運算寬度。如果數據是16位的,那么就設置s=(216一1)/d,然后用標準的整型乘法來求值q。
4 結 論
在嵌入式軟件編程中,為了節省CPU運行時間,應盡可能避免使用除法。對環形緩沖區的處理可以不用除法。如果不能避免除法運算,那么應盡可能使用除法程序同時產生商n/d和余數n%d的好處。對于重復對一除數d的除法.預先計算好s=(2k一1)/d,用乘以s的2k位乘法來代替除以d的k位無符號整數除法,可大大減少由于直接使用除法操作引入的指令周期數。

文章版權歸西部工控xbgk所有,未經許可不得轉載。

欧美成人aaaaa免费视频_亚洲欧美激情小说另类_欧美激情一区二区三区视频_一级在线|欧洲

      9000px;">

          久久久久国产精品人| 国产黄色精品网站| 奇米综合一区二区三区精品视频| 亚洲综合色区另类av| 欧美色图在线观看| 日韩一区二区三区精品视频| 精品国产91乱码一区二区三区| 国产精品区一区二区三区| 成人av网站免费观看| 欧美日韩成人高清| 国产精品乱人伦| 欧美在线你懂的| 成人免费在线播放视频| 日本韩国欧美三级| 韩国一区二区在线观看| 在线播放视频一区| 国产乱子伦视频一区二区三区| 国产精品成人午夜| 日韩免费观看2025年上映的电影| 成人三级在线视频| 亚洲va欧美va人人爽| 久久久久久久精| 裸体健美xxxx欧美裸体表演| 色综合久久久久综合体桃花网| 亚洲黄网站在线观看| 久久女同互慰一区二区三区| 日本视频免费一区| 欧美在线制服丝袜| 国产尤物一区二区| 亚洲电影视频在线| 国产精品女主播av| 成人av动漫网站| 日日夜夜一区二区| 韩国精品免费视频| 欧美日韩你懂得| 久久蜜桃av一区二区天堂| 亚洲国产精品久久久男人的天堂| 成人aaaa免费全部观看| 国产日韩av一区二区| 欧美主播一区二区三区| 久久99精品国产91久久来源| 亚洲精品成a人| 欧美午夜精品久久久久久超碰 | 日韩免费看网站| 奇米影视在线99精品| 国产精品电影一区二区| 9人人澡人人爽人人精品| 老司机精品视频线观看86| 性做久久久久久免费观看| 中文字幕在线免费不卡| 色女孩综合影院| 国产原创一区二区| 欧美国产日韩精品免费观看| 成人综合激情网| 中文字幕综合网| 国产欧美日韩中文久久| 欧美tickling挠脚心丨vk| 国产高清一区日本| 日产国产高清一区二区三区| 久久久国际精品| 欧美xxx久久| 2017欧美狠狠色| 欧洲精品在线观看| 欧美私模裸体表演在线观看| 欧美日本视频在线| 久久先锋资源网| 26uuu国产电影一区二区| 日韩精品一级中文字幕精品视频免费观看 | 亚洲黄色录像片| www国产精品av| 久久99九九99精品| 欧美一卡二卡在线| 国产91精品在线观看| 国产成人综合在线播放| 国产精品 日产精品 欧美精品| 亚洲精品免费一二三区| 亚洲一区在线播放| 美女视频一区在线观看| 亚洲国产成人自拍| 日韩一区二区视频| 久久九九99视频| 欧美一区午夜精品| 欧美色图片你懂的| 99精品视频在线观看免费| 蜜臀久久99精品久久久画质超高清 | 亚洲精品国产一区二区三区四区在线 | 国产精品国产馆在线真实露脸| 一区二区激情小说| 裸体健美xxxx欧美裸体表演| 亚洲男人的天堂在线观看| 久久精品综合网| 五月婷婷久久丁香| 亚洲色图在线视频| 国产精品国产三级国产普通话三级 | 一本到三区不卡视频| 五月开心婷婷久久| 蜜桃视频一区二区| 欧美日韩国产美女| 久久精品99国产国产精| 国产成人福利片| 在线不卡欧美精品一区二区三区| 天天影视涩香欲综合网| 成人av手机在线观看| 中文字幕视频一区二区三区久| 国产乱子伦一区二区三区国色天香| 亚洲精品久久7777| 国产成人av影院| 精油按摩中文字幕久久| 国产一区二区三区黄视频 | 一本久道中文字幕精品亚洲嫩| 成人黄色网址在线观看| 欧美放荡的少妇| 欧美猛男gaygay网站| 一区二区久久久久久| **性色生活片久久毛片| 99久久精品情趣| 国产专区欧美精品| 日韩不卡一区二区| 欧美精三区欧美精三区| 麻豆成人av在线| 国产一区二区三区高清播放| 91视视频在线观看入口直接观看www | 久久99久久99| 日韩一区二区三区观看| 亚洲一区二区三区四区的| 天天综合天天做天天综合| 99久久国产综合色|国产精品| 91黄色在线观看| 亚洲男女一区二区三区| 在线免费观看视频一区| 亚洲女人****多毛耸耸8| 丰满白嫩尤物一区二区| 国产精品理伦片| 91啪在线观看| 欧美一区二区视频在线观看2020| 亚洲精品va在线观看| 欧美aaa在线| 日韩欧美一区二区不卡| 1024成人网色www| www.欧美日韩国产在线| 制服丝袜av成人在线看| 成人欧美一区二区三区1314| 波多野结衣视频一区| 国产精品家庭影院| 国产精品免费视频一区| 丁香婷婷综合色啪| 欧美哺乳videos| 激情久久五月天| 日韩av不卡在线观看| 国产在线精品一区在线观看麻豆| 国产成人精品aa毛片| 欧美顶级少妇做爰| 美国欧美日韩国产在线播放| 91在线观看高清| 91精品久久久久久蜜臀| 水蜜桃久久夜色精品一区的特点| 久久国产剧场电影| 久久免费视频色| 亚洲国产毛片aaaaa无费看| 欧美色视频在线观看| 欧美日韩国产片| 看国产成人h片视频| 国产精品免费人成网站| 欧美日韩国产一级二级| 国产精品网站导航| 欧美日韩成人激情| 国产宾馆实践打屁股91| 欧美大片在线观看一区二区| 成人高清在线视频| 久久久久久久久久电影| 99精品久久免费看蜜臀剧情介绍| 亚洲综合区在线| 日韩精品一区国产麻豆| 色婷婷av一区二区三区软件| 亚洲欧洲制服丝袜| yourporn久久国产精品| 国产日产亚洲精品系列| 激情综合色播五月| 亚洲日本在线天堂| 成人美女视频在线观看| 26uuu成人网一区二区三区| 中文幕一区二区三区久久蜜桃| 亚洲一区二区三区精品在线| 欧美午夜精品免费| 高清不卡一二三区| 亚洲欧洲精品一区二区三区| 成人精品视频.| 亚洲日本va在线观看| 日本乱人伦aⅴ精品| 一区二区三区欧美久久| 欧美激情在线一区二区三区| 国产在线播放一区| 国产精品国产自产拍高清av| 91美女片黄在线| 五月激情丁香一区二区三区| 日韩午夜三级在线| 国产一区二区三区精品视频| 日韩精品免费专区| 日韩精品免费专区| 性做久久久久久久免费看|