DSP初學(xué)者求助:怎么才能更快的學(xué)會TMS320LF2407A 的DSP
我是一名在校研究生,論文題目是基于DSP的TCR型低壓無功補償器的仿真研究,我只需作完仿真這塊就行了,我用將近一個月看完<>這本書,可還是一頭霧水,沒有多少收獲.我該怎么辦呢?身邊連個會DSP的人都沒有!快要郁悶死了! 請各位大蝦能指點一下迷津,小女子不勝感激!
全部回復(fù)(31)
正序查看
倒序查看
@
我也剛剛學(xué)過,有一些體會.建議選用劉和平的《TMS320LF240XC語言開發(fā)應(yīng)用》,我覺得是我見到的最好的入門級的書,里面有一些很好的實例程序.這個版上有它的PDF文檔和源程序文件,也可以到書店去買,我是嫌電子文檔太累,特地在蔚藍(lán)網(wǎng)上書店買了一本.然后找一個仿真器和實驗板,參考書上的例程做試驗,或者嘗試改改程序,應(yīng)該是比較好的入門辦法.
多謝指點!
我手上現(xiàn)在有一本<>,和一本<>,我只看了前一本,指令比較多,記不住,我學(xué)過C和匯編,感覺比它倆都難.程序看起來感覺有點不太習(xí)慣.希望買了仿真器和實驗板后能有所進(jìn)展.對了,仿真器和實驗板的型號和具體價位,您能否幫我參謀一下?
我手上現(xiàn)在有一本<
0
回復(fù)
@ztlxinyu
多謝指點!我手上現(xiàn)在有一本,和一本,我只看了前一本,指令比較多,記不住,我學(xué)過C和匯編,感覺比它倆都難.程序看起來感覺有點不太習(xí)慣.希望買了仿真器和實驗板后能有所進(jìn)展.對了,仿真器和實驗板的型號和具體價位,您能否幫我參謀一下?
我手頭用的是XDS-510并行口仿真系統(tǒng),合眾達(dá)的,SEED-XDSpp,公開報價是1980(應(yīng)該可以便宜一點),也可以買usb接口的,速度慢一點.聞亭也有類似的,價位差不多.合眾達(dá)也有LF2407 DSK初學(xué)者開發(fā)套,件報價1580,或2407應(yīng)用模板,2980.其它的如聞亭,瑞泰的功能價位都差不多.
0
回復(fù)
@luobing
我是搞電子、單片機(jī)的,現(xiàn)在也在學(xué)DSP
2.2 DSP芯片的基本結(jié)構(gòu)
為了快速地實現(xiàn)數(shù)字信號處理運算,DSP 芯片一般都采用特殊的軟硬件結(jié)構(gòu).下面以
TMS320 系列為例介紹DSP 芯片的基本結(jié)構(gòu).
TMS320 系列DSP 芯片的基本結(jié)構(gòu)包括:(1)哈佛結(jié)構(gòu);(2)流水線操作;(3)專用
的硬件乘法器;(4)特殊的DSP 指令;(5)快速的指令周期.
這些特點使得TMS320 系列DSP 芯片可以實現(xiàn)快速的DSP 運算,并使大部分運算(例
如乘法)能夠在一個指令周期內(nèi)完成.由于TMS320 系列DSP 芯片是軟件可編程器件,因
此具有通用微處理器具有的方便靈活的特點.下面分別介紹這些特點是如何在TMS320 系
列DSP 芯片中應(yīng)用并使得芯片的功能得到加強的.
為了快速地實現(xiàn)數(shù)字信號處理運算,DSP 芯片一般都采用特殊的軟硬件結(jié)構(gòu).下面以
TMS320 系列為例介紹DSP 芯片的基本結(jié)構(gòu).
TMS320 系列DSP 芯片的基本結(jié)構(gòu)包括:(1)哈佛結(jié)構(gòu);(2)流水線操作;(3)專用
的硬件乘法器;(4)特殊的DSP 指令;(5)快速的指令周期.
這些特點使得TMS320 系列DSP 芯片可以實現(xiàn)快速的DSP 運算,并使大部分運算(例
如乘法)能夠在一個指令周期內(nèi)完成.由于TMS320 系列DSP 芯片是軟件可編程器件,因
此具有通用微處理器具有的方便靈活的特點.下面分別介紹這些特點是如何在TMS320 系
列DSP 芯片中應(yīng)用并使得芯片的功能得到加強的.
0
回復(fù)
@luobing
2.2DSP芯片的基本結(jié)構(gòu)為了快速地實現(xiàn)數(shù)字信號處理運算,DSP芯片一般都采用特殊的軟硬件結(jié)構(gòu).下面以TMS320系列為例介紹DSP芯片的基本結(jié)構(gòu).TMS320系列DSP芯片的基本結(jié)構(gòu)包括:(1)哈佛結(jié)構(gòu);(2)流水線操作;(3)專用的硬件乘法器;(4)特殊的DSP指令;(5)快速的指令周期.這些特點使得TMS320系列DSP芯片可以實現(xiàn)快速的DSP運算,并使大部分運算(例如乘法)能夠在一個指令周期內(nèi)完成.由于TMS320系列DSP芯片是軟件可編程器件,因此具有通用微處理器具有的方便靈活的特點.下面分別介紹這些特點是如何在TMS320系列DSP芯片中應(yīng)用并使得芯片的功能得到加強的.
2.2.1 哈佛結(jié)構(gòu)
哈佛結(jié)構(gòu)是不同于傳統(tǒng)的馮·諾曼(Von Neuman)結(jié)構(gòu)的并行體系結(jié)構(gòu),其主要特點
是將程序和數(shù)據(jù)存儲在不同的存儲空間中,即程序存儲器和數(shù)據(jù)存儲器是兩個相互獨立的
存儲器,每個存儲器獨立編址,獨立訪問.與兩個存儲器相對應(yīng)的是系統(tǒng)中設(shè)置了程序總
線和數(shù)據(jù)總線兩條總線,從而使數(shù)據(jù)的吞吐率提高了一倍.而馮·諾曼結(jié)構(gòu)則是將指令、
數(shù)據(jù)、地址存儲在同一存儲器中,統(tǒng)一編址,依靠指令計數(shù)器提供的地址來區(qū)分是指令、
數(shù)據(jù)還是地址.取指令和取數(shù)據(jù)都訪問同一存儲器,數(shù)據(jù)吞吐率低.
在哈佛結(jié)構(gòu)中,由于程序和數(shù)據(jù)存儲器在兩個分開的空間中,因此取指和執(zhí)行能完全
重疊運行.為了進(jìn)一步提高運行速度和靈活性,TMS320 系列DSP 芯片在基本哈佛結(jié)構(gòu)的
基礎(chǔ)上作了改進(jìn),一是允許數(shù)據(jù)存放在程序存儲器中,并被算術(shù)運算指令直接使用,增強
了芯片的靈活性;二是指令存儲在高速緩沖器(Cache)中,當(dāng)執(zhí)行此指令時,不需要再從
存儲器中讀取指令,節(jié)約了一個指令周期的時間.如TMS320C30 具有64 個字的Cache.
哈佛結(jié)構(gòu)是不同于傳統(tǒng)的馮·諾曼(Von Neuman)結(jié)構(gòu)的并行體系結(jié)構(gòu),其主要特點
是將程序和數(shù)據(jù)存儲在不同的存儲空間中,即程序存儲器和數(shù)據(jù)存儲器是兩個相互獨立的
存儲器,每個存儲器獨立編址,獨立訪問.與兩個存儲器相對應(yīng)的是系統(tǒng)中設(shè)置了程序總
線和數(shù)據(jù)總線兩條總線,從而使數(shù)據(jù)的吞吐率提高了一倍.而馮·諾曼結(jié)構(gòu)則是將指令、
數(shù)據(jù)、地址存儲在同一存儲器中,統(tǒng)一編址,依靠指令計數(shù)器提供的地址來區(qū)分是指令、
數(shù)據(jù)還是地址.取指令和取數(shù)據(jù)都訪問同一存儲器,數(shù)據(jù)吞吐率低.
在哈佛結(jié)構(gòu)中,由于程序和數(shù)據(jù)存儲器在兩個分開的空間中,因此取指和執(zhí)行能完全
重疊運行.為了進(jìn)一步提高運行速度和靈活性,TMS320 系列DSP 芯片在基本哈佛結(jié)構(gòu)的
基礎(chǔ)上作了改進(jìn),一是允許數(shù)據(jù)存放在程序存儲器中,并被算術(shù)運算指令直接使用,增強
了芯片的靈活性;二是指令存儲在高速緩沖器(Cache)中,當(dāng)執(zhí)行此指令時,不需要再從
存儲器中讀取指令,節(jié)約了一個指令周期的時間.如TMS320C30 具有64 個字的Cache.
0
回復(fù)
@luobing
2.2.1哈佛結(jié)構(gòu)哈佛結(jié)構(gòu)是不同于傳統(tǒng)的馮·諾曼(VonNeuman)結(jié)構(gòu)的并行體系結(jié)構(gòu),其主要特點是將程序和數(shù)據(jù)存儲在不同的存儲空間中,即程序存儲器和數(shù)據(jù)存儲器是兩個相互獨立的存儲器,每個存儲器獨立編址,獨立訪問.與兩個存儲器相對應(yīng)的是系統(tǒng)中設(shè)置了程序總線和數(shù)據(jù)總線兩條總線,從而使數(shù)據(jù)的吞吐率提高了一倍.而馮·諾曼結(jié)構(gòu)則是將指令、數(shù)據(jù)、地址存儲在同一存儲器中,統(tǒng)一編址,依靠指令計數(shù)器提供的地址來區(qū)分是指令、數(shù)據(jù)還是地址.取指令和取數(shù)據(jù)都訪問同一存儲器,數(shù)據(jù)吞吐率低.在哈佛結(jié)構(gòu)中,由于程序和數(shù)據(jù)存儲器在兩個分開的空間中,因此取指和執(zhí)行能完全重疊運行.為了進(jìn)一步提高運行速度和靈活性,TMS320系列DSP芯片在基本哈佛結(jié)構(gòu)的基礎(chǔ)上作了改進(jìn),一是允許數(shù)據(jù)存放在程序存儲器中,并被算術(shù)運算指令直接使用,增強了芯片的靈活性;二是指令存儲在高速緩沖器(Cache)中,當(dāng)執(zhí)行此指令時,不需要再從存儲器中讀取指令,節(jié)約了一個指令周期的時間.如TMS320C30具有64個字的Cache.
2.2.2 流水線
與哈佛結(jié)構(gòu)相關(guān),DSP 芯片廣泛采用流水線以減少指令執(zhí)行時間,從而增強了處理器
的處理能力.TMS320 系列處理器的流水線深度從2~6 級不等.第一代TMS320 處理器采用
·12·
二級流水線,第二代采用三級流水線,而第三代則采用四級流水線.也就是說,處理器可
以并行處理2~6 條指令,每條指令處于流水線上的不同階段.圖2.1 所示為一個三級流水線
操作的例子.
圖2.1 三級流水線操作
在三級流水線操作中,取指、譯碼和執(zhí)行操作可以獨立地處理,這可使指令執(zhí)行能完
全重疊.在每個指令周期內(nèi),三個不同的指令處于激活狀態(tài),每個指令處于不同的階段.
例如,在第N 個指令取指時,前一個指令即第N-1 個指令正在譯碼,而第N-2 個指令則正
在執(zhí)行.一般來說,流水線對用戶是透明的.
與哈佛結(jié)構(gòu)相關(guān),DSP 芯片廣泛采用流水線以減少指令執(zhí)行時間,從而增強了處理器
的處理能力.TMS320 系列處理器的流水線深度從2~6 級不等.第一代TMS320 處理器采用
·12·
二級流水線,第二代采用三級流水線,而第三代則采用四級流水線.也就是說,處理器可
以并行處理2~6 條指令,每條指令處于流水線上的不同階段.圖2.1 所示為一個三級流水線
操作的例子.
圖2.1 三級流水線操作
在三級流水線操作中,取指、譯碼和執(zhí)行操作可以獨立地處理,這可使指令執(zhí)行能完
全重疊.在每個指令周期內(nèi),三個不同的指令處于激活狀態(tài),每個指令處于不同的階段.
例如,在第N 個指令取指時,前一個指令即第N-1 個指令正在譯碼,而第N-2 個指令則正
在執(zhí)行.一般來說,流水線對用戶是透明的.
0
回復(fù)
@luobing
2.2.2流水線與哈佛結(jié)構(gòu)相關(guān),DSP芯片廣泛采用流水線以減少指令執(zhí)行時間,從而增強了處理器的處理能力.TMS320系列處理器的流水線深度從2~6級不等.第一代TMS320處理器采用·12·二級流水線,第二代采用三級流水線,而第三代則采用四級流水線.也就是說,處理器可以并行處理2~6條指令,每條指令處于流水線上的不同階段.圖2.1所示為一個三級流水線操作的例子.圖2.1三級流水線操作在三級流水線操作中,取指、譯碼和執(zhí)行操作可以獨立地處理,這可使指令執(zhí)行能完全重疊.在每個指令周期內(nèi),三個不同的指令處于激活狀態(tài),每個指令處于不同的階段.例如,在第N個指令取指時,前一個指令即第N-1個指令正在譯碼,而第N-2個指令則正在執(zhí)行.一般來說,流水線對用戶是透明的.
2.2.3 專用的硬件乘法器
在一般形式的FIR 濾波器中,乘法是DSP 的重要組成部分.對每個濾波器抽頭,必須
做一次乘法和一次加法.乘法速度越快,DSP 處理器的性能就越高.在通用的微處理器中,
乘法指令是由一系列加法來實現(xiàn)的,故需許多個指令周期來完成.相比而言,DSP 芯片的
特征就是有一個專用的硬件乘法器.在TMS320 系列中,由于具有專用的硬件乘法器,乘
法可在一個指令周期內(nèi)完成.從最早的TMS32010 實現(xiàn)FIR 的每個抽頭算法可以看出,濾
波器每個抽頭需要一條乘法指令MPY:
LT ;裝乘數(shù)到T 寄存器
DMOV ;在存儲器中移動數(shù)據(jù)以實現(xiàn)延遲
MPY ;相乘
APAC ;將乘法結(jié)果加到ACC 中
其他三條指令用來將乘數(shù)裝入到乘法器電路( LT),移動數(shù)據(jù)(DMOV)以及將乘法
結(jié)果(存在乘積寄存器P 中)加到ACC 中(APAC).因此,若采用256 抽頭的FIR 濾波器,
這四條指令必須重復(fù)執(zhí)行256 次,且256 次乘法必須在一個抽樣間隔內(nèi)完成.在典型的通
用微處理器中,每個抽頭需要30 ~ 40 個指令周期,而TMS32010 只需4 條指令.如果采用
特殊的DSP 指令或采用 TMS320C54X 等新一代的DSP 芯片,可進(jìn)一步降低FIR 抽頭的計
算時間.
在一般形式的FIR 濾波器中,乘法是DSP 的重要組成部分.對每個濾波器抽頭,必須
做一次乘法和一次加法.乘法速度越快,DSP 處理器的性能就越高.在通用的微處理器中,
乘法指令是由一系列加法來實現(xiàn)的,故需許多個指令周期來完成.相比而言,DSP 芯片的
特征就是有一個專用的硬件乘法器.在TMS320 系列中,由于具有專用的硬件乘法器,乘
法可在一個指令周期內(nèi)完成.從最早的TMS32010 實現(xiàn)FIR 的每個抽頭算法可以看出,濾
波器每個抽頭需要一條乘法指令MPY:
LT ;裝乘數(shù)到T 寄存器
DMOV ;在存儲器中移動數(shù)據(jù)以實現(xiàn)延遲
MPY ;相乘
APAC ;將乘法結(jié)果加到ACC 中
其他三條指令用來將乘數(shù)裝入到乘法器電路( LT),移動數(shù)據(jù)(DMOV)以及將乘法
結(jié)果(存在乘積寄存器P 中)加到ACC 中(APAC).因此,若采用256 抽頭的FIR 濾波器,
這四條指令必須重復(fù)執(zhí)行256 次,且256 次乘法必須在一個抽樣間隔內(nèi)完成.在典型的通
用微處理器中,每個抽頭需要30 ~ 40 個指令周期,而TMS32010 只需4 條指令.如果采用
特殊的DSP 指令或采用 TMS320C54X 等新一代的DSP 芯片,可進(jìn)一步降低FIR 抽頭的計
算時間.
0
回復(fù)
@luobing
2.2.3專用的硬件乘法器在一般形式的FIR濾波器中,乘法是DSP的重要組成部分.對每個濾波器抽頭,必須做一次乘法和一次加法.乘法速度越快,DSP處理器的性能就越高.在通用的微處理器中,乘法指令是由一系列加法來實現(xiàn)的,故需許多個指令周期來完成.相比而言,DSP芯片的特征就是有一個專用的硬件乘法器.在TMS320系列中,由于具有專用的硬件乘法器,乘法可在一個指令周期內(nèi)完成.從最早的TMS32010實現(xiàn)FIR的每個抽頭算法可以看出,濾波器每個抽頭需要一條乘法指令MPY:LT;裝乘數(shù)到T寄存器DMOV;在存儲器中移動數(shù)據(jù)以實現(xiàn)延遲MPY;相乘APAC;將乘法結(jié)果加到ACC中其他三條指令用來將乘數(shù)裝入到乘法器電路(LT),移動數(shù)據(jù)(DMOV)以及將乘法結(jié)果(存在乘積寄存器P中)加到ACC中(APAC).因此,若采用256抽頭的FIR濾波器,這四條指令必須重復(fù)執(zhí)行256次,且256次乘法必須在一個抽樣間隔內(nèi)完成.在典型的通用微處理器中,每個抽頭需要30~40個指令周期,而TMS32010只需4條指令.如果采用特殊的DSP指令或采用TMS320C54X等新一代的DSP芯片,可進(jìn)一步降低FIR抽頭的計算時間.
2.2.4 特殊的DSP指令
DSP 芯片的另一個特征是采用特殊的指令.2.2.3 節(jié)中介紹的DMOV 就是一個特殊的
DSP 指令,它完成數(shù)據(jù)移位功能.在數(shù)字信號處理中,延遲操作非常重要,這個延遲就是
由DMOV 來實現(xiàn)的.TMS32010 中的另一個特殊指令是LTD,它在一個指令周期內(nèi)完成LT、
CLKOUT1
執(zhí)行
譯碼
取指
N
N-1
N-2
N+1
N-1
N+2
N
N
N+1
·13·
DMOV 和APAC 三條指令.LTD 和MPY 指令可以將FIR 濾波器抽頭計算從4 條指令降為
2 條指令.在第二代處理器中,如TMS320C25,增加了2 條更特殊的指令,即RPT 和MACD
指令,采用這2 條特殊指令,可以進(jìn)一步將每個抽頭的運算指令數(shù)從2 條降為1 條:
RPTK 255 ;重復(fù)執(zhí)行下條指令256 次
MACD ;LT, DMOV, MPY 及 APAC
2.2.5 快速的指令周期
哈佛結(jié)構(gòu)、流水線操作、專用的硬件乘法器、特殊的DSP 指令再加上集成電路的優(yōu)化
設(shè)計,可使DSP 芯片的指令周期在200ns 以下.TMS320 系列處理器的指令周期已經(jīng)從第
一代的200ns 降低至現(xiàn)在的20ns 以下.快速的指令周期使得DSP 芯片能夠?qū)崟r實現(xiàn)許多
DSP 應(yīng)用.
DSP 芯片的另一個特征是采用特殊的指令.2.2.3 節(jié)中介紹的DMOV 就是一個特殊的
DSP 指令,它完成數(shù)據(jù)移位功能.在數(shù)字信號處理中,延遲操作非常重要,這個延遲就是
由DMOV 來實現(xiàn)的.TMS32010 中的另一個特殊指令是LTD,它在一個指令周期內(nèi)完成LT、
CLKOUT1
執(zhí)行
譯碼
取指
N
N-1
N-2
N+1
N-1
N+2
N
N
N+1
·13·
DMOV 和APAC 三條指令.LTD 和MPY 指令可以將FIR 濾波器抽頭計算從4 條指令降為
2 條指令.在第二代處理器中,如TMS320C25,增加了2 條更特殊的指令,即RPT 和MACD
指令,采用這2 條特殊指令,可以進(jìn)一步將每個抽頭的運算指令數(shù)從2 條降為1 條:
RPTK 255 ;重復(fù)執(zhí)行下條指令256 次
MACD ;LT, DMOV, MPY 及 APAC
2.2.5 快速的指令周期
哈佛結(jié)構(gòu)、流水線操作、專用的硬件乘法器、特殊的DSP 指令再加上集成電路的優(yōu)化
設(shè)計,可使DSP 芯片的指令周期在200ns 以下.TMS320 系列處理器的指令周期已經(jīng)從第
一代的200ns 降低至現(xiàn)在的20ns 以下.快速的指令周期使得DSP 芯片能夠?qū)崟r實現(xiàn)許多
DSP 應(yīng)用.
0
回復(fù)
@luobing
2.2.4特殊的DSP指令DSP芯片的另一個特征是采用特殊的指令.2.2.3節(jié)中介紹的DMOV就是一個特殊的DSP指令,它完成數(shù)據(jù)移位功能.在數(shù)字信號處理中,延遲操作非常重要,這個延遲就是由DMOV來實現(xiàn)的.TMS32010中的另一個特殊指令是LTD,它在一個指令周期內(nèi)完成LT、CLKOUT1執(zhí)行譯碼取指NN-1N-2N+1N-1N+2NNN+1·13·DMOV和APAC三條指令.LTD和MPY指令可以將FIR濾波器抽頭計算從4條指令降為2條指令.在第二代處理器中,如TMS320C25,增加了2條更特殊的指令,即RPT和MACD指令,采用這2條特殊指令,可以進(jìn)一步將每個抽頭的運算指令數(shù)從2條降為1條:RPTK255;重復(fù)執(zhí)行下條指令256次MACD;LT,DMOV,MPY及APAC2.2.5快速的指令周期哈佛結(jié)構(gòu)、流水線操作、專用的硬件乘法器、特殊的DSP指令再加上集成電路的優(yōu)化設(shè)計,可使DSP芯片的指令周期在200ns以下.TMS320系列處理器的指令周期已經(jīng)從第一代的200ns降低至現(xiàn)在的20ns以下.快速的指令周期使得DSP芯片能夠?qū)崟r實現(xiàn)許多DSP應(yīng)用.
TI 公司目前比較流行的定
點DSP 芯片是TMS320C2XX、TMS320C54X、TMS320C62X 等
點DSP 芯片是TMS320C2XX、TMS320C54X、TMS320C62X 等
0
回復(fù)