專利名稱:減小的并行和流水線化的高階mimo lmmse接收器架構的制作方法
技術領域:
本發明主要地涉及用于使用多個發射天線和/或多個接收天線的擴頻通信系統的接收器和有關方法,并且特別地涉及使用比如基于線性最小均方誤差(LMMSE)的均衡器這樣的均衡器的接收器。
背景技術:
在發射器側和接收器側都使用多個天線的MIMO(多輸入多輸出)技術近來已經作為現代通信中最重要的技術突破之一而出現。原先的MIMO稱為D-BLAST(見G.J.Foschini,″Layered space-timearchitecture for wireless communication in a fadingenvironment when using multielement antennas″,Bell Labs Tech.J.,pp.41-59,1996),以及一種通過復雜度與性能之間的合理權衡來進行無效和消除的更現實的策略稱為V-BLAST(見G.D.Golden,J.G.Foschini,R.A.Valenzuela和P.W.Wolniansky,″DETECTIONALGORITHM AND INITIAL LABORATORY RESULTS USING V-BLASTSPACE-TIME COMMUNICATION ARCHITECTURE″,Electron.Lett,Vol35,pp.14-15,Jan.1999)。
原先的MIMO空間多路復用是針對窄帶和平坦衰落信道而提出的。在多徑衰落信道中,擴頻碼的正交性將被破壞并且引入了多址干擾(MAI)以及符號間干擾。利用很短的擴頻增益,常規瑞克接收器不能提供可接受的性能。基于LMMSE(線性最小均方誤差)的碼片均衡器有希望恢復擴頻碼的正交性以便抑制ISI和MAI。然而,LMMSE均衡器涉及到一般復雜度為0((NF)3)的大型相關矩陣的求逆,其中N是Rx天線的數目而F是信道長度。這對于硬件實施而言非常昂貴。
早先用任一如下框架來解決碼片均衡器問題
(i)自適應隨機梯度算法如LMS;(ii)共軛梯度算法;以及(iii)基于FFT的MIMO碼片均衡器。
選項(i)的算法受制于穩定性問題,因為收斂依賴于良好步長大小的選擇(見M.J.Heikkila,K.Ruotsalainen和J.Lilleberg,″SPACE-TIME EQUALIZATION USING CONJUGATE-GRADIENT ALGORITHMIN WCDMA DOWNLINK″,IEEE Proceeding in PIMRC,pp.673-677,2002)。選項(ii)的算法根據Levinson和Shur表現出O((NF)2)階的復雜度。對于選項(iii),基于FFT的均衡器將(NF×NF)矩陣求逆減少到大小為(N×N)的LF個子矩陣求逆(見J.Zhang,T.Bhatt,G.Mandyam,″EFFICENT L1NEAR EQUALIZATION FOR H1GHDATA RATE DOWNLINK CDMA SIGNALING″,Proceeding of IEEEAsilomar Conference on Signals,systems and Computers,2003)。
Zhang,Bhatt,Mandyam提出的上述基于FFT的快速算法使用了相關矩陣的帶狀托普利茨結構。雖然此基于FFT的算法避免了對維度為NF×NF的原相關矩陣的求逆,但是發明人認為一些矩陣求逆對于MIMO接收器在所難免。對于具有高維度的MIMO接收器,MIMO接收器的復雜度隨著天線的數目顯著地增加。感興趣的主要運算是針對過采樣因子為2的1×4、2×4和4×4MIMO配置或者1×2、2×2接收器的在頻域中的多個4×4矩陣求逆這一架構。這是因為這些有望最有可能在不遠的將來加以部署。接收器必須嵌入到便攜設備中這一事實使得低復雜度移動接收器的設計對于低成本產品的普遍商業部署而言至關重要。出于實踐考慮,有必要確定哪一矩陣求逆架構的范圍最適合于VLSI實施。
本領域中所需的是一種用于在保持于便攜無線設備、移動臺如移動電話、具有雙向通信的PDA、個人因特網接入設備和其它此類裝置所施加的約束內的同時減少MIMO系統中接收器復雜度的接收器架構和相應的方法。
發明內容
本發明是一種用于恢復多徑信道信號中擴頻碼正交性的方法和LMMSE接收器。通過對大小為N×N的數個子矩陣求逆來避免現有技術的整個NF×NF矩陣的求逆,其中N是接收天線的數目而F是信道長度參數。以厄密優化和樹修剪來減少常規FFT設計模塊的數目和復雜度,并且進一步簡化子矩陣的求逆。
本發明在一個方面為包括從一連串子矩陣E的求逆中生成濾波器系數w集的裝置的均衡器。子矩陣各自的大小不大于2×2,并且各自代表用于通過多徑信道接收的擴頻信號的近似相關矩陣Crr的元素。
在另一方面中,本發明是一種具有基于線性最小均方誤差LMMSE的碼片級均衡器的擴頻接收器。該均衡器包括有限沖激響應FIR濾波器,該濾波器耦合到協方差估計器和抽頭求解器的輸出,該協方差估計器和抽頭求解器可操作用以將塊循環矩陣Crr的經傅立葉變換和求逆的子矩陣元素與經傅立葉變換的信道矩陣H進行組合。該塊循環矩陣Crr是相關矩陣Rrr的近似。
在另一方面中,本發明是一種具有協方差估計器和抽頭求解器裝置的均衡器。這些裝置具有耦合到有限沖激響應濾波器裝置的輸出,并且用于對塊循環矩陣Crr的子矩陣元素執行快速傅立葉變換FFT和求逆而對信道矩陣H執行傅立葉變換。同上,塊循環矩陣Crr是相關矩陣Rrr的近似。協方差估計器和抽頭求解器裝置還用于將經傅立葉變換和求逆的子矩陣與經傅立葉變換的信道矩陣進行組合。這些裝置對不大于2×2的矩陣求逆。
在另一方面中,本發明是一種用以從多徑信道接收信號的方法。該方法包括以至少兩個接收天線來接收所述信號;以及通過將經傅立葉變換的信道矩陣與塊循環矩陣Crr的經傅立葉變換和求逆的子矩陣元素進行組合來均衡所接收的信號,該塊循環矩陣Crr是相關矩陣Rrr的近似。
本發明的其它方面包括使計算處理流線化(streamline)、使用于各種濾波器系數的計算并行化以及使各種參數在時間上流水線化以減少數據路徑長度和消除重復計算。
參照與附圖相結合的如下描述,本發明的實施例的這些及其它特征、方面和優點將變得明顯。然而將理解到附圖僅僅是為了對本發明進行說明的目的而設計的,不應理解為對本發明進行限制的限定。
下文更具體地參照除有規定之外未按比例繪制的以下附圖來描述本發明。
圖1是MIMO多碼CDMA下行鏈路的系統模型。
圖2是LMMSE碼片均衡器的框圖。
圖3是基于FFT的MIMO均衡器抽頭求解器的VLSI架構的框圖。
圖4是合并式2×2矩陣求逆和信道乘法的經厄密優化的數據路徑。
圖5(a)是分割式4×4矩陣求逆的數據依賴路徑。
圖5(b)是經厄密優化的4×4矩陣求逆的數據依賴。
圖6是使用通用設計模塊T、M和HINV的VLSI設計架構。
圖7是M(A,B)處理單元的并行VLSIRTL架構布局。
圖8是T(A11,A21,A22)設計塊的RTL架構布局。
具體實施例方式
這里使用如下縮寫詞LMMSE線性最小均方誤差;CDMA碼分多址;SIMO單輸入多輸出;MIMO多輸入多輸出;FPGA現場可編程門陣列;VLSI超大規模集成電路;
ASIC專用集成電路;RTL寄存器傳送層;DSP數字信號處理;FFT快速傅立葉變換如這里所用,除非另有具體指明,術語CDMA通指擴頻通信系統(例如CDMA 2000)。運算符[]T和[]*指示了轉置,而運算符[]H指示了本領域中已知的厄密運算。概括言之,本發明是一種復雜度減少的基于FFT的線性均衡器并且還包括一種用于所提出的MIMO接收器的完整并行VLSI架構。為了進一步減少復雜度,公開了利用相關系數和FFT算法結構的厄密優化。然后在子矩陣的求逆中應用厄密特征。減少狀態的FFT模塊避免對稱系數和零系數的重復計算,由此減少常規FFT設計模塊的數目和復雜度。
特別感興趣的是在基于FFT的碼片均衡器抽頭求解器中的分割式4×4子矩陣和通用RTL方案。4×4子矩陣被分割成4個2×2子矩陣以便更好地適應于移動設備。然后通過探求分割式4×4求逆中的共性來顯著地簡化4×4矩陣求逆。根據特殊設計塊導出通用架構以消除復數運算中的冗余度。經調節的模型有助于高效并行VLSI模塊如“復數-厄密-乘法”、“厄密求逆”和“對角變換”的設計。這促成在復雜度上節省3x的高效架構以及更為并行和流水線化的RTL方案,這在FPGA原型平臺中得到驗證。此方法的可能應用包括符合1X EV-DV或者MIMO-HSDPA標準的下行鏈路CDMA移動設備。
在圖1中描述了使用空間多路復用的MIMO多碼CDMA下行鏈路系統10。在系統10中應用數目為M的發射(Tx)天線12和數目為N的接收(Rx)天線14,其中通常M≤N。在多碼CDMA系統中,多個擴頻碼被分配給單個用戶以實現高的數據速率。首先,在解多路復用器塊16中將高數據速率符號解多路復用成K*M個較低速率的子流,其中K是系統中用于數據傳輸的擴頻碼的數目。子流被分解成M組,其中組中的各子流在關聯擴頻器18中以擴頻增益為G的擴頻碼來擴頻。子流組然后在求和節點20被組合并且在擾頻器22以長擾碼來進行擾頻而且經由信道26通過第m個Tx天線12被發射到接收器24。在第m個發射天線處的碼片級信號給定如下dm(i)=Σk-1Ksmk(j)·cmk[i]+smP(j)·cmP[i],---[1]]]>其中j是符號索引,i是碼片索引,而k是復合擴頻碼的索引。smk[j]是第m個子流處第k個碼的第j個符號。在下文中著重于第j個符號索引而省略該索引以求簡明。cmk[i]=ck[i]cm(s)[i]]]>是用于第m個子流處第k個碼的復合擴頻碼序列,其中ck[i]是用戶特定的(user specific)哈達馬擴頻碼,而cm(s)[i]是天線特定的(antenna specific)擾頻長碼。smP[j]標示了第m個天線處的導頻符號。cmP[i]=cP[i]cm(s)[i]]]>是用于第m個天線處導頻符號的復合擴頻碼。在第n個Rx天線處接收的碼片級信號給定如下rn(i)=Σm=1MTΣr=0Lm,nhm,n(l)dm(i-τ1)+z(i),---(2)]]>其中信道通過如下信道矩陣來表征,該信道矩陣具有從第m個Tx天線與第n個Rx天線之間的信道系數中獲得的元素hm,n(t)=Σl=0Lm,nhm,n(l)δ(t-τm,n,l).---[3]]]>與符號采樣相對照,‘碼片’級信號是指擴頻碼所擴頻的碼片采樣。在擴頻系統中,碼片均衡器充當前端(其中采樣通過擴頻碼來擴頻)或者應對多徑信道效應。在典型接收器中,解擴器在碼片均衡器之后,用以在解擴之后檢測單獨符號。通過在向量r‾(i)=[r1(i),...rn(i),...rN(i)]T]]>中封裝來自所有接收天線的接收碼片并且收集LF=2F+1個連續碼片(通常,中心位于所有N個Rx天線的第i個碼片處),將信號矩陣形成為r‾A(i)=[r‾(i+F)T,...r‾(i)T,...r‾(i-F)T]T]]>(其中在字母標志符如X上方的字符 用來代表矩陣)。在向量形式下,接收信號可以給定如下r‾‾A‾(i)=Σm=1MH‾md‾m(i)---[4]]]>其中 是根據信道系數構造的塊托普利茨矩陣。多個接收天線的信道向量定義為h‾(l)=[hm,l(l),...hm,n(l),...hm,N(l)]T.]]>用于第m個發射天線的發射碼片向量給定為d‾M(l)=[dm,l(i+F),...dm,n(i),...dm,N(i-F-L)]T.]]>多個Tx天線的使用顯著地增加頻譜效率。可實現的數據速率隨著Tx天線的數目幾乎線性地增加。對于滿負荷系統(M+K=G),可實現的比特率取決于Tx天線配置、調制方案和碼片速率。表I給出了對于擴頻因子(SF)為G=16和碼片速率為3.84MHz的不同數目的發射天線而言可實現的聚集未編碼數據速率。
表I可實現的未編碼數據速率(Mbps)碼片級均衡已經是單用戶CDMA下行鏈路中最有前途的接收器之一。如圖2中所示,接收器24中的碼片級均衡器28以抽頭求解器30進行操作并且輸出碼片級均衡信號到解擾器/解擴器32(表示為一個功能塊,但是在實踐中可以分解成兩個或者更多),該解擾器/解擴器又輸出到解交織器/解碼器(在非限制性說明中也表示為一個功能塊)。碼片級均衡器28按照線性FIR濾波器系數集估計發射碼片采樣如下d‾^m(i)=w-^mHr‾‾A[i]---[5]]]>當前研究包括兩種主要的均衡方式,即非自適應線性均衡器和自適應線性均衡器。非自適應線性均衡器通常假設觀察窗中信道26的平穩性并且以比如LMMSE或者迫零這樣的標準來設計均衡器28。眾所周知,LMMSE求解給定如下w‾^mops=argminE[||d←m(i)-w‾^mHr‾‾A[i]||2],---[6]]]>=σd2(i)R‾w(i)-1E[r‾‾A[i]d‾‾mH(i)]]]>其中相關矩陣在遍歷性的假設下按照時間平均給定如下R‾rr=E[r‾‾A[i]r‾‾mH(i)]=1NΣi=0N-1r‾‾A(i)r‾‾A(i)---[7]]]>而使用導頻符號將信道系數估計為h‾^m=E[r‾‾A[i]d‾‾mH(i)].]]>在HSDPA標準中,總發射功率的約10%專用于公用導頻信道(CPICH)。這將提供準確的信道估計。
使用信道的平穩性以及卷積性質,容易表明相關矩陣是帶狀塊托普利茨矩陣 其中 是具有相關系數的N×N塊矩陣。表明了在添加兩個如下拐角矩陣之后可以通過塊循環矩陣來對相關矩陣 進行近似 使用對角化定理的擴展,塊循環矩陣可以分解如下C‾rr(D‾H⊗I‾)(Σi=0LF-1W‾t⊗E‾[i])(D‾H⊗I‾),---[8]]]>其中W‾=diag(1,WLF-1,...,WLF-(LF-1))]]>和WLF=ej(2π/LF)]]>是用于DFT計算的相位因子系數。運算符_標示了克羅內克爾積,而 是DFT矩陣。對于MIMO系統,可以表明MIMO均衡器抽頭可以以如下等式來計算w‾^mops=(D‾H⊗I‾)·F‾-1·(D‾⊗I‾).---[9]]]>F‾=diag(F‾0,F‾1,...,F‾LF)]]>是塊對角矩陣,該矩陣具有從循環矩陣第一列的逐元素FFT獲得的元素。對于M×NMIMO系統,這將(NLFxNLF)矩陣的求逆減少到大小為N×N的子塊矩陣的求逆。
系統級流水線為了實現實時實施,可以應用DSP處理器或者VLSI架構。移動設備的有限硬件資源和電源通常使硬件設計更具挑戰性,尤其對于MIMO系統更是如此。然而,簡單的實施在計算上具有多個冗余度。需要多個優化以更適合于實時實施。在架構、系統分割與流水線之間的交互著重于如下目標1)減少的計算復雜度;2)最少的硬件資源;3)用于關鍵計算部分的并行和流水線架構。
為了探求高效架構,詳述任務如下·計算獨立相關元素 并且通過添加拐角元素來形成循環 的第一塊列為C‾rr(1)=[E‾
,...,E‾[L],0,...,0,E‾H[L],...,E‾H[1]]T.]]>各元素是N×N子塊矩陣。
·獲得 元素向量F‾n1,n2=FFT{E‾n1,n2(c)}]]>的逐元素FFT,其中E‾n1,n2(c)[i]=C‾rr(1)[(n1-i-1)*N+n2-1],]]>i=
,n1,n2∈[1,N]。
·對于m=[1,M],計算信道估計的逐維度FFT如下Φ‾m=(D‾⊗I‾)h‾^m=FFT(
]>n∈[1,N]·計算N×N子矩陣 的逆,其中F‾[i]-1=diag(F‾
-1,...,F‾[LF-1]-1).]]>·計算信道估計系數的FFT輸出與子矩陣的逆的矩陣乘法Ψ‾m=P‾-1Φ‾m.]]>·計算矩陣乘法結果的逐維度IFFTw‾^mopt=(D‾H⊗I‾)Ψ‾m.]]>利用時序和數據依賴分析,在圖3的框圖中示出了用于接收器24的MIMO均衡器28的頂級設計塊,該圖還示出了虛線塊內的抽頭求解器30。系統級流水線是為求更佳模塊性而設計的。相關估計塊36在一個數據路徑40a上從用于各碼片的接收天線14獲取多個輸入采樣以計算 第一列的相關系數。通過在 矩陣估計塊38中添加拐角以形成矩陣 使之循環。完整系數被寫到DPRAM 42(存儲介質),而N×N逐元素FFT模塊44計算[F‾
,...,F‾[LF]]=FFT{[E‾
,...,E‾[L],o,...o,E‾[L]H,...,E[1]H]}]]>另一并行數據路徑40b用于信道估計以及如 中那樣的對信道系數向量的M×N逐維度FFT。來自并行數據路徑40b的導頻符號用來在信道估計塊44估計信道。這些在信道矩陣塊46中組成對整個信道進行估計的矩陣,在另一FFT模塊48獲得該矩陣的FFT。子矩陣求逆和乘法塊52從DPRAM 42獲取信道和相關的FFT系數并且如 中那樣進行計算。
最后,M×N逐維度IFFT模塊54為均衡器抽頭 生成結果并且將它們發射到M×N MIMO FIR塊56以供濾波。為了反映正確時序,在前端的相關模塊36和信道估計模塊46將在吞吐模式下針對流傳輸輸入采樣進行工作。虛線塊中的FFT/IFFT模塊(44,50,54)構造抽頭求解器30的后處理。它們適合于使用雙點RAM塊而在塊模式下工作來傳送數據。MIMO FIR濾波56也將在吞吐模式下針對緩存的流傳輸輸入數據進行工作。
厄密優化和減少狀態的FFT根據相關矩陣的循環特征,可以用如下引理來減少FFT計算的復雜度。定義相關矩陣的逐元素FFT為{E‾[1]⇒FFT[F‾i,j[1:LF]]N=N.]]>對于SIMO和MIMO情況,循環相關系數向量的逐元素FFT結果通過使用FFT計算的特征來允許厄密結構。厄密特征按照如下引理來給出。
引理1F‾i,j=conj(F‾i,j).]]>因此 的計算對于j<i是冗余的。
引理2由于 的虛部等于0,所以 的計算可以減少到全DFT的僅L/LF。與 有關的計算也減少到實數運算,節省了50%的復雜度。由于FFT算法應用了旋轉系數的特征,所以引理2中厄密特征的應用并不簡單。利用基于標準時間抽選(DIT)FFT算法的修剪運算可以導出針對減少狀態的FFT(RS-FFT)的面向硬件的優化。不同類型的蝴蝶單元基于輸出系數的特征而有差別,而在蝴蝶樹中修剪不必要的計算分支。注意到在標準蝴蝶單元中,各運算涉及到具有四次實數乘法和兩次實數加法的完全復數乘法。修剪增加了減少狀態FFT架構的效率。雖然當FFT的數目增加到很大數目時使節省有減少,但是對于均衡器應用,FFT的長度保持于64點FFT的范圍。RS-FFT節省了實數乘法的大致50%。本發明的某些方面利用厄密特征并且著重于塊抽頭求解器中逐元素FFT模塊之后矩陣求逆和乘法模塊的優化。
厄密矩陣求逆架構雖然基于FFT的抽頭求解器避免了維度為NF×NF的原相關矩陣的直接矩陣求逆,但是對角矩陣 的求逆在所難免。對于具有高接收維度的MIMO接收器, 中的矩陣求逆和乘法并非微不足道。由于 矩陣的對角特征,所以它可以如F‾-1=diag(F‾0-1,F‾1-1,...,F‾LF-1-1)]]>中那樣劃分成大小為N×N的LF個子矩陣的逆。使用高斯消除的傳統N×N矩陣求逆具有O(N3)復數運算的復雜度。根據第IV部分的厄密引理,不言而喻 的元素也是厄密對稱的。關于厄密本征值分解有引理如下如果A‾∈C‾RDT]]>使得A‾=A‾H,]]>則存在酉矩陣U‾∈C‾RDT,]]>使得U‾HA‾U‾=Λ‾,]]>其中 是 的本征值的對角矩陣。Cholesky分解可以用來幫助這些矩陣的求逆。然而,此方法要求由于它們的復雜度而在硬件中優選為加以避免的算數平方根運算。如下具體描述單獨地考慮兩種特殊情況,即兩個Rx天線和四個Rx天線,因為這些是最有可能被廣泛采用的。將這些教導適應于不同數目的Rx天線在邏輯上是相符的。示出了基于塊分割的探求、適合于VLSI(超大規模)實施的復雜度減少方案和高效架構。提取分割式塊矩陣求逆的共性以設計用于可再次使用的模塊性的通用RTL模塊。通過再次使用2×2塊分割來設計4×4接收器。
雙天線MIMO/ST接收器根據等式[9],簡單的分割在于針對 的矩陣求逆、然后是 和信道系數逐維度FFT的矩陣乘法。在這一分割中,先計算 中整個子塊矩陣的求逆,然后是矩陣乘法。然而,此分割涉及到兩個單獨的循回結構。由于兩個步驟具有同一循回結構,所以更希望合并這兩個步驟并且減少開銷。2×2子矩陣的求逆給定如下F‾-1=f0,0(k)f0,1(k)f1,0(k)f1,1(k)-1---[10]]]>=1f0,0(k)*f1,1(k)-f0,1(k)*f1,0(k)f1,1(k)-f0,1(k)-f1,0(k)f0,0(k).]]>令Γ‾=(D‾⊗I‾)h‾=[Γ‾0Γ‾1...Γ‾LF-1],]]>其中Γ‾k=[γ1(k)γ2(k)]]]>是逐維度FFT系數的第k個元素的組合,然后矩陣求逆和乘法的合并運算給定如下G‾=F‾-1·(D‾⊗I‾)h‾]]>=diag(F‾0-1,F‾1-1,,...,FLF-1-1)Γ‾---[11]]]>=[F‾0-1Γ‾0T,F‾1-1Γ‾1T,...,F‾LF-1-1Γ‾LF-1T]T]]>因此單個合并循回可以用來計算 的最終結果而不是使用單獨的循回。然而,利用 的厄密特征,可以減少矩陣求逆和乘法模塊中實數運算的次數。這是在實數、半復數和復數乘法/加法的區別之下來自引理1和引理2中特征的直接結果。它也得到如下所示用于矩陣G第k個元素的簡化等式W‾(k)=1f0,0(k)·f1,1(k)-|f0,1(k)|2f1,1(k)oγ1(k)-f0,1(k)*γ2(k)f0,0(k)oγ2(k)-f0,1(k)a*γ1(k)---[12]]]>其中“a·b”意味著“實數×實數"乘法;“aob”意味著“實數×復數”乘法,而“a*b”意味著“復數×復數”乘法。復數除法為實數除法所取代。據此導出如圖4中所示具有厄密優化的簡化數據路徑。在這一圖中,f0,0(k)和f1,1(k)是實數。單個乘號意味著實數乘法。帶圓圈的乘號意味著“實數×復數”乘法,而帶矩形的乘號是“復數×復數”乘法。
根據圖4不言而喻數據路徑與現有技術的完全DMI相比顯著地簡化。這有助于定點實施中的縮放并且由此增加算法的穩定性。復雜度比較如下。基于所有復數的原矩陣求逆和乘法具有10次復數乘法+2次實數乘法。這對于一次循回就是42次實數乘法。對于FFT長度為32的塊,將有42*32=1344次實數乘法。在簡化的數據路徑中有2次復數乘法+5次半復數乘法+1次實數乘法。這在各循回中等于19次實數乘法或者在一個塊中等于608次實數乘法。注意也減少了對于來自逐元素FFT的接口的存儲。節省了用于Im(f0,0),Im(f1,1),Re(f0,0)和Re(f1,1)的四個分布DPRAM。
具有4個Rx天線的接收器這包括1×4、2×4、4×4 SIMO和MIMO場合。注意到過采樣的接收器分集也具有同一數學格式。因此這也可以是過采樣因子為2的2個接收天線的情況。感興趣的主要運算是4×4矩陣(其在N=2且過采樣因子為2時出現)的求逆,所以有必要確定哪一可能矩陣架構的范圍最適合于此應用。除最小化所用電路面積之外,該設計需要在短的時間預算內工作。用于此部分的高效計算架構節省了面積和時間資源。從一開始將 中的4×4子矩陣分割成2×2塊子矩陣如下
F‾[i]4x4=f11[i]f12[i]f13[i]f14[i]f21[i]f22[i]f23[i]f24[i]f31[i]f32[i]f33[i]f34[i]f41[i]f42[i]f43[i]f44[i]=B‾11[i]B‾12[i]B‾21[i]B‾22[i]i---[13]]]>4×4矩陣的求逆可以通過四個2×2子矩陣的順序求逆來進行。為求簡明,將4×4元素矩陣求逆分割為F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i].]]>可以表明子塊按照如下等式來給定C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i].C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1---[14]]]>不考慮數據依賴,簡單的計算將具有大小都為2×2的八次復數矩陣乘法、兩次復數矩陣求逆和兩次復數矩陣減法。但是這并不是很有效。考察數據依賴表現了數據路徑中的一些重復運算。對于不考慮 矩陣的厄密結構這一普通情況,可以表明順序計算具有圖5a所給定的數據流的依賴路徑。原始復雜度給定如下六次矩陣乘法、兩次求逆和兩次減法。根據數據路徑流可以標識關鍵路徑。
現在 矩陣的厄密結構用來導出更為并行和優化的計算架構。由于厄密矩陣的逆是厄密共軛,即F‾-1=[F‾-1]H,]]>可以表明B‾11-1[i]=[B‾11-1]HB‾12-1[i]=[B‾21-1]HB‾22-1[i]=[B‾22-1]H⇒C‾11-1[i]=[C‾11-1]HC‾12-1[i]=[C‾21-1]H.C‾22-1[i]=[C‾22-1]H]]>這通過去除具有厄密關系的重復計算塊來得到數據路徑。在圖5(b)中示出了減少的數據路徑,其中HINV意味著2×2厄密矩陣的求逆,而[]H是2×2矩陣的厄密運算。此數據路徑可以稱為分割式4×4矩陣求逆的簡單厄密優化架構。
然而,此簡單的處理沒有得到最高效的計算架構。數據路徑仍然是以很長的依賴路徑來構造的。為了完全提取共性并且調節VLSI中的設計塊,為不同類型的復數計算來定義對2×2矩陣的如下特殊運算符。這些特殊運算符將映射到VLSI處理單元(PU)以處理厄密矩陣的特殊特征。通過提取數據路徑之中的共性來實現高級模塊性。
·定義1“pPow(ab)=Re(a).Re(b)+Im(a).Im(b)”定義為兩個復數的偽冪函數,而“Re(a,b)=Re(a).Re(b)-Im(a).Im(b)”定義為復數乘法的實部。
·定義2對于一般2×2矩陣 和厄霧2×2矩陣B‾=B‾H,]]>定義運算符CHM(復數-厄密-乘法)為M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>注意到除 之外所有數都是復數。
·定義3對于2×2厄密矩陣B‾=b11b21*b21b22=B‾H,]]>定義厄密求逆(HInv)運算符為HInv(B‾)=1(b11b22-|b21|2b22-b21*-b21b11.]]>此設計可以通過簡單的實數乘法和除法而不是復數乘法和除法來實現。
·定義4將劃分為四個子塊的4×4厄密 給定為A‾=A‾11A‾21*A‾21A‾22=A‾H,]]> 的DT(對角變換)定義如下T(A‾)=T(A‾11,A‾21,A‾22)]]>=A‾22-A‾21A‾13A‾21H---[15]]]>=A‾22-M(A‾21,A‾11)A‾21H]]>利用這些定義,將4×4厄密矩陣F‾=F‾H]]>的求逆調節成對2×2矩陣的簡化運算。在一些操縱之后,分割的子塊計算等式可以使用所定義的運算符來映射到如下過程。
(1):B‾inv=Hinv(B‾11)=B‾invH;]]>(2):D‾=M(B‾21,B‾inv);]]>(3):C‾22=Hinv(T(B‾inv,B‾21,B‾22);]]>(4):C‾12=-M(D‾H,C‾22);becauseC‾12=C‾21H=-(C‾22D‾)H=-D‾HC‾22]]>(5):C‾11[i]=Binv+D‾HC‾22D‾=T(-C‾22,D‾H,B‾inv)]]>這得到了使用圖6中通用處理單元的硬件映射,該圖表現了總體計算復雜度是2HInv次運算、2次DT和1個額外的CHM塊。由于符號反相符和厄密格式化符[]H完全沒有硬件資源,所以計算復雜度取決于三個通用塊。計算的數據路徑表明不同設計模塊之間的時序關系。此調節塊圖有助于設計高效并行VLSI模塊,下文給出其細節。
并行架構模塊現在導出用于普通 和 運算的高效設計模塊。為了提取共性和減少冗余度,需要探求通用運算中涉及到的基本計算的時序關系。由于在 變換中嵌入了運算 ,所以需要以去除重復計算和再次使用高效計算架構的方式來設計接口。計算的分組和對臨時寄存器的巧妙使用將消除冗余度并且賦予到設計模塊的簡單和通用的接口。對于單個 模塊,令D‾=d11d12d21d22=M(A‾,B‾)=a11ob11+a11*b12a11*b21*+a12ob22a21ob11+a22*b21a21*b11*+a22ob22.]]>為了提取 和 運算中的共性,具有用于厄密矩陣的如下引理。引理如果B‾=B‾H]]>是2×2厄密矩陣,則 也是厄密矩陣。關聯計算通過6次CM(復數乘法)、4次CRM(復數-實數乘法)、4次pPow(ab)和2次Re(a,b)來給出,其中6次CM是{a12*b21,a11*b21*,a22*b21,a21*b21*,d21*a11*,d22*a12*},4次“CRM”運算是{tmp1=(a11оb11),tmp3=(a12оb22,tmp5=(a21оb11),tmp7=(a22оb22)},而4次“pPow(ab)”運算是pPow(tmp1,a11*),pPow(tmp3,a12*),pPow(tmp5,a21*),pPow(tmp7,a22*)。兩次Re(a,b)運算是Re(tmp2,a11*),Re(tmp6,a21*)。
證明對G‾=A‾B‾A‾H]]>的計算進行擴展和分組如下。
G‾=g11g12g21g22=A‾B‾A‾H=M(A‾,B‾)A‾H=a11ob11+a11*b12a11*b21*+a12ob22a21ob11+a22*b21a21*b21*+a22o&ogr;b22a11*a21*a12*a22*]]>這產生如下元素g11=(a11ob11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12ob22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;]]>g22=(a21ob21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22ob22)*a22*]]>在等式中,a*b意味著“復數×復數”乘法,而“aob”意味著“復數×實數”乘法。定義臨時寄存器tmp1=(a11оb11),tmp2=(a12оb21),tmp3=(a12оb22),tmp5=(a21оb11),tmp6=a22*b21,tmp7=(a22оb22)。將這些臨時值相加以生成d11,d12,d21,d22。然而,取代了使這些臨時值與輸入進行普通復數乘法以產生最終結果,可以利用這些變量的關系和使用特殊函數部分。例如,容易驗證(a11ob11)*a11*=pPow(tmpL,a11),因為b11是a11的范數的標量。通過改變計算的次序和組合共同計算,可以最終表明 是具有如下給定的元素的厄密矩陣g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*)]]>因此可以如圖7所示設計簡化的 RTL模塊,以 的實部和虛部以及如{b11(r),b21(r/i),b22(r)}中那樣僅厄密矩陣 的必要元素作為輸入。輸出端口包括{tmp1,tmp2,tmp3,tmp5,tmp6,tmp7}。無需輸出tmp4和tmp8。另外,雖然所有這些數具有復數值,但是與輸入值的乘積無需是復數乘法。也只需計算d21,d22以獲得 元素。從 運算中消除{tmp4,tmp8,d21,d22}中的冗余計算。從簡化的 模塊加以構建,4×4厄密矩陣的 變換的數據路徑RTL模塊按照圖8來給定,其中定義了簡化的函數部分{pPow(a,b)Re(a,b)}。 的輸出端口包括獨立元素{t11,t21,t22}。
性能和設計根據簡化的通用設計模塊,如圖6中那樣設計頂級RTL方案。與圖4和圖5中的設計相比較,這些架構表現了更佳的并行和減少的冗余度。由于在模塊設計中提取 和 的共性,所以可以如下所示通過消除單獨 模塊進一步優化頂級中的RTL。因此,從第二個 模塊中一起生成 和 的結果。此設計不僅將冗余度消除到最佳程度而且有助于多個子載波的流水線化。好得多地平衡數據路徑以實現高速VLSI架構。
可以通過改變 模塊中復數乘法的數值計算次序來進一步減少實數乘法的次數。傳統上,復數乘法按照″c=cr+jci=(ar+jai)*(br+jbi)=(arbr-aibi)+j(arbi+aibr)″來給定。這具有四次獨立實數乘法和兩次實數加法。通過重排計算次序,可以提取共性并且減少實數乘法的次數如下(1)p1=arbr;p2=aibi;s1=ar+ai;s2=br+bi;(2)cr=p1-p2;d=(p1+p2);s=s1s2;(3)ci=s-d.
這在三個步驟中需要三次RM(實數乘法)和兩次RA(實數加法)。考慮到RA比RM廉價得多,該成本是值得的。
通過利用矩陣元素的厄密特征來減少冗余計算從而簡化RM和RA的次數。在表II中列舉了不同基本計算的量度作為參考。不言而喻,2×2厄密矩陣的求逆需要七次RM和兩次RA,而普通2×2矩陣的直接求逆需要二十六次RM。復數2×2矩陣乘法需要三十二次RM。如果使用4×4矩陣求逆的傳統計算架構,需要8*8*4+2*6.5*4=308次RM和8*8*4+2*1.5*2+2*4*2=150次RA而無需利用數據依賴優化(DO)。即使利用簡單的數據依賴優化,復雜度仍然是244次RM和102次RA。然而,單個
變換就4×4厄密矩陣而言需要共計6*3+4*2+4*2+2*2=38次RM。總而言之,實數乘法的次數是2x(38+7)=90次RM以計算具有厄密結構的
這僅是用以計算逆的傳統架構的實數乘法的不到三分之一。注意到在更佳模塊性和流水線化時也顯著地縮短了關鍵數據路徑。在表III中示出了就實數乘法而言的復雜度減少。
表II用于基本運算的RM和RA的次數
表III針對4×4矩陣求逆的復雜度減少基于上述算法優化,發明人已經展現了RTL設計在NallatechFPGA平臺上的VLSI架構和原型。碼片速率與3.84MHz的WCDMA碼片速率一致,而發明人為Xilinx Virtex-II V6000 FPGA應用了38.4MHz的時鐘速率。相關窗口被設置為對于所有4個接收天線都是10個碼片。FFT大小是32點。在下文中給出主要設計塊的規范吞吐模式相關計算、多個FFT/IFFT模塊和4×4子矩陣的LF求逆。利用基于Precision-C(現在是Catapult-C)的設計方法來研究VLSI架構設計的多個面積/時間權衡。例如,對于16-FFT/IFFT模塊,從一個極端上說,可以利用以蝴蝶樹模式布局的并行蝴蝶單元和復數乘法器來設計完全并行和流水線架構。由于在經濟上希望減少物理面積,所以這一點并不實際。將合并的多輸入多輸出FFT模塊設計為利用控制邏輯和相位系數加載中的共性。總而言之,利用僅四個乘法器來為此模塊實現面積/時間高效設計。對于4×4厄密矩陣的LF求逆,延遲對于6個乘法器而言是38埃秒。這得益于前述架構優化。
表IV主要FPGA設計模塊的面積/時間規范本發明的當前實施是在FPGA平臺中原型化的,而最佳模式被認為是實施為ASIC架構并且集成于通信碼片中的PHY處理引擎中。當前RTL可以以ASIC技術為目標。速度關鍵元素包括用于MIMO相關、信道估計、FIR濾波和均衡器抽頭求解器的可縮放架構。一種可選方式是將它實施于高端DSP處理器中。然而,DSP可能不能為具有流傳輸輸入數據的時間關鍵塊的實時處理而提供足夠的并行和流水線化。
該優化減少了FFT的次數以及上述子矩陣求逆和乘法中實數運算的次數。這有助于算法在減少硬件資源的VLSI架構中的實時實施。它也對定點實施賦予了更佳的穩定性。感興趣的主要運算是頻域中多個4×4矩陣的求逆。這得到高效的架構,其3倍地節省了復雜度并具有更為并行和流水線化的RTL方案,這在FPGA原型平臺中得到驗證。本發明被認為對于在發射器和接收器都有多個天線的高端CDMA設備最為有利。對于簡化分集階數多達4的接收器設計(即過采樣因子為2的4個接收天線或者2個接收天線)尤其有用,不過這些原則可以延及具有不同數目天線的其它接收器。
本領域技術人員應當認識到本發明的一個方面涉及一種數據存儲介質,該數據存儲介質存儲用以指引數據處理器對利用至少兩個天線從多徑信道接收的信號進行均衡的程序指令。程序指令可操作用以使數據處理器執行如下操作,該操作通過對經傅立葉變換的信道矩陣與塊循環矩陣Crr的經傅立葉變換和求逆的子矩陣元素進行組合來均衡所接收的信號,其中塊循環矩陣Crr是相關矩陣Rrr的近似。數據存儲介質可以包括碼分多址多個輸入CDMA接收器的一部分。
盡管已經圖示和描述了當前被認為是請求保護的本發明的優選和可選實施例的內容,但是將認識到許多變化和改型可能由本領域技術人員想到。本意在于在所附權利要求中覆蓋落入于請求保護的本發明的精神和范圍內的所有那些變化和改型。
權利要求書(按照條約第19條的修改)1.一種擴頻MIMO接收器,其使用并行計算架構和近似的相關矩陣Crr的2×2子矩陣的元素的厄密優化,測量至少2×2子矩陣元素,避免直接計算所述近似相關矩陣的逆傅立葉變換。
2.如權利要求1所述的接收器,其中所述子矩陣各自是具有從所述近似相關矩陣的列的逐元素快速傅立葉變換中獲得的元素的塊對角矩陣。
3.如權利要求2所述的接收器,其通過對所述子矩陣求逆并且將所述經求逆的子矩陣F-1與信道估計系數h的快速傅立葉變換進行組合來生成濾波器系數集。
4.如權利要求3所述的接收器,其中所述組合包括矩陣乘法F-1H(D)m,以及進一步其中所述裝置對所述乘法的結果執行快速逆傅立葉變換以求解其元素w包括所述濾波器系數集的濾波器矩陣W。
5.如權利要求1所述的接收器,其中所述相關矩陣代表以每碼片至少兩次進行過采樣的多于兩個的偶數個接收天線或者兩個接收天線。
6.如權利要求5所述的接收器,其中所述近似相關矩陣Crr的非零元素被分割成互斥2×2子矩陣B,而各所述分割的子矩陣被求逆。
7.如權利要求6所述的接收器,其中厄密優化包括對各所述分割的子矩陣執行快速傅立葉變換,所述子矩陣被轉換和組合形成如下矩陣F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i],]]>其中C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i]C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1;]]>所述矩陣與經傅立葉變換的信道矩陣相乘產生F-1H(D)m,并對F-1H(D)m執行快速逆傅立葉變換。
8.如權利要求7所述的接收器,其中對于各2×2子矩陣B,獨立地確定和存儲僅三個元素,而根據所述存儲的三個元素中的至少一個元素來確定第四元素。
9.如權利要求8所述的接收器,通過對所述三個存儲的元素的三次單獨的計算運算來生成濾波器系數集,所述計算運算包括對輸入2×2矩陣 的對角變換T(A‾)=T(A‾11,A‾21,A‾22);]]>對輸入2×2厄密矩陣的厄密逆運算HINV;以及對兩個輸入2×2矩陣的復數-厄密-乘法M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>10.如權利要求9所述的接收器,其設置于接收器內,其中用于各第k個擴頻碼的所述濾波器系數集如下g11=(a11ob11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12ob22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;and]]>g22=(a21ob21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22ob22)*a22*.]]>11.如權利要求10所述的接收器,其中在確定各第k個擴頻碼濾波器系數時存儲和再次使用至少一些計算組合。
12.如權利要求11所述的接收器,其中用于各第k個擴頻碼的所述濾波器系數集如下g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*);]]>其中tmp1,tmp2,tmp3,tmp5,tmp6和tmp7是存儲于存儲器中的計算組合的值,d21和d22是從矩陣B和A的復數厄密乘法中獲得的2×2矩陣D的元素,而對于兩個復數a和b而言pPow(a,b)=Re(a).Re(b)+Im(a).Im(b)。
13.一種用以從多徑信道接收信號的方法,包括以至少兩個接收天線來接收所述信號;確定至少大小為4×4的塊循環矩陣Crr,所述塊循環矩陣Crr是相關矩陣Rrr的近似;并行地,利用塊循環矩陣的2×2子矩陣元素的厄密優化來解決逆傅立葉變換而不直接計算該逆傅立葉變換;以及通過將經傅立葉變換的信道矩陣與所述塊循環矩陣Crr的經傅立葉變換和求逆的子矩陣元素進行組合來均衡所述接收的信號。
14.如權利要求13所述的方法,其中對各所述2×2子矩陣元素執行傅立葉變換,所述子矩陣被轉換和組合形成如下矩陣F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i],]]>其中C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i]C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1;]]>所述矩陣與經傅立葉變換的信道矩陣相乘產生F-1H(D)m,并對F-1H(D)m執行快速逆傅立葉變換。
15.如權利要求14所述的方法,其中通過三個單獨的計算運算的布局來執行所述組合,所述計算運算包括對輸入2×2矩陣 的對角變換T(A‾)=T(A‾11,A‾21,A‾22);]]>對輸入2×2厄密矩陣的厄密逆運算HINV;以及對兩個輸入2×2矩陣的復數-厄密-乘法M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>16.如權利要求13所述的方法,還包括根據所述組合來生成濾波器系數集,對于所述接收信號的各第k個擴頻碼,所述濾波器系數包括g11=(a11ob11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12ob22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;and]]>g22=(a21ob21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22ob22)*a22*.]]>17.如權利要求13所述的方法,還包括根據所述組合來生成濾波器系數集,對于所述接收信號的各第k個擴頻碼,所述濾波器系數包括g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*);]]>
其中tmp1,tmp2,tmp3,tmp5,tmp6和tmp7是所確定的并存儲于存儲器中的計算組合的值,d21和d22是從矩陣B和A的復數厄密乘法中獲得的2×2矩陣D的元素,而對于兩個復數a和b而言pPow(a,b)=Re(a).Re(b)+Im(a).Im(b)。
權利要求
1.一種均衡器,包括如下裝置,所述裝置從對一連串子矩陣E的求逆中生成濾波器系數w集,所述子矩陣各自的大小不大于2×2并且代表用于通過多徑信道接收的擴頻信號的近似相關矩陣Crr的元素。
2.如權利要求1所述的均衡器,其中所述均衡器是線性最小均方誤差LMMSE均衡器。
3.如權利要求1所述的均衡器,其中所述均衡器是線性最小均方誤差LMMSE碼片級均衡器。
4.如權利要求1所述的均衡器,其中所述子矩陣各自是具有從所述近似相關矩陣的列的逐元素快速傅立葉變換中獲得的元素的塊對角矩陣。
5.如權利要求4所述的均衡器,其中所述均衡器通過將所述經求逆的子矩陣F-1與信道估計系數h的快速傅立葉變換進行組合來生成所述濾波器系數集。
6.如權利要求5所述的均衡器,其中所述組合包括矩陣乘法F-1H(D)m,以及進一步其中所述裝置對所述乘法的結果執行快速逆傅立葉變換以求解其元素w包括所述濾波器系數集的濾波器矩陣W。
7.如權利要求8所述的均衡器,其中對于各第k個濾波器系數,所述經快速傅立葉變換的列元素被求逆F‾-1=f0,0(k)f0,1(k)f1,0(k)f1,1(k)-1]]>并且與所述經傅立葉變換的信道矩陣H中所述信道系數h的所述第k個元素的組合Γ‾k=[γ1(k)γ2(k)]]]>進行矩陣相乘。
8.如權利要求1所述的均衡器,其中所述均衡器形成接收器中的如下部分,所述部分具有以每碼片至少兩次進行過采樣的多于兩個的偶數個接收天線或者兩個接收天線。
9.如權利要求8所述的均衡器,其中所述近似相關矩陣Crr的非零元素被分割成互斥2×2子矩陣B,而各所述分割的子矩陣被求逆。
10.如權利要求9所述的均衡器,其中對各所述分割的子矩陣執行快速傅立葉變換,所述子矩陣被轉換和組合形成如下矩陣F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i],]]>其中C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i]C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1;]]>所述矩陣與經傅立葉變換的信道矩陣相乘產生F-1H(D)m,并對F-1H(D)m執行快速逆傅立葉變換。
11.如權利要求10所述的均衡器,其中對于各2×2子矩陣B,獨立地確定和存儲僅三個元素,而根據所述存儲的三個元素中的至少一個元素來確定第四元素。
12.如權利要求11所述的均衡器,通過對所述三個存儲的元素的三次單獨的計算運算來生成所述濾波器系數集,所述計算運算包括對輸入2×2矩陣 的對角變換T(A‾)=T(A‾11,A‾21,A‾22);]]>對輸入2×2厄密矩陣的厄密逆運算HINV;以及對兩個輸入2×2矩陣的復數-厄密-乘法M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>
13.如權利要求12所述的均衡器,其設置于接收器內,其中用于各第k個擴頻碼的所述濾波器系數集如下g11=(a11·b11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12·b22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;and]]>g22=(a21·b21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22·b22)*a22*.]]>
14.如權利要求13所述的均衡器,其中在確定各第k個擴頻碼濾波器系數時存儲和再次使用至少一些計算組合。
15.如權利要求14所述的均衡器,其中用于各第k個擴頻碼的所述濾波器系數集如下g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*);]]>其中tmp1,tmp2,tmp3,tmp5,tmp6和tmp7是存儲于存儲器中的計算組合的值,d21和d22是從矩陣B和A的復數厄密乘法中獲得的2×2矩陣D的元素,而對于兩個復數a和b而言pPow(a,b)=Re(a).Re(b)+Im(a).Im(b)。
16.一種擴頻接收器,包括基于線性最小均方誤差LMMSE的碼片級均衡器,所述均衡器包括有限沖激響應FIR濾波器,所述濾波器耦合到協方差估計器和抽頭求解器的輸出,所述協方差估計器和抽頭求解器可操作用以將塊循環矩陣Crr的經傅立葉變換和求逆的子矩陣元素與經傅立葉變換的信道矩陣H進行組合,所述塊循環矩陣Crr是相關矩陣Rrr的近似。
17.如權利要求16所述的擴頻接收器,其中所述子矩陣元素的維度大于2×2并且被分割成較小矩陣、被求逆和組合形成所述經傅立葉變換和求逆的子矩陣元素。
18.如權利要求16所述的擴頻接收器,其中經傅立葉變換和求逆的塊循環矩陣Crr的所述子矩陣元素與所述經傅立葉變換的信道矩陣H進行矩陣相乘,并對結果進行逆傅立葉變換。
19.如權利要求16所述的擴頻接收器,其中所述均衡器使用電路來實施。
20.如權利要求16所述的擴頻接收器,其中所述均衡器使用軟件來實施。
21.如權利要求16所述的擴頻接收器,其中所述均衡器使用電路和軟件的組合來實施。
22.如權利要求16所述的擴頻接收器,其中所述接收器包括多輸入CDMA接收器。
23.如權利要求16所述的擴頻接收器,其中所述接收器包括多輸入多輸出MIMO CDMA接收器。
24.一種均衡器,包括協方差估計器和抽頭求解器裝置,所述協方差估計器和抽頭求解器裝置具有耦合到有限沖激響應濾波器裝置的輸出,所述協方差估計器和抽頭求解器裝置對塊循環矩陣Crr的子矩陣元素執行快速傅立葉變換FFT和求逆而對信道矩陣H執行傅立葉變換,所述塊循環矩陣Crr是相關矩陣Rrr的近似,以及所述協方差估計器和抽頭求解器裝置將所述經傅立葉變換和求逆的子矩陣與所述經傅立葉變換的信道矩陣進行組合,所述裝置對不大于2×2的矩陣求逆。
25.如權利要求24所述的均衡器,其中所述均衡器形成碼分多址CDMA下行鏈路接收器的一部分。
26.如權利要求24所述的均衡器,其中所述均衡器是線性最小均方誤差LMMSE均衡器。
27.如權利要求24所述的均衡器,其中所述均衡器是線性最小均方誤差LMMSE碼片級均衡器。
28.如權利要求24所述的均衡器,其中所述均衡器形成具有多輸入多輸出MIMO架構的碼分多址CDMA接收器的一部分。
29.一種用以從多徑信道接收信號的方法,包括以至少兩個接收天線來接收所述信號;以及通過將經傅立葉變換的信道矩陣與塊循環矩陣Crr的經傅立葉變換和求逆的子矩陣元素進行組合來均衡所述接收的信號,所述塊循環矩陣Crr是相關矩陣Rrr的近似。
30.如權利要求29所述的方法,其中所述將經傅立葉變換的信道矩陣與塊循環矩陣Crr的經傅立葉變換和求逆的子矩陣元素進行組合通過具有耦合到有限沖激響應濾波器的輸出的抽頭求解器來實施。
31.如權利要求29所述的方法,其中均衡使用線性最小均方誤差LMMSE技術。
32.如權利要求29所述的方法,其中均衡使用線性最小均方誤差LMMSE碼片級技術。
33.如權利要求29所述的方法,其中接收和均衡在碼分多址多輸入CDMA接收器內發生。
34.如權利要求29所述的方法,其中所述組合包括矩陣乘法F-1H(D)m,所述方法還包括對所述乘法的結果執行快速逆傅立葉變換以求解其元素w包括FIR濾波器系數集的濾波器矩陣W。
35.如權利要求34所述的方法,其中對于各第k個濾波器系數,所述經傅立葉變換的子矩陣元素被求逆F‾-1=f0,0(k)f0,1(k)f1,0(k)f1,1(k)-1]]>并且與所述經傅立葉變換的信道矩陣H中所述信道系數h的所述第k個元素的組合Γ‾k=[γ1(k)γ2(k)]]]>進行矩陣相乘。
36.如權利要求29所述的方法,其中被求逆以求解濾波器系數集的所有矩陣的維度為2×2。
37.如權利要求29所述的方法,其中所述經求逆的子矩陣元素的維度大于2×2,所述方法還包括將所述子矩陣元素分割成互斥塊子矩陣并且對各互斥塊子矩陣求逆。
38.如權利要求37所述的方法,其中對各所述分割的子矩陣執行傅立葉變換,所述子矩陣被轉換和組合形成如下矩陣F‾[i]-1=C‾11[i]C‾12[i]C‾21[i]C‾22[i],]]>其中C‾22[i]=(B‾22[i]-B‾21[i]B‾11[i]-1B‾12[i])-1C‾12[i]=-B‾11[i]-1B‾12[i]C‾22[i]C‾21[i]=-C‾22[i]B‾21[i]B‾11[i]-1C‾11[i]=B‾11[i]-1-C‾12[i]B‾21[i]B‾11[i]-1;]]>所述矩陣與經傅立葉變換的信道矩陣相乘產生F-1H(D)m,并對F-1H(D)m執行快速逆傅立葉變換。
39.如權利要求29所述的方法,其中通過三個單獨的計算運算的布局來執行所述組合,所述計算運算包括對輸入2×2矩陣 的對角變換T(A‾)=T(A‾11,A‾21,A‾22);]]>對輸入2×2厄密矩陣的厄密逆運算HINV;以及對兩個輸入2×2矩陣的復數-厄密-乘法M(A‾,B‾)=A‾B‾=a11a12a21a22b11b21*b21b22.]]>
40.如權利要求29所述的方法,還包括根據所述組合來生成濾波器系數集,對于所述接收信號的各第k個擴頻碼,所述濾波器系數包括g11=(a11·b11)*a11+[a12*b21*a11*+a11*b21**a12*]+(a12·b22)*a12*;]]>g21=d21*a11*+d22*a12*;]]>g12=d21*a11*+d22*a12;and]]>g22=(a21·b21)*a21*+[a22*b21*a21*+a21*b21**a22*]+(a22·b22)*a22*.]]>
41.如權利要求29所述的方法,還包括根據所述組合來生成濾波器系數集,對于所述接收信號的各第k個擴頻碼,所述濾波器系數包括g11=pPow(tmp1,a11*)+2Re(tmp2,a11*)+pPow(tmp3,a12*)g21=d21*a11*+d22*a12*g12=g21*g22=pPow(tmp5,a21*)+2Re(tmp6,a21*)+pPow(tmp7,a22*);]]>其中tmp1,tmp2,tmp3,tmp5,tmp6和tmp7是所確定的并存儲于存儲器中的計算組合的值,d21和d22是從矩陣B和A的復數厄密乘法中獲得的2×2矩陣D的元素,而對于兩個復數a和b而言pPow(a,b)=Re(a).Re(b)+Im(a).Im(b)。
42.一種數據存儲介質,存儲用以指引數據處理器對利用至少兩個天線從多徑信道接收的信號進行均衡的程序指令,包括如下操作,該操作通過將經傅立葉變換的信道矩陣與塊循環矩陣Crr的經傅立葉變換和求逆的子矩陣元素進行組合來均衡所述接收的信號,其中塊循環矩陣Crr是相關矩陣Rrr的近似。
43.如權利要求42所述的數據存儲介質,其中所述將所述經傅立葉變換的信道矩陣與所述塊循環矩陣Crr的所述經傅立葉變換和求逆的子矩陣元素進行組合的操作包括操作具有耦合到有限沖激響應濾波器的輸出的抽頭求解器。
44.如權利要求42所述的數據存儲介質,其中所述均衡操作使用線性最小均方誤差LMMSE技術。
45.如權利要求42所述的數據存儲介質,其中所述均衡操作使用線性最小均方誤差LMMSE碼片級技術。
46.如權利要求42所述的數據存儲介質,其中所述數據存儲介質包括碼分多址多輸入CDMA接收器的一部分。
全文摘要
公開了一種為通過N個接收天線接收的擴頻信號恢復下行鏈路信道中擴頻碼正交性的LMMSE接收器。基于FFT的碼片均衡器抽頭求解器將現有技術的直接矩陣求逆減少到大小為N×N的一些子矩陣的求逆,N為接收天線的維度,并且最高效地將矩陣逆減少到不大于2×2。還按照厄密優化通過常規快速傅立葉變換方式將復雜度進一步減少到子矩陣求逆和樹修剪。對于雙重過采樣的N=4或者N=2的接收器,所得4×4矩陣被分割成2×2塊子矩陣、被求逆并且重建成4×4矩陣。找到共同計算并且消除重復計算以提高效率。從特殊設計塊導出通用設計架構以消除復數運算中的冗余度。最優地,該架構是并行和流水線化的。
文檔編號H04B1/707GK101091366SQ200580045166
公開日2007年12月19日 申請日期2005年11月4日 優先權日2004年11月24日
發明者郭遠斌, 張建中, D·麥凱恩, J·R·卡瓦拉羅 申請人:諾基亞公司