一種高分辨率合成孔徑雷達并行成像實現(xiàn)
摘 要:并行處理是快速處理合成孔徑雷達數(shù)據(jù)(SAR),實現(xiàn)實時處理的有效途徑。本文采用 了一種細粒度的并行算法實現(xiàn)SAR成像,將原始數(shù)據(jù)劃分為子孔徑數(shù)據(jù),并分配給并行機的各節(jié) 點,使用針對子孔徑的CS處理和方位向子孔徑算法,對各節(jié)點的數(shù)據(jù)進行處理。通過在并行機SGI Origin2000平臺上的實驗證明,該算法與中粒度并行cS成像算法相比,能有效地減少通信量,有 利于成像處理的并行擴展, 同時獲得更好的分辨率。
SAR成像處理具有數(shù)據(jù)量和運算量大的特點【l】,為了提高運算速度,實現(xiàn)實時成像,通常采用并行計算機進 行并行處理。SAR的成像處理具有潛在的并行性,能較為容易地并行化I2】。在并行處理的數(shù)據(jù)劃分方面,中粒度 劃分和粗粒度劃分是較為常用的方法。
文獻【3.4】介紹了SAR原始數(shù)據(jù)數(shù)據(jù)粗粒度劃分的處理方法。每個處理器 得到一幀回波數(shù)據(jù),獨立完成整幀圖像的處理過程,各處理器是獨立的,彼此之間沒有通信。粗粒度并行減少了 系統(tǒng)的通信需求,但由于各節(jié)點的數(shù)據(jù)量大,對節(jié)點的運算能力和存儲能力要求高。數(shù)據(jù)的中粒度劃分方式在
文 獻【2,5】中進行了討論,這是目前典型的SAR并行處理方式,能獲得較好的并行效率。它將一幀數(shù)據(jù)再進行劃分 并分配給并行系統(tǒng)的各處理器,每塊數(shù)據(jù)分別依照成像算法的步驟進行處理。 在中粒度并行成像算法中,并行機各節(jié)點間通常需要通信。以CS算法的中粒度并行化為例【2】。由于在距離 徙動校正上避免了插值,并能獲得很高的成像精度,CS算法已成為目前流行的SAR成像算法【6】。在并行處理中, CS算法需要進行3次數(shù)據(jù)矩陣的轉(zhuǎn)置,會帶來3次并行機各節(jié)點間的通信 】,需要消耗大量的時間。 同時,對中粒度并行Cs算法而言,如果為了提高運算速度,采用具有更多節(jié)點的并行機,就會導致分配到 各節(jié)點上的數(shù)據(jù)小于一個孔徑【引,并會造成圖像分辨率的明顯下降。因此SAR 的中粒度并行算法不利于并行擴 展,增大并行度就會影響到圖像質(zhì)量。 本文對SAR 的原始數(shù)據(jù)進行細粒度劃分,將子孔徑數(shù)據(jù)分配給各節(jié)點,采用針對子孔徑的Cs處理和方位 向子孔徑算法實現(xiàn)成像。 l 子孔徑的CS處理和方位子孔徑處理 中粒度并行cS算法[21中,對整塊原始數(shù)據(jù)進行cS變換,3次矩陣轉(zhuǎn)置就帶來了3次所有節(jié)點間的通信。 cS處理利用發(fā)射信號是線性調(diào)頻信號的性質(zhì),通過改變信號相位中心,實現(xiàn)對距離徙動曲線的尺度變換,使不 同距離上的曲線彎曲程度一致【9】。這里將原始數(shù)據(jù)劃分為子孔徑,每個子孔徑數(shù)據(jù)含有一定數(shù)量的線型調(diào)頻脈沖 信號。根據(jù)線型調(diào)頻信號的性質(zhì),我們可以對每塊子孔徑數(shù)據(jù)分別進行cs處理,從而避免了各節(jié)點間的通信。 以場景中心點為參考點(參考點可隨意選取),它與雷達間的最小距離 為參考距離。先對子孔徑數(shù)據(jù)進行方位 向FFT,然后與CS因子相乘: (f,f; )=exp{一jrLK(f; )X (廠)X【t一2RX(廠; )/c】 ) (1) 式中: C (,)= 一1;K (,; = . .2 c等 每 。 【l一( ) 】 ;R(廠; )= 【l+C (廠)】; 廠為方位向頻率;K為發(fā)射信號的調(diào)頻率;v為雷達載機速率; ,.為距離變量。然后在節(jié)點內(nèi)轉(zhuǎn)置,進行距離向 FFT,并乘上距離壓縮和徙動校正因子: ( ,廠; )=exp{_j 2 ’×exp【 4x CJ(廠)】 式中 為距離向頻率。方位向壓縮則采用子孔徑處理的方式: 圖1數(shù)據(jù)劃分和子孔徑處理 N N N I N l 廠d( )= 三Ⅳ ,( ) , Ⅳ ,( )=, ⅣLEja,( ) ,( J , [ aN+Sa(i-I)( Ⅳ+1)(r)+.. Ⅳ-1)( )] (2) (3) 式中:廠d(f)為方位壓縮的結(jié)果; (f)為方位向子孔徑數(shù)據(jù); (f)為與之對應的參考函數(shù)。子孔徑處理需要子 孔徑數(shù)據(jù)間的相互重疊 】,在本文提出的算法中,為了避免在cs處理步驟上對數(shù)據(jù)的重復處理,將數(shù)據(jù)劃分為 子塊,分配給各節(jié)點,分別進行cS處理后,再通過各節(jié)點間的一次通信,兩個子塊組成一個子孔徑數(shù)據(jù)(圖l(a)), 從而完成方位壓縮。即采取子孔徑間重疊50%的劃分方式。根據(jù)文獻【l0】和后面的實驗,這樣做是可取的。方位 向處理如圖1(b)所示,其中“rf’’是參考函數(shù)的縮寫。
2 實驗結(jié)果
2.1在SGI Origin2000上的實驗結(jié)果 實驗所用的平臺為SGI Origin2000,是一種對稱處理并行機。 其硬件配置如表1所示: 本文所采取的細粒度并行成像方法在SGI Origin2000上的運 算結(jié)果如表2所示。由于并行機上共有8個處理器,因此采用2,4 和8個處理器分別實現(xiàn)來觀察結(jié)果。實驗數(shù)據(jù)為雷達實測數(shù)據(jù),參 數(shù):矩陣點數(shù)16 384~8 192(方位×距離,含有兩個全孔徑數(shù)據(jù)),波 長3 cm,分辨率1 mxl m(方位×距離)。表中詳細列出了CS處理和 方位向子孔徑處理的各個步驟運算時間。 表l SGI Origin2000的硬件配置 表2細粒度并行方法在SGI Origin2000上的實驗結(jié)果 從運算結(jié)果上看,隨著處理器個數(shù)的增加,成像處理的時間明顯減少,用于CS處理和方位壓縮的時間也成 比例地減少。但是,由于通信量隨著處理器個數(shù)而變化(處理器越多,劃分的數(shù)據(jù)塊越小,參與通信的節(jié)點也越 多),且系統(tǒng)的通信性能相比運算性能要弱得多,因此花在通信上的時間并沒有減少。這就導致了效率隨著處理 器個數(shù)增加而下降。如果采用通信性能更好的并行系統(tǒng),如MPP,這一點可以得到改善。
2.2并行效率比較 根據(jù)文獻【2】中的中粒度并行cs算法流程,本文所采取的方法與其相比,有兩點不同: 1)通信次數(shù)不同。中粒度并行cS算法中含有3次矩陣轉(zhuǎn)置,需要3次所有節(jié)點間的通信;本文的方法只 需要1次通信,在方位壓縮之前; 2)方位壓縮的運算量不同。中粒度并行cs算法采用普通的方位壓縮,而本文采用了子孔徑處理,根據(jù)式(3), 方位壓縮的運算量要大一些。 由于條件限制,我們將文獻【2】中的中粒度并行CS算法移植到當前平臺上。實驗數(shù)據(jù)仍然采用2.1中的實測 數(shù)據(jù)。設(shè)原始數(shù)據(jù)的距離向點數(shù)為Ⅳ,,方位向點數(shù)為Ⅳ ,子孔徑的方位向點數(shù)為Ⅳ ,每塊全孔徑數(shù)據(jù)劃分為P 個子塊,則中粒度并行CS算法方位壓縮的運算量為: l ‰ =Ⅳ甜×Ⅳ,+ ×Ⅳ,×log2Ⅳ珊 (4) Z 本文方法的方位壓縮運算量為: Sr8=2×(P一1)× ×Ⅳ,+(P+1)×Ⅳ甜×,v,×log2Ⅳm (5) 運算效率的計算可參考文獻【8】。兩種算法的通信時間見圖2(a)。方位壓縮時間見圖2(b),而各種情況下算法 的效率見圖2(c)。
中粒度并行cS算法的通信時間較長,而本文的方法花在方位壓縮上的時間較長,總的來說, 兩種算法效率相當。 雖然本文的方法在運算量上較中粒度并行CS算法有所增加,但在通信方面有所改善。對于目前的計算機系 統(tǒng)來說,通信性能明顯弱于計算性能,且通信性能的改善也比計算性能的改善要困難一些。因此,該方法在通信 量上的減少,更有利于算法性能的進一步提高。中粒度并行CS算法與本文方法的比較 2.3 并行擴展性比較 考慮到圖像的質(zhì)量,本文的方法比中粒度并行CS算法有著更好的并行擴展度,更有利于獲得高分辨率圖像。 采用上面的數(shù)據(jù),矩陣大小取32 768x8 192(4個全孔徑數(shù)據(jù))。圖3顯示了在4個處理器和8個處理器的情況下, 中粒度并行CS算法的成像結(jié)果。對于4個處理器,每個節(jié)點上分配1個全孔徑數(shù)據(jù);而對于8個處理器,子數(shù) 據(jù)塊就只包含1/2個合成孔徑,這將導致分辨率的下降。圖3的結(jié)果說明了這一點。對中粒度并行CS算法而言, 更大規(guī)模的并行化將明顯影響到圖像質(zhì)量。 圖4顯示了在4個處理器和8個處理器的情況下,本文方法的成像結(jié)果。由于子孔徑的劃分具有一定靈活度, 根據(jù)文獻[10】,全孔徑數(shù)據(jù)可以劃分為4~16子孔徑,子數(shù)據(jù)塊的大小在一定范圍內(nèi)的變化不會明顯影響到結(jié)果, 因此兩幅圖像幾乎沒有差別。如果要求獲得高分辨率圖像,本文的方法更有利于更大規(guī)模的并行化。 (a)Oil4processors (b)Oil 8 processors Fig.3 Imaging results(part1 ofmedium·grained CS algorithm Oil diferent scale ofparallel systems 圖3中粒度并行CS算法在不同規(guī)模并行機上的成像結(jié)果(部分)
3 結(jié)論
上面的實驗結(jié)果說明,與中粒度并行CS算法相比,本文所采取的細粒度并行處理方法有效地降低了通信量, 并具有更好的并行擴展度。同時由于采取了子孔徑算法,更有利于高分辨率SAR進行并行處理。本文的子孔徑 算法為基本子孔徑處理,還可以考慮文獻[i11提出的改進子孔徑算法,甚至Step變換,對本文的方法進行改進。 此外,如果具有更好的硬件條件,如MPP并行機,應能取得更好的效果。