レーダーのFFTアルゴリズム
レーダーのアルゴリズムとは、MITのリンカーン研究所のチャールズ・M・レーダーにより考案された高速フーリエ変換のアルゴリズムである (Rader 1968)。このアルゴリズムではサイズが素数の離散フーリエ変換(DFT)を巡回畳み込みに置き換えることで計算コストを減らす(Bluestein のアルゴリズムもまたDFTを巡回畳み込みと置き換えるアルゴリズムである)。
レーダーのアルゴリズムはDFTカーネルの周期性 のみを利用しているので、このアルゴリズムは同様の特徴をもつ(素数サイズの)数論的変換 や離散ハートレー変換に対しても適用することができる。
このアルゴリズムはデータの並び変えを少し変更し、実数データに対して更なる高速化が可能である (Chu & Burrus 1982)。また、実数データについてに対する別の最適化として、Johnson & Frigo (2007)[要文献特定詳細情報] によって示された離散ハートレイ変換を用いたアルゴリズムがある。
ウィノグラードはレーダーのアルゴリズムを拡張し、素数の冪乗のサイズのDFTに適用できるアルゴリズムを考案した (Winograd 1976; Winograd 1978)。このため、レーダーのアルゴリズムは、ウィノグラードのアルゴリズムの特別なケースとみなされる。ウィノグラードのアルゴリズムは乗算的FFTアルゴリズム (Tolimieri, An & Lu 1997) とも言われる。このアルゴリズムは素数の冪乗以外のサイズにも適用できるが、合成数のサイズのDFTについては、クーリー・ターキーのFFTアルゴリズムを用いるほうがより単純で実装も容易であるため、このアルゴリズムは通常、クーリー・ターキーのアルゴリズムの再帰分割により得られたDFTのうち、大きな素数サイズのDFTにのみ適用される (Frigo & Johnson 2005)。
アルゴリズム
編集N が素数の場合、n =1,...,N–1の添字はNを法とする乗算について群をなす。数論によるとこのような群については生成元(原始根)が存在し、これを gとすると、すべての n は q = 0,...,N–2 を用いて n = gq (mod N) と表される。(qとnの間に全単射が存在する。) n と k の添字をこの置き換えを用いて新しい添字 q と p により表すと、定式は以下のように置き換えられる。
上式は以下に示される長さ N–1(q =0,...,N–2) の数列 aq と bq の巡回畳み込み積分となっている。
畳み込み積分の計算
編集畳み込み定理 により、FFTを用いて計算することができる。また、N−1 は合成数のため、より高速なクーリーターキー型のFFTアルゴリズムが適用できる。しかしながら、N−1 が大きな素数の素因数をもつ場合、レーダーのアルゴリズムを再帰的に使う必要がある。その代わりに、長さ N−1 のDFTをゼロ埋めによって2の冪乗にすることで、高速なクーリーターキーのアルゴリズムを用いることができる。ゼロ埋め後のデータサイズが最低 2(N−1)−1 以上あれば元のデータを完全に復元することができ、ゼロ埋めによる結果の変化は生じない。
畳み込み積分の計算にゼロ埋めを用いたFFTを用いることでのこのアルゴリズムは加算について O(N) の計算時間とそれに加えと畳み込み積分についてと O(N log N) の計算時間で実行できる。しかしながら、このアルゴリズムは付近の合成数のサイズのFFTに比べ、およそ3から10倍の時間がかかる。
畳み込み積分の計算をゼロ埋めなしのFFTで行う場合、計算時間は N の性質に強く依存する。最悪の場合、N−1 が素数 N2 により N−1= 2N2 と表され、また N2−1 が素数 N3 により N2−1 = 2N3 と表され、以下同様に続いていく場合である。このような場合、レーダーのアルゴリズムの再帰が連続することになり、O(N2) の計算時間がかかる可能性がある。このような性質をもつ N は ソフィー・ジェルマン素数と呼ばれ、上記の数列は一次の Cunningham(ビル-カニンガム)チェーンと呼ばれる。しかしながら、これまでの研究ではカニンガムチェーンの成長は log2(N) よりも遅いことが分かっているため、レーダーのアルゴリズムの再帰によりかかる計算時間は O(N2) よりかは速いと思われる。幸いにも、畳み込み計算にゼロ埋めを用いたFFTを使えば計算時間は O(N log N) のオーダーになることが保証されている。
プログラムの例
編集以下はC言語による実装例である。
#include <stdio.h>
#include <stdlib.h>
#include <math.h>
int powerMod(int a, int b, int m);
int primePrimitiveRoot(int p);
void DFT(double **x, int n);
void IDFT(double **x, int n);
void FFT_prime(double **x, int n){
int i,len,flag,pad;
int g,ig;
double X[2] = {0,0};
double **b,**a,**c;
/*ゼロ埋めのサイズの計算*/
flag = 0;
len=1;
for(i=n-1;i>1;i>>=1){
if(i & 1){flag=1;}
len <<= 1;
}
if(flag){
len <<= 2; /*2(n-1) - 1 以上の2の冪乗*/
}else{
len = n-1; /*n-1が2の冪乗の場合ゼロ埋めはしない*/
}
pad = len - (n-1); /*ゼロ埋めの数*/
g = primePrimitiveRoot(n); /*nの原始根*/
ig = powerMod(g,n-2,n); /*nの原始根の逆数*/
/*数列 a_q の作成*/
a = malloc(len*sizeof(double*));
for(i=0;i<len;i++){
a[i] = malloc(2*sizeof(double));
/*1番目と2番目の要素の間をゼロ埋めする。*/
if(i == 0){
a[0][0] = x[1][0];
a[0][1] = x[1][1];
}else if(i <= pad){
a[i][0] = 0;
a[i][1] = 0;
}else{
a[i][0] = x[powerMod(g,i-pad,n)][0];
a[i][1] = x[powerMod(g,i-pad,n)][1];
}
}
/*数列 b_q の作成*/
b = malloc(len*sizeof(double*));
for(i=0;i<len;i++){
b[i] = malloc(2*sizeof(double));
b[i][0] = cos(2*M_PI*powerMod(ig,i,n)/n);
b[i][1] = -sin(2*M_PI*powerMod(ig,i,n)/n);
}
/*離散フーリエ変換*/
DFT(a,len);
DFT(b,len);
/*離散フーリエ変換されたaとbの要素ごとの積を計算し、配列cに格納する。*/
c = malloc(len*sizeof(double*));
for(i=0;i<len;i++){
c[i] = malloc(2*sizeof(double));
/*複素数の積の計算*/
c[i][0] = a[i][0]*b[i][0] - a[i][1]*b[i][1];
c[i][1] = a[i][0]*b[i][1] + a[i][1]*b[i][0];
}
/*逆離散フーリエ変換*/
IDFT(c,len);
/*x0をXg^-qに足す*/
for(i=0;i<len;i++){
c[i][0] += x[0][0];
c[i][1] += x[0][1];
}
/*X0の計算*/
for(i=0;i<n;i++){
X[0] += x[i][0];
X[1] += x[i][1];
}
/*X0,Xg^-q,を元の配列xに格納する。*/
x[0][0] = X[0];
x[0][1] = X[1];
/*添字の並び変え*/
for(i=0;i<n-1;i++){
x[powerMod(ig,i,n)][0] = c[i][0];
x[powerMod(ig,i,n)][1] = c[i][1];
}
for(i=0;i<len;i++){free(a[i]);}
free(a);
for(i=0;i<len;i++){free(b[i]);}
free(b);
for(i=0;i<len;i++){free(c[i]);}
free(c);
}
/*冪剰余を求める関数*/
int powerMod(int a, int b, int m){
int i;
for(i=1;b;b>>=1){
if(b & 1){
i = (i*a)%m;
}
a = (a*a)%m;
}
return i;
}
/*素数の最小の原始根を見つける関数*/
int primePrimitiveRoot(int p){
int i,j,size=0;
int *list;
list = malloc((p-1)*sizeof(int));
/*p-1の素因数を見つけ、listに格納する。*/
for(i=2,j=p-1;i*i<=j;i++){
if(j % i == 0){
list[size] = i;
size++;
do{
j /= i;
}while(j%i==0);
}
}
for(i=0;i<size;i++){
list[i] = (p-1)/list[i];
}
for(i=2;i<=p-1;i++){
for(j=0;j<size;j++){
if(powerMod(i,list[j],p)==1){
goto next;
}
}
break;
next: ;
}
free(list);
return i;
}
/*離散フーリエ変換の関数*/
void DFT(double **x, int n){
int i,j;
double **c;
c = malloc(n*sizeof(double*));
for(i=0;i<n;i++){
c[i] = malloc(sizeof(double));
c[i][0] = 0;
c[i][1] = 0;
}
for(i=0;i<n;i++){
for(j=0;j<n;j++){
c[i][0] += x[j][0]*cos(2*M_PI*i*j/n) + x[j][1]*sin(2*M_PI*i*j/n);
c[i][1] += -x[j][0]*sin(2*M_PI*i*j/n) + x[j][1]*cos(2*M_PI*i*j/n);
}
}
for(i=0;i<n;i++){
x[i][0] = c[i][0];
x[i][1] = c[i][1];
}
for(i=0;i<n;i++){free(c[i]);}
free(c);
}
/*逆離散フーリエ変換の関数*/
void IDFT(double **x, int n){
int i,j;
double **c;
c = malloc(n*sizeof(double*));
for(i=0;i<n;i++){
c[i] = malloc(sizeof(double));
c[i][0] = 0;
c[i][1] = 0;
}
for(i=0;i<n;i++){
for(j=0;j<n;j++){
c[i][0] += x[j][0]*cos(2*M_PI*i*j/n) - x[j][1]*sin(2*M_PI*i*j/n);
c[i][1] += x[j][0]*sin(2*M_PI*i*j/n) + x[j][1]*cos(2*M_PI*i*j/n);
}
}
for(i=0;i<n;i++){
x[i][0] = c[i][0]/n;
x[i][1] = c[i][1]/n;
}
for(i=0;i<n;i++){free(c[i]);}
free(c);
}
- 複素数データを表現するため、一列目を実数部、二列目を虚数部とした二次元配列を用いている。
- レーダーのアルゴリズムではgの逆数が生成する数列も必要であるため、フェルマーの小定理からgの逆数を求めている。
- 畳み込み積分を不変に保つゼロ埋めの手法として、aについて先頭要素とその次の要素の間にゼロを埋め、bについてはgの生成する数列がn-1の周期をもつことを自然に用いて元の数列を巡回させている。ゼロ埋めの手法はこの方法以外にも考えられる。
- 畳込み積分の計算に通常の離散フーリエ変換を用いているが、これを高速フーリエ変換のルーチンで置き換えることができる。
- 原始根を求めるアルゴリズムは原始根を参照。
参考文献
編集- Rader, C. M. (1968年6月). “Discrete Fourier transforms when the number of data samples is prime”. Proceedings of the IEEE 56 (6): 1107–1108. doi:10.1109/PROC.1968.6477. ISSN 0018-9219.
- Chu, Shuni; Burrus, C. (1982年4月). “A prime factor FTT algorithm using distributed arithmetic”. IEEE Transactions on Acoustics, Speech, and Signal Processing 30 (2): 217–227. doi:10.1109/TASSP.1982.1163875. ISSN 0096-3518.
- Frigo, M.; Johnson, S. G. (2005年2月). “The Design and Implementation of FFTW3” (PDF). Proceedings of the IEEE 93 (2): 216–231. doi:10.1109/JPROC.2004.840301. ISSN 0018-9219. NAID 80017181219 .
- Winograd, Shmuel (Apr 1976). “On computing the Discrete Fourier Transform”. Proc Natl Acad Sci USA 73 (4): 1005–1006. ISSN 0027-8424.
- Winograd, S. (1978). “On Computing the Discrete Fourier Transform”. Mathematics of Computation 32 (141): 175–199. doi:10.2307/2006266. ISSN 00255718.
- Tolimieri, Richard; An, Myoung; Lu, Chao (1997). Algorithms for Discrete Fourier Transform and Convolution (2nd ed.). Springer-Verlag. doi:10.1007/978-1-4757-2767-8. ISBN 978-0-387-98261-8. ISSN 1431-7893