Wavelet Analysis of Some Viral Infection Diseases (Measles)
ウイルス感染症の流行に関するウェーブレット解析(麻疹 -はしか-)
in English
埼玉県における麻疹(はしか)の週毎の発生患者数の1991年から1997年までの7年間の時系列データ
について解析をした。
下図は,1991年から1997年間の麻疹(はしか)の発生患者の週毎の時系列データのグラフである。1991年1月の第1週を0としている。
1994年より,麻疹(はしか)のVaccine(予防接種)が,全額公費負担で無料になったため,発生数が激減しており,グラフの前半にみられる
ような流行時の大きなピークは,認められない。
しかし,グラフの後半にも,幾つかの小さなピークが散在するが,これらを,麻疹の流行と考えてよいのであろうか?
麻疹の流行の特徴を抽出し,その特異点を明らかのするために,Wavelet Transform Modulus Maxima ("a wavelet tour of signal processing",Stephone Mallat,Academic Press,2nd Edition,p176-p219),
および,Dyadic Wavelet Transform (p148-p156)にて分析した。
まず,その前に,簡単に,Fractal次元などに関して, "FRACTAL SURFACES",John C.Russ,Plenum,1994の方法にて,
検討した。
FFTでは,slope=-1.19,Dimension=1.905であった。
下図は,MexicanHatによる連続ウェーブレット変換(CWT continumous wavelet transformation)である。
下図は,MexicanHatにより,Vertical Local Maxima Line("Shape Analysis and Classification Theory and Practice",Luciano da Fontoura Coata and Roberto Marcondes Cesar Jr.,CRC Press,p502-p532)を求めた画像である。
レベル5を超える7本のVLML(Vertical Local Maxima Line)が観察される。それぞれ,1991年1月の最初の週を第0週として,line Aは,第18週,line Bは,第72週,Cは,第120週,Dは,第173週,E1は,第228週,Fは,第277週,Gは,第327週に相当する。
尚,黒い線は,Vertical Local Minima Lineを意味する。
下図は,CWTの画像と,VLML(Vertical Local Maxima Line)の画像を重ね合わせた画像である。
下図は,Gauss関数の第1次導関数をマザー・ウェーブレットとするCWTのVLML(Vertical Local Maxima Line)の画像である。
line Eの位置が,MexicanHatと比較して,前方,第216週に変化していることに注目いただきたい。(E2と表記する。)
この点については,後で,解説する。
MexicanHatによるVLML(vertical local maxima line)において,VLMを生の数値データで,表示した図である。A,Bなど周波数が低くなるにつれて,あるレベルまで,大きく
なっていること(Gray Scaleでは白くなる)と,B,E2など低周波数部分と高周波数の部分で,白さが変化しない2種類があることが,わかる。
また,E1は,数値が低いので,この画像では,描出されていない。
E1E2部分の拡大図である。レベル3,レベル4からは,直線にはならず,曲がりくねっている。また,赤い色調が,ある程度のレベルまで,一定であることから,Powerの周波数への依存はないと推定される。
下図は,MexicanHatの7本のVLMLに関して,scaleとウェーブレット係数について,log-log plotしたグラフ
である。
7本のVLMLのslopeは,2つのグループに大別される。line Bとline Eのslopeは,A,C,D,Fのslopeと明らかに異なる。
E1,E2は,いずれも,傾きは,Zeroに近い。また,一番下は,コントロールにとった,インパルス・データであり,そのslopeは,0.5となっている。
B,Eは,その流行が,免疫のない集団のみの一過性の流行であり,既に,前年,前々年の流行で,その集団の多くが,免疫を有しておれば,二次的に,
伝染する対象がなく,感染の拡大にいたらず,終焉する。
これに対し,A,C,D,Fのピークの形態は,第1次の感染グループに引き続き,
免疫を持たない第二,第三の集団が存在することで,形成されると考えられる。
この点については,後の,Spline Dyadic Wavelet Transformation(Mallat,p152)と,
Dyadic Maxima(Mallat p183)で,解説する。
また,Lipschitz指数( Lipschitz exponent)の高い感染パターンとLipschitz指数の低い感染パターンが同じように
出現しており,予防接種により,感染率は,低下したが,接種無料化の前後で,
そのFractal(フラクタル)な性質に,変化がないことが,伺える。
Hurst指数については,http://www.swin.edu.au/chem/bio/fractals/の jonesdoc.pdf 若しくは jones6.doc "Wavelet Packet Computation of the Hurst Exponent" C.L.Jones et.al.や,
http://www.cwi.nl/~zbyszek/ のSt_FRACYTALS_00.pdf "Determining local singularity strengths and their spectra with the wavelet transform" ZBIGNIEW R. STRUZIK や,
http://www.stat.uconn.edu/~yzwang/paper/similar.ps "Self-Similarity Index Estimation via Wavelets for Locally Self-Similar Processes" Yazhen Wang
等を参考にさせていただいた。
MallatのSpline Dyadic WaveletによるFast Daydic Transformにより,"Algorithme a Trous"にて,
レベル8まで分解したものが,下図である。
黒い矢印が,第216週,白い矢印が,第228週である。
Modulus Maxima of Fast Dyadic Wavelet Transformation
次の図は,Daydic Wavelet TransformのModulus maximaにより,レベル8まで分解した図である。
line Bの第72週のg8の正方形で囲んだ部分と,line C の第120週のg8の円で囲んだ
部分に注目していただきたい。line Bの正方形で囲んだ部分では,Gauss関数の第一次導関数が,マザー・ウェーブレットであるので,波のようなピークが,下,上の順で,出現している。これに対して,line C のg8の円で囲んだ部分では,下方に向かう波に続いて,三つの上向きの波が,認められ,最後尾の波が一番大きい。
これは,下にそのモデルを示すが,幾つかの波が時間をずらして重なった時,Spline Dyadic Waveletが,Gauss関数の第一次導関数であり,これは,次の図の右のsingle peakのFast Daydic Transformのg1からg7でみられるように,下方に向かい次に上方に向かう曲線となる。
次の図の左のGauss関数を三つずらして合成した場合には,最初の下に向かうピークと,最後尾の上に向かうピークは,大きくなるが,他は,下向きのピークと,上向きのピークが,打消しあって,低くなる。類似した波形が,近くに存在すると,附近の下向きの波と上向きのピークが,干渉し,打ち消しあうことで,最も先頭のピークと最後尾の波が強調されることになる。
line F,line Aの前方に見られる幾つかの下向きのピークも,同じように説明できる。
line Eは,波形からは,single peakに近いものであるので,
log-log plotでは,line Bと類似したslopeを示したが,第207週,第216週にも,程よい間隔で,同じような波形が出現している為,あるマザー・ウェーブレット(ガウス関数の第一次導関数,Morletなど)では,第216週を示し,MexicanHat,Gabor2Realでは,第228週を示したものと考えられる。
しかし,上の図で,ガウス関数の第一次導関数のVLMLとMexicanHatのVLMLで示したように,垂直方向の歪みは,MexicanHatが最も,少ないため,またその直線性に優れているため,line E に,第228週を当てるのが,順当と考えている。
下の図の左のサンプル・データは,Quadratic spline waveletのscaling関数の第3分解レベルのものを時間をずらして,3つ合成したものである。右は,単独のスケーリング関数である。これを,レベル7まで,Fast Dyadic Transformした。FDTでは,普通のWavelet Transformと異なり,downsamplingやupsamplingがされない"Algorithmie a Trous"が使われる。
下の図は,Gabor2Powerを,マザー・ウェーブレットとした位相に関する連続ウェーブレット変換である。位相に関するVLMLをみても(未提示)最初の三年と後の4年では,
位相に変化がみられる。
下の図は,Gabor2を,マザー・ウェーブレットとした連続ウェーブレット変換によるVLMLである。line Eは,第228週にみられる。
下図は,エジプトのナイル川の622 ADから1284 ADまでの663年間の水位(meter)の変化を示したグラフである。
下図は,上のNile.datについて,"Chaos and Order in the Capital Markets" by Edgar E. Peters, 2nd edition, WILEY,New York,1996,page61-page121 の方法で,Hurst係数を求めたものである。Hurst係数0.906を得ている。Hurst係数が,0.5未満では,過去の現象の逆の現象が起こり易くなり,0.5の場合は,過去の現象とは,無関係であり,0.5を越えると過去の事象の影響を受け易くなる。Hurst係数0.906であるということは,Manderbrotの云うヨゼフ効果を意味しており,”7年の豊作が続いたあとに,7年の飢饉をおこる"いう聖書の言葉と一致する。
埼玉県における麻疹(はしか)の週毎の発生患者数のデータについて,上記方法で,Hurst係数を求めると,0.844であり,過去の事象の影響を大きく受けることがわかる。つまり,過去に大きな流行があれば,今後も,麻疹の流行は続く可能性が大きく,過去に,大きな流行がなければ,今後も流行はないと考えられる。また,91年から,93年までのデータのHurst係数は,0.984,94年から,97年までのデータのHurst係数は,0.968であり,ワクチンの無料化の前後で,麻疹の流行のHurst係数に変化はみられなかった。
データ数が,少なく,不確実な結果しか得られていないが,"Nonlinear Time Series Analysis",Holger Kantz Thomas Schreiber,Cambrige,1997,page262-277の方法で,最大リヤプノフ指数(Maximun Lyapunov exponent)を求めると,0.0969とであり,0.0を越えており,カオスと考えてよさそうである。また,相関次元(Correlation dimension)は,埋め込み次元m=2で,もっとも,直線性が保たれており,その傾きから,1.1089
を得ており,元の時系列データは,2次元の比較的簡単な数式で支配されていると
考えられる。
MAIL:wavelet@nifty.ne.jp
Last update: