独立成分分析

独立成分分析(どくりつせいぶんぶんせき、: independent component analysis、ICA)は、多変量の信号を複数の加法的な成分に分離するための計算手法である。各成分は、ガウス的でない信号で相互に統計的独立なものを想定する。これはブラインド信号分離の特殊な場合である。

概要

独立性の仮定が正しいなら、混合信号のブラインドICA分離は非常に良い結果となる。混合信号でなくとも、分析のためにこれを行う場合もある。典型的なICAの応用として、室内で録音された複数の人間の会話から特定の人物の声を抜き出す音源分離がある。一般に遅延や反響がないと仮定することで問題が単純化される。考慮すべき重要な点として、N個の信号源があるとき、個々を分離するには少なくともN個の観測装置(マイクロフォンなど)が必要となる。

この統計的手法は、予測される成分の統計的独立性を最大化するようにその独立成分(ファクター、潜在変数、信号源など)を見つける。中心極限定理によると、非ガウス性[注釈 1]は成分の独立性を測る手法の1つである。非ガウス性は例えば、尖度ネゲントロピーの近似で測ることができる。相互情報量も信号間の独立性の尺度となる。

ICAの典型的アルゴリズムでは、複雑さを削減するために前段階として、中心化[注釈 2]、白色化[注釈 3]、次元削減(圧縮)[注釈 4]などを行う。白色化と次元削減は主成分分析特異値分解[注釈 5]などによってなされる。ICAのアルゴリズムとしては、InfomaxインフォマックスFastICAファストアイシーエイJADEジェイドなど様々なものがある。

ICA はブラインド信号分離で重要であり、具体的な応用がいくつもある。

数学的定義

線形独立成分分析はノイズのない場合とノイズのある場合に分けられ、ノイズのない ICA はノイズのある ICA の特別な場合である。非線形 ICA はそれらとは別と考えられる。

一般的定義

データは確率変数ベクトル x = ( x 1 , , x m ) {\displaystyle x=(x_{1},\ldots ,x_{m})} と成分の確率変数ベクトル s = ( s 1 , , s n ) {\displaystyle s=(s_{1},\ldots ,s_{n})} で表される。すべきことは、線形な統計的変換 s = W x {\displaystyle s=Wx} を使って、観測データ x {\displaystyle x} を独立成分 s {\displaystyle s} に変換することである(独立性は関数 F ( s 1 , , s n ) {\displaystyle F(s_{1},\ldots ,s_{n})} によって表される)。

生成的モデル

線形ノイズなしICA

観測された確率変数ベクトル x = ( x 1 , , x m ) T {\displaystyle x=(x_{1},\ldots ,x_{m})^{T}} の成分 x i {\displaystyle x_{i}} は独立成分 s k {\displaystyle s_{k}} , k = 1 , , n {\displaystyle k=1,\ldots ,n} の次のような総和として生成される。

x i = a i , 1 s 1 + + a i , k s k + + a i , n s n {\displaystyle x_{i}=a_{i,1}s_{1}+\ldots +a_{i,k}s_{k}+\ldots +a_{i,n}s_{n}}

すなわち、 a i , k {\displaystyle a_{i,k}} でそれぞれの独立成分に重み付けがなされている。

このモデルをベクトルとして表すと

x = k = 1 n s k a k {\displaystyle x=\sum _{k=1}^{n}s_{k}a_{k}}

となり、観測された確率変数ベクトル x {\displaystyle x} が基本ベクトル a k = ( a 1 , k , , a m , k ) T {\displaystyle a_{k}=(a_{1,k},\ldots ,a_{m,k})^{T}} で表される。

基本ベクトル a k {\displaystyle a_{k}} は混合行列[注釈 6] A = ( a 1 , , a n ) {\displaystyle A=(a_{1},\ldots ,a_{n})} の列を形成し、生成式は x = A s {\displaystyle x=As} と表され、このとき s = ( s 1 , , s n ) T {\displaystyle s=(s_{1},\ldots ,s_{n})^{T}} である。

モデルと x 1 , , x N {\displaystyle x_{1},\ldots ,x_{N}} からなる確率変数ベクトル x {\displaystyle x} の標本があるとき、混合行列 A {\displaystyle A} と信号源 s {\displaystyle s} を予測する作業が行われる。これは、 w {\displaystyle w} ベクトルを順応的に計算し、計算された s k = ( w T x ) {\displaystyle s_{k}=(w^{T}*x)} の非ガウス性を最大化するか、相互情報量を最小化するコスト関数を設定することでなされる。場合によっては信号源の確率分布についての事前の知識をコスト関数に利用する。

信号源 s {\displaystyle s} は観測された信号群 x {\displaystyle x} に混合行列の逆行列 W = A 1 {\displaystyle W=A^{-1}} (分離行列[注釈 7]をかけることで求められる。ここで、混合行列は正方行列と想定されている。

線形ノイズありICA

平均がゼロとなる無相関のガウス雑音 n N ( 0 , diag ( Σ ) ) {\displaystyle n\sim N(0,\operatorname {diag} (\Sigma ))} を仮定すると、ICAモデルは x = A s + n {\displaystyle x=As+n} という形式になる。

非線形ICA

信号源の混合は線形でなければならないわけではない。パラメータ θ {\displaystyle \theta } の非線形混合関数 f ( | θ ) {\displaystyle f(\cdot |\theta )} による非線形ICAモデルは x = f ( s | θ ) + n {\displaystyle x=f(s|\theta )+n} となる。

同定可能性

独立成分分析の同定可能性には以下の要素が必要である。

  • 信号源のうち高々1つだけ( s k {\displaystyle s_{k}} )がガウス雑音である。
  • 混合信号の観測数 m {\displaystyle m} と予測される信号源の数 n {\displaystyle n} について、 m n {\displaystyle m\geq n} でなければならない。
  • 混合行列 A {\displaystyle A} 行列の階数は最大でなければならない。

脚注

[脚注の使い方]

注釈

  1. ^ : non-Gaussianity
  2. ^ : centering
  3. ^ : whitening
  4. ^ : dimensionality reduction
  5. ^ : singular value decomposition
  6. ^ : mixing matrix
  7. ^ : demixing matrixseparating matrix

参考文献

  • 『入門 独立成分分析』,村田昇,東京電機大学出版局,ISBN 4-501-53750-7, (2004).
  • 『詳解 独立成分分析―信号解析の新しい世界』, Aapo Hyvärien, Juha Karhunen, 東京電機大学出版局, ISBN 978-4501538606、(2005).

関連項目

外部リンク

  • What is independent component analysis? by Aapo Hyvärinen
  • Nonlinear ICA, Unsupervised Learning, Redundancy Reduction by Jürgen Schmidhuber
  • A Brief Introduction to Independent Component Analysis by JV Stone, 2005 (7 pages).
  • A. Hyvärinen, J. Karhunen, E. Oja (2001). Independent Component Analysis という書籍の Introductory chapter
  • FastICA as a package for Matlab, in R language, C++, and Python
  • ICALAB Toolboxes - Matlab 用。理化学研究所が開発。
  • High Performance Signal Analysis Toolkit - FastICA や Infomax の C++ による実装。
  • Free software for ICA by JV Stone.
  • ICA toolbox - Matlab 用。DTUが開発。
  • Demonstration of the cocktail party problem
  • EEGLAB Toolbox - Matlab による脳波の独立成分分析ツール。UCSDが開発。
  • FMRLAB Toolbox - Matlab によるfMRIの独立成分分析ツール。UCSDが開発。
  • Discussion of ICA used in a biomedical shape-representation context
標本調査
要約統計量
連続確率分布
位置
分散
モーメント
カテゴリデータ
推計統計学
仮説検定
パラメトリック
ノンパラメトリック
その他
区間推定
モデル選択基準
その他
ベイズ統計学
確率
その他
相関
モデル
回帰
線形
非線形
時系列
分類
線形
二次
非線形
その他
教師なし学習
クラスタリング
密度推定(英語版)
その他
統計図表
生存分析
歴史
  • 統計学の創始者
  • 確率論と統計学の歩み
応用
出版物
  • 統計学に関する学術誌一覧
  • 重要な出版物
全般
その他
カテゴリ カテゴリ