Indikatorfunktion

Die Indikatorfunktion einer Menge (auch charakteristische Funktion einer Menge genannt) ist eine Funktion, die die Zugehörigkeit eines Elements zur Menge charakterisiert. Sie ermöglicht es, komplizierte Mengen mathematisch präzise zu fassen und auf ihnen Funktionen wie zum Beispiel die Dirichlet-Funktion zu definieren.

Definition

Zweidimensionale Indikatorfunktion einer Untermenge eines Quadrates

In der Literatur finden sich mehrere Schreibweisen für die charakteristische Funktion. Neben der hier verwendeten mittels χ T {\displaystyle \chi _{T}} sind ebenfalls die Schreibweisen ξ T {\displaystyle \xi _{T}} und 1 T {\displaystyle \mathbf {1} _{T}} gebräuchlich.[1]

Reellwertige charakteristische Funktion

Gegeben sei eine Grundmenge X {\displaystyle X} und eine Teilmenge T X {\displaystyle T\subseteq X} . Die Funktion χ T : X { 0 , 1 } {\displaystyle \chi _{T}\colon X\to \{0,1\}} , definiert durch

χ T ( x ) = { 1 , falls  x T 0 , falls  x T {\displaystyle \chi _{T}(x)={\begin{cases}1,&{\text{falls }}x\in T\\0,&{\text{falls }}x\notin T\end{cases}}}

heißt dann die charakteristische Funktion oder Indikatorfunktion der Menge T {\displaystyle T} .

Die Zuordnung P ( X ) { 0 , 1 } X , T χ T , {\displaystyle {\mathcal {P}}(X)\to \{0,1\}^{X},\,T\mapsto \mathrm {\chi } _{T},} liefert eine Bijektion zwischen der Potenzmenge P ( X ) {\displaystyle {\mathcal {P}}(X)} und der Menge aller Funktionen von X {\displaystyle X} in die Menge { 0 , 1 } . {\displaystyle \{0,1\}.}

Erweiterte charakteristische Funktion

In der Optimierung wird die charakteristische Funktion teils als erweiterte Funktion definiert. Hier heißt dann die Funktion χ T : X { 1 , + } {\displaystyle \chi _{T}\colon X\to \{1,+\infty \}} , definiert durch

χ T ( x ) = { 1 , falls  x T + , falls  x T {\displaystyle \chi _{T}(x)={\begin{cases}1,&{\text{falls }}x\in T\\+\infty ,&{\text{falls }}x\notin T\end{cases}}}

die (erweiterte) charakteristische Funktion oder Indikatorfunktion der Menge T {\displaystyle T} . Sie ist eine echte Funktion, wenn T {\displaystyle T} nicht leer ist.

Partielle charakteristische Funktion

Bei der Bildung der partiellen charakteristischen Funktion wird die Definitionsmenge auf T {\displaystyle T} eingeschränkt; im Sinne von partiellen Funktionen kann man sie also wie folgt beschreiben:

χ T : X { 0 , 1 } , x { 1 , falls  x T undefiniert sonst . {\displaystyle \chi _{T}'\colon X\rightsquigarrow \{0,1\},\;x\mapsto {\begin{cases}1,&{\text{falls }}x\in T\\{\text{undefiniert}}&{\text{sonst}}\end{cases}}.}

Verwendung der unterschiedlichen Definitionen

Die reellwertige charakteristische Funktion wird häufig in der Integrationstheorie und in der Stochastik verwendet, da sie es ermöglicht, Integrale der Funktion f {\displaystyle f} über die Menge T {\displaystyle T} durch Integrale von f χ T {\displaystyle f\cdot \chi _{T}} über die Grundmenge zu ersetzen:

T f ( x ) d x = X f ( x ) χ T ( x ) d x {\displaystyle \int _{T}f\left(x\right)\mathrm {d} x=\int _{X}f\left(x\right)\cdot \chi _{T}\left(x\right)\mathrm {d} x} .

Dadurch lassen sich zum Beispiel oft Fallunterscheidungen vermeiden.

Die erweiterte charakteristische Funktion wird in der Optimierung verwendet, um Funktionen auf Teilbereiche einzuschränken, auf denen sie gewisse gewünschte Eigenschaften wie z. B. Konvexität besitzen, oder um Restriktionsmengen zu modellieren.

Die partielle charakteristische Funktion findet Verwendung in der Berechenbarkeitstheorie.

Eigenschaften und Rechenregeln der reellwertigen charakteristischen Funktion

  • Die Menge T X {\displaystyle T\subset X} ist durch ihre charakteristische Funktion eindeutig bestimmt. Es gilt
T = χ T 1 ( { 1 } ) = { x X | χ T ( x ) = 1 } {\displaystyle T=\chi _{T}^{-1}(\{1\})=\{x\in X\,|\,\chi _{T}(x)=1\}} .
Für S , T X {\displaystyle S,T\subset X} folgt also aus der Gleichheit χ S = χ T {\displaystyle \chi _{S}=\chi _{T}} die Gleichheit S = T {\displaystyle S=T} der Mengen.
  • Die charakteristische Funktion χ {\displaystyle \chi _{\varnothing }} der leeren Menge ist die Nullfunktion. Die charakteristische Funktion χ X {\displaystyle \chi _{X}} der Grundmenge ist die konstante Funktion mit dem Wert 1.
  • Es seien Mengen S , T X {\displaystyle S,T\subset X} gegeben. Dann gilt für die Schnittmenge
χ S T = min ( χ S , χ T ) = χ S χ T {\displaystyle \chi _{S\cap T}=\min(\chi _{S},\chi _{T})=\chi _{S}\chi _{T}}
und für die Vereinigungsmenge
χ S T = max ( χ S , χ T ) = χ S + χ T χ S χ T {\displaystyle \chi _{S\cup T}=\max(\chi _{S},\chi _{T})=\chi _{S}+\chi _{T}-\chi _{S}\chi _{T}} .
Für die Differenzmenge ist
χ S T = χ S χ S χ T {\displaystyle \chi _{S\setminus T}=\chi _{S}-\chi _{S}\chi _{T}} .
Insbesondere gilt für das Komplement T C = X T {\displaystyle T^{\mathsf {C}}=X\setminus T}
χ T C = 1 χ T {\displaystyle \chi _{T^{\mathsf {C}}}=1-\chi _{T}} .
  • Sei ( X , Σ , μ ) {\displaystyle (X,\Sigma ,\mu )} ein Maßraum und N {\displaystyle N} eine μ {\displaystyle \mu } -Nullmenge, dann ist
χ N = 0 μ {\displaystyle \chi _{N}=0\quad \mu } -fast überall.

Verwendung zur Berechnung von Erwartungswert, Varianz und Kovarianz

Für einen gegebenen Wahrscheinlichkeitsraum ( Ω , F , P ) {\displaystyle (\Omega ,{\mathcal {F}},\mathrm {P} )} und ein Ereignis A F {\displaystyle A\in {\mathcal {F}}} ist die Indikatorfunktion χ A : Ω R {\displaystyle \chi _{A}\colon \Omega \rightarrow \mathbb {R} } eine bernoulliverteilte Zufallsvariable. Insbesondere gilt für den Erwartungswert

E ( χ A ) = P ( A ) {\displaystyle \operatorname {E} (\chi _{A})=\operatorname {P} (A)}

und für die Varianz

Var ( χ A ) = P ( A ) ( 1 P ( A ) ) {\displaystyle \operatorname {Var} (\chi _{A})=\operatorname {P} (A)(1-\operatorname {P} (A))} .

Die Varianz von χ A {\displaystyle \chi _{A}} nimmt also ihren maximalen Wert 1 4 {\displaystyle {\tfrac {1}{4}}} im Fall P ( A ) = 1 2 {\displaystyle \operatorname {P} (A)={\tfrac {1}{2}}} an.

Ist zusätzlich B F {\displaystyle B\in {\mathcal {F}}} , dann gilt für die Kovarianz

Cov ( χ A , χ B ) = P ( A B ) P ( A ) P ( B ) {\displaystyle \operatorname {Cov} (\chi _{A},\chi _{B})=\operatorname {P} (A\cap B)-\operatorname {P} (A)\operatorname {P} (B)} .

Zwei Indikatorvariablen sind also genau dann unkorreliert, wenn die zugehörigen Ereignisse stochastisch unabhängig sind.

Sind A 1 , A 2 , , A n F {\displaystyle A_{1},A_{2},\dotsc ,A_{n}\in {\mathcal {F}}} beliebige Ereignisse, dann gibt die Zufallsvariable

N = i = 1 n χ A i {\displaystyle N=\sum _{i=1}^{n}\chi _{A_{i}}}

die Anzahl derjenigen Ereignisse an, die eingetreten sind. Wegen der Linearität des Erwartungswerts gilt dann

E ( N ) = i = 1 n P ( A i ) {\displaystyle \operatorname {E} (N)=\sum _{i=1}^{n}\operatorname {P} (A_{i})} .

Diese Formel gilt auch dann, wenn die Ereignisse abhängig sind. Sind sie zusätzlich paarweise unabhängig, dann gilt nach der Gleichung von Bienaymé für die Varianz

Var ( N ) = i = 1 n Var ( χ A i ) = i = 1 n P ( A i ) ( 1 P ( A i ) ) {\displaystyle \operatorname {Var} (N)=\sum _{i=1}^{n}\operatorname {Var} (\chi _{A_{i}})=\sum _{i=1}^{n}\operatorname {P} (A_{i})(1-\operatorname {P} (A_{i}))} .

Im allgemeinen Fall kann die Varianz über die Formel

Var ( N ) = i , j = 1 n Cov ( χ A i , χ A j ) = i , j = 1 n P ( A i A j ) i , j = 1 n P ( A i ) P ( A j ) {\displaystyle \operatorname {Var} (N)=\sum _{i,j=1}^{n}\operatorname {Cov} (\chi _{A_{i}},\chi _{A_{j}})=\sum _{i,j=1}^{n}\operatorname {P} (A_{i}\cap A_{j})-\sum _{i,j=1}^{n}\operatorname {P} (A_{i})\operatorname {P} (A_{j})}

bestimmt werden.

Siehe auch

Literatur

  • A. A. Konyushkov: Characteristic function of a set. In: Michiel Hazewinkel (Hrsg.): Encyclopedia of Mathematics. Springer-Verlag und EMS Press, Berlin 2002, ISBN 1-55608-010-7 (englisch, encyclopediaofmath.org). 
  • Carl Geiger, Christian Kanzow: Theorie und Numerik restringierter Optimierungsaufgaben. Springer-Verlag, Berlin Heidelberg New York 2002, ISBN 3-540-42790-2. 

Anmerkungen

  1. Die Bezeichnung 1 T {\displaystyle \mathrm {1} _{T}} wird aber auch für die Identitätsrelation bzw. -abbildung verwendet und kann daher leicht zu Verwechselungen führen.