Teil II Diskretisierung

Aufgabe
Schall
Licht
Abtastung
Quantisierung
MUSTERERKENNUNG
Teil II
Vorlesung im Sommersemester 2016
Diskretisierung
Binarisierung
Codierer
R
Binarisierung
Codierer
R
Σ
Prof. E.G. Schukat-Talamazzini
Stand: 11. März 2016
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht und Farbe
Abtastung
Quantisierung
Vorverarbeitung des Musters
Aufgabenstellung
Muster 7→ Digitalrechner 7→ „schöneres“ Muster
Aufnahme
Schallwellen — Geräusch, Klang, Sprache
Licht
f
Vorverarbeitung
Merkmale
Klassifikator
Ωκ
Arbeitsphase
Lernphase
Stichprobe
Lernen der
Klassenbereiche
Abtastung
Quantisierung
Binarisierung
Sonstige Codierer
Mathematische Hilfsmittel
Ziele
A/D-Wandlung
Datenreduktion
Störunterdrückung
Informationsfilterung
1. Diskretisierung
Sensordaten
maschinenlesbare (endliche!) Form
Diskretisierung
des
Definitionsbereichs (Abtastung)
Wertebereichs (Quantisierung)
2. Transformation
Gütekriterien
Diskretisiertes Muster
diskretisiertes Muster
Vorverarbeitung ⇒ Informationsverlust
Reproduzierbarkeit des Originals aus dem Resultat ?
Exakte Reproduktion
Perzeptuelle Äquivalenz
Semantische Äquivalenz
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Codierer
R
Σ
Schallwellen
Aufgabenstellung
Geräusch, Klang, Sprache
Schallwellen — Geräusch, Klang, Sprache
Physikalische Substanz
Licht und Farbe
Zeitlicher Verlauf des Schalldrucks
Schallquelle und -sensor
Abtastung
Spektralzerlegung
Stationäres Signal = Wellensalat reiner (Sinus-)Töne
Frequenz, Amplitude, Phasenverschiebung
Quantisierung
Physikalischer Reiz
physiologische Wahrnehmung
Binarisierung
Schallintensität (Signaleigenschaft)
Lautstärkeempfindung (tonhöhenabhängig)
Sonstige Codierer
Mustererkennung als Funktionsmodell ?
„Ein Flugzeug schlägt nicht mit den Flügeln ...“
Mathematische Hilfsmittel
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Schallwelle als Zeitsignal
Reine Sinustöne
Schalldruck, Amplitude f : IR → IR
Wiederholrate · maximale Auslenkung · Zeitverschiebung
Definition
Definition
Sei f : IR → IR eine Schallwelle und [t0 , t1 ] ⊂ IR. Dann heißt
Z t1
def
E =
f 2 (t) dt
Die Schallwelle
f (t) = A · sin(2πωt + φ)
t0
heißt reiner Ton mit der Amplitude A, der Schwingungsfrequenz ω
und dem Phasenwinkel φ.
die Schallenergie und
def
Is =
1
·
t1 − t0
Z
t1
• Amplitude in Pascal oder Dezibel (N/m2 , dB)
• Frequenz in Hertz (1/s)
f 2 (t) dt
t0
der Schallpegel (oder Intensität, in N/m2 bzw. Pascal) des Schalls f im
Intervall [t0 , t1 ]. Die Größen
I =
Is
I0
bzw. ` = 10 log10
Is
I0
bezeichnen wir als (logarithmierte, in Dezibel [dB]) Lautstärke.
•
•
R
0dB:
Standardpegel I0 etwas unterhalb der Hörschwelle
3dB:
diese Zunahme entspricht einer Pegelverdopplung
mehr Information
• Phase in Radian (φ ∈ [0, 2π])
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
R
Codierer
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Spektralzerlegung
Lautstärkeempfindung & Hörebene
Überlagerung von Sinuskomponenten unterschiedlicher Frequenz
Subjektiver Eindruck des Menschen ist frequenzabhängig!
Definition
Z
f˜ sei ein 1kHz-Schall gleicher subjektiver Lautstärke wie f .
Pegel(f )
ω = 1000 Hz
def
`(f ) [phon] =
˜
Pegel(f )
ω 6= 1000 Hz
∞
Aω · sin(2πωt + φω ) dω
f (t) =
0
heißt Spektralzerlegung des reellwertigen Signals f . Die
frequenzabhängigen Funktionen {Aω } und {φω } heißen
Amplitudenspektrum bzw. Phasenspektrum von f .
Beispielschallpegel
140 dB
120 dB
100 dB
80 dB
70 dB
50 dB
30 dB
20 dB
6 dB
0 dB
1
1.5
0
1
0.5
-1
0
-2
-0.5
-1
-3
-1.5
-2
-4
1
1.5
2
2.5
0
3
ω −1 · sin(2πωt), ω = 1, ..., 5
Aufgabe
Schall
Licht
Abtastung
0.5
1
P5
1
Quantisierung
1.5
2
2.5
Gewehrschuß nahebei
lautstarke Rockgruppe
Geschrei nahebei
belebte Straße
normale Unterhaltung
leise Unterhaltung
sanftes Flüstern
ländliche Gegend/Nacht
Hörschwelle bei 1000 Hz
Referenzpegel
Codierer
Aufgabe
Schall
Licht
40
40
20
20
3
0
20
Σ
60
60
3
R
80
80
ω −1 · sin(2πωt)
Binarisierung
100 phon
100
Pegel [dB]
2
0.5
Σ
Definition der Phonzahl
Die Darstellung
0
R
Codierer
Abtastung
50
100
200 Hz
Quantisierung
500
1
2 kHz
Binarisierung
5
10
20
Codierer
Kameraaufnahme
Aufgabenstellung
Vom Objekt zum Lichtermeer
Schallwellen — Geräusch, Klang, Sprache
P(x,y,z)
y
Licht und Farbe
P(x’,y’)
Lochkameramodell
x
z
Abtastung
Brennweite
Aufnahme:IR3 → IR2
Informationsverlust
(Verdeckung)
Quantisierung
Projektion
Binarisierung
Sonstige Codierer
Mathematische Hilfsmittel
Lineare Abbildung
Homogene Abbildung
perspektivisch
orthographisch
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Was ist Farbe ?
Subjektive Helligkeit eines Lichtpunkts
Farbe ist ein (elektromagnetischer) Wellensalat
Menschliche Helligkeitsempfindung ist wellenlängenabhängig
Codierer
R
Σ
Definition
Sei C (λ) = F 0 (λ) der Strahlungsenergieverlauf einer Lichtquelle. Der
Lichtstrom (in Lumen) ist definiert durch
Z ∞
def
∗
F = = K ·
Kλ · C (λ)dλ
C( λ)
λ
380 nm
780 nm
0
Definition
Er gibt die von einem Standardbeobachter wahrgenommene Helligkeit
einer Lichtquelle an.
Einen Strahlungsenergieverlauf C : [λmin , λmax ] → IR im Frequenzbereich
des sichtbaren Lichts bezeichnen wir als Farbe. Farben der speziellen
Gestalt
def
C (λ) = Cµmono (λ) = δ(λ − µ)
Photometrische Standards
1. Die Gewichtsfunktion (Kλ )λ∈IR ist ein CIE-Standard.
(CIE = Commission Internationale de l’Eclairage)
R
−1
2. Die Konstante lautet K ∗ =
Kλ dλ
= 683 [lm/W ].
heißen monochromatisch.
• Genauer: es ist C (λ) = F 0 (λ), und es ist F 0 (λ) dλ die Strahlungsenergie im
3. Der sichtbare Bereich farbigen Lichts liegt zwischen λ = 380nm und λ = 780nm.
Wellenlängebereich [λ, λ + dλ] in Watt.
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
Colorimetrie
Farbvergleichskurven
Darstellung in Farbräumen endlicher Dimension
Kurve der Tristimuluswerte über alle monochromatischen Farben
Empirische Wahrn.-Psychologie: Tristimulusdarstellung
• Die meisten Farben lassen sich (wahrnehmungsäquivalent) als
Definition
Linearkombination geeigneter Primärfarben erzeugen, z.B. Crprim , Cgprim , Cbprim
• Die erzeugenden Koeffizienten werden durch Wahrnehmungstest bestimmt.
• Beispiel Standardweiß: CW pz
= wr Crprim + wg Cgprim + wb Cbprim
• Betrachte weißnormierte Primärfarben, d.h. es gilt
Die Gewichtfunktionen αr (), αg (), αb () mit
pz X
Cµmono (λ) =
αx (µ) · Cxprim (λ)
r ,g ,b
pz
CW = Crprim + Cgprim + Cbprim (und damit wr = wg = wb = 1).
Definition
Bezogen auf ein weißnormales Primärfarbensystem
heißen die Koeffizienten in
pz
n
o
Crprim , Cgprim , Cbprim
C (λ) = ar Crprim (λ) + ag Cgprim (λ) + ab Cbprim (λ)
die Tristimuluswerte der Farbe C .
für jede monochromatische Farbe Cµmono heißen Farbvergleichskurven
n
o
(bezüglich Crprim , Cgprim , Cbprim ).
• CIE-Standard von 1931
drei monochromatische Primärfarben
ROT (λ = 700nm), GRÜN (λ = 546.1nm), BLAU (λ = 435.8nm)
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Beweis.
Farbvergleichskurven
Wahrnehmungstreue Reproduzierbarkeit
X
βx · Cxprim (λ)
x
X Z ∞
=
αx (µ)C (µ) dµ · Cxprim (λ)
0
(
)
Zx ∞
X
prim
=
C (µ) ·
αx (µ) · Cx (λ) dµ
x
Z0 ∞
pz
C (µ) · Cµmono (λ) dµ
=
0
Z ∞
=
C (µ) · δλ−µ dµ
Lemma
=
PR
=
RP
Def. der Farbvergleichkurven αx (·)
monochromatische Farben
mit den (drei) Koeffizienten βx =
Licht
Abtastung
R∞
0
αx (µ) · C (µ) dµ für x = r , g , b.
Quantisierung
Binarisierung
Codierer
C (λ)
der tödliche Diracstoß
Bemerkung
pz
Die Wahrnehmungsgleichheit = ist im Gegensatz zu = keine Äquivalenzrelation; es
pz
pz
pz
gilt nämlich i.a. nicht die Transitivität a = b ∧ b = c ⇒ a = c.
r ,g ,b
Schall
einsetzen für βx
0
In einem weißnormalen Primärfarbensystem gilt für jede Farbe C (λ) die
Tristimulusdarstellung
pz X
C (λ) =
βx · Cxprim (λ)
Aufgabe
das sollte = C (λ) sein!
In oben angegebener Herleitung tritt aber glücklicherweise nur eine perzeptionelle
Gleichheit auf.
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Chromatizitätskoordinaten
Falsch-, besser: Pseudofarbendarstellung
Bezüglich Helligkeit normierte Tristimuluswerte
Grauwert-Farbwert-Transformation φ : [0, 1] → [0, 1]3
Codierer
φ : IR3 → IR3 =IR
˜ 2 mit




r
R
1
 g =
· G 
R +G +B
b
B
Originalaufnahme (grauwertig)
Zuordnungspfad
Pseudofarbendarstellung (rückwärts)
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Diskretisierung
Aufgabenstellung
Endliche rechnerinterne Repräsentation eines Musters
Schallwellen — Geräusch, Klang, Sprache


f1 (x1 , x2 , . . . , xn )
 f2 (x1 , x2 , . . . , xn ) 

f (x) = 


···
fm (x1 , x2 , . . . , xn )
Licht und Farbe
Abtastung
Problem
Quantisierung
(Orte/Zeiten xj ∈ IR)
(Amplituden fi ∈ IR)
kontinuierlicher Definitionsbereich
kontinuierlicher Wertebereich
Binarisierung
Lösung
Amplitudenmessung nur an endlich vielen Stützstellen
Amplitudenwerte nur als Festkommagrößen darstellen
Sonstige Codierer
Mathematische Hilfsmittel
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Diskretisierung = Abtastung & Quantisierung
[?]
Analog-Digital-Wandlung (A/D)
Abtastung
Quantisierung
Binarisierung
CODEC — Kodierer / Dekodierer
Paradigma der Digitalen Signalverarbeitung (DSV/DSP)
Diskretisierung und Rekonstruktion
Abtastung
Quantisierung
·
·
·
·
·
·
·
·
Abtastperiode T [s]
Abtastfrequenz fA = 1/T [Hz]
Stützstellen {nT | n ∈ Z}
Abtastwerte fn = f˜(nT ), n ∈ Z
Speicherbedarf = fA · b [bit/s]
Wertebereich [−fmax , +fmax ] ⊂ IR
Kodierung mit b bit
2b Intervalle Iν = [aν−1 , aν ]
Intervallbreite ∆Q = 2fmax /2b
Aufnahme
Vorfilter
Abtasten
Quantisieren
Wiedergabe
Nachfilter
Dekodieren
(Verarbeiten)
Fragestellungen
Wieviele Abtastwerte?
Welche Schrittweite?
Wieviele Quantisierungsstufen?
Welche Quantisierungskennlinie?
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Abtastung bandbegrenzter Zeitsignale
Obergrenze B für die Frequenzen auftretender Spektralkomponenten
Definition
Beweis (1)
Fouriertransformationen vor und zurück:
Sei f : IR → C eine Zeitfunktion und
Z +∞
def
F (ξ) =
f (x)e −i ξx dx
+∞
Z
F (ξ)
f (x)e
=
, ξ ∈ IR
−i ξx
dx
−∞
−∞
f (x)
1
=
2π
ihre Fouriertransformierte. Die Funktion f heißt bandbegrenzt im
Frequenzbereich (−B, B), wenn für alle |ξ| > 2πB die Aussage F (ξ) = 0 gilt.
+∞
Z
·
F (ξ)e
i ξx
dξ
−∞
Fourierreihe einer Funktion, die in (−ξ0 , +ξ0 ) periodisch ist:
Satz (Abtasttheorem von Shannon)
Sei f : IR → IR bandbegrenzt im Frequenzbereich (−B, B) und
0 < ∆x ≤ 1/(2B) . Dann ist f vollständig durch seine Abtastwerte
fj := f (j · ∆x ), j = 0, ±1, ±2, . . . bestimmt und die
Rekonstruktionsgleichung lautet
+∞
X
f (x) =
x − j∆x
fj · sinc π ·
∆x
j=−∞
F (ξ)
+∞
X
=
aj e
2πi ·
jξ
2ξ0
j =−∞
aj
+ξ0
Z
1
=
·
2ξ0
F (ξ)e
−2πi ·
jξ
2ξ0
dξ
−ξ0
def
wobei sinc(r ) = sin(x)/x vereinbart sei.
Beweis (2)
Wir berechnen f (x) aus dem Umkehrintegral der Fouriertransformierten. Dabei betrachten wir F (ξ) als
eine Periode einer (gedanklich) periodisch fortgesetzten Funktion und entwickeln F (ξ) in eine
Fourierreihe mit den Koeffizienten:
aj
=
=
·
2ξ0
F (ξ)e
−2πi ·
jξ
2ξ0
2π ξ0
+ξ0
Z
·
F (ξ)e
f (x)
dξ
=
−j π
ξ0
1
2π
Z
·
·
=
f (−j∆x ) · ∆x
−ξ0
1
2B
=
Damit ergibt sich für F (ξ) die Darstellung als Fourierreihe:
=
+∞
X
=
2π
j =−∞
ξ0
=
+∞
X
·
jξ
2πi ·
2ξ0
aj e
+∞
X
f (−j∆x )e
f (j∆x )e
−ij ξ∆x
f (j∆x )e
+∞
X
=
+∞
X
∆x
∆x
∆x  e
{z
i ξx
dξ
}
F (ξ)
Z
+ξ0
f (j∆x )
e
i ξ(x−j ∆x )
∆x dξ
−ξ0
f (j∆x ) ·
f (j∆x ) ·
fj ·
−ij ξ∆x
j =−∞
j =−∞
j =−∞
ij ξ∆x

+∞
X

j =−∞
j =−∞
j =−∞
+∞
X
π
=
j =−∞
=
1
ξ0
+∞
X

|
=
mit ∆x =
+ξ0
dξ
π
f
ξ0
i ξ·
−ξ0
−jπ
=
F (ξ)
Wir setzen F (ξ) in das Umkehrintegral für f (x) ein:
−ξ0
1 π
+ξ0
Z
1
Beweis (3)
∆x
2π
∆x
2π
·
·
1
i (x − j∆x )
e
i ξ(x−j ∆x )
+ξ
0
−ξ0
2 sin(ξ0 (x − j∆x ))
x − j∆x
sin(2πB(x − j∆x ))
2πB(x − j∆x )
Die letzte Zeile folgt wegen ξ0 = 2πB, ∆x = 1/(2B) und f (j∆x ) = fj , und die vorletzte Zeile wegen der
Eulergleichung e iy = cos y + i sin y .
Ist B die Bandbegrenzung in der Voraussetzung des Abtasttheorems, so gilt obige Darstellung für jedes
∆x < 1/(2B) , weil dann ∆x = 1/(2B 0 ) für ein B 0 > B gilt und f (x) natürlich auch B 0 -bandbegrenzt ist.
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
R
Codierer
Σ
Aufgabe
Schall
Abtasten mit doppelter Nyquist-Grenzfrequenz
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Unschärfeprinzip der Wellenlehre
Erfolgreich in der Theorie und in der Praxis ?
f(t)
F( ω)
Theorie
Claude E. Shannon garantiert uns eine völlig verlustfreie
Abtastwertrepräsentation bandbegrenzter Signale.
t
ω
f(t)
F( ω)
Praxis
t
Die Signale (Zeitreihen, Bilder) der realen Welt sind nicht bandbegrenzt!
ω
f(t)
F( ω)
Definition
t
Die Funktion f : IR → C heißt zeitbegrenzt im Intervall (−b, b) wenn
gilt:
f (x) = 0 für alle |x| > b
ω
f(t)
F( ω)
t
ω
Satz (Paley & Wiener 1934)
Fakt
Fakt
Alle von Menschen und
Maschinen gemessenen
Sensorsignale sind zeitbzw. ortsbegrenzt!
Das (unendlich) periodische Fortsetzen
eines Signalintervalls erzeugt Unstetigkeiten
an den Nahtstellen, zerstört also
Frequenzbandbegrenzung!
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Es gibt (im Funktionenraum L2 ) keine Funktion außer der identisch
verschwindenden Funktion, die sowohl bandbegrenzt wie auch
zeitbegrenzt ist.
R
Codierer
Σ
Aufgabe
Schall
Licht
Abtastung
Schallabtastung
Quantisierung
Quadratisches Gitter
4/8-Nachbarschaft.
Beispielszenarien
• Analogtelefon (300 Hz – 3.4 kHz)
ATR = 8 kHz
• Sprache & HQ-Mikrofon
ATR = 16 kHz
• Musik
ATR = 44.1 kHz
• (analog vorgefiltert)
quadratisch
hexagonal
1
1
1
0.5
0.5
0.5
0
0
0
-0.5
-0.5
-0.5
-1
5
10
15
Analogsignal
20
triagonal
Hexagonale und
tridiagonale Gitter
besitzen „schönere“
Nachbarschaftsstruktur,
aber kompliziertere
Rasterpunktformeln.
Eindimensionale Muster (äquidistante Stützstellen)
ATR = . . . kHz
0
Codierer
Bildrasterung
Existenz und Lage der Bandbegrenzung ist anwendungsabhängig
-1
Binarisierung
Abtastung∆x :
5
10
15
suffiziente Abtastung
20
→
7→
J
IR
fj = f (x0 + j∆x )
,
J=
x1 − x0
∆x
Zweidimensionale Muster (quadratisches Gitter)
-1
0
IR[x0 ,x1 ]
{f (x)}
0
5
10
15
Unterabtastung
20
Rasterung∆x ,∆y :
IR[x0 ,x1 ]×[y0 ,y1 ]
{f (x, y )}
→
7→
Jx ·Jy
IR
fj,k = f (x0 + j∆x , y0 + k∆y )
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Skalare Quantisierung
Aufgabenstellung
• Das Intervall [fmin , fmax ] wird mit 2B Stufen quantisiert
Schallwellen — Geräusch, Klang, Sprache
• Reelle Werte werden mit ihrem Intervallindex kodiert (B bit/ATW)
Licht und Farbe
f’
1
j
f
f’
1
j
j
fmin
0
Abtastung
fmax
0
f
j
S
Quantisierung
lineare Quantisierung
Zerlegung in Teilintervalle gleicher Länge (s. Abb.)
Binarisierung
nichtlineare Quantisierung
Sonstige Codierer
· Intervalle unterschiedlicher Länge
· Kompandierungsfunktion & lineare Quantisierung
Mathematische Hilfsmittel
Vektorquantisierung
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Quantisierungsfehler
Abtastung
Quantisierung
Binarisierung
Codierer
Lineare Quantisierer
„Jedes Bit verbessert die SNR eines Quantisierers um etwa 6 dB“
Definition
Sei {fj } eine Abtastfolge und {fj0 } das Ergebnis ihrer Quantisierung. Die
Differenzfolge
def
nj = fj − fj0
heißt Quantisierungsrauschen, das Erwartungswertverhältnis
r0 =
E[fj2 ]
E[nj2 ]
bzw. r = 10 · log10 r 0
wird als (logarithmiertes, in dB) Signal-Rausch-Verhältnis oder
Störabstand bezeichnet (SNR = „signal-to-noise ratio“).
Bemerkung
Die Schreibweise der Energie als zweites Moment setzt Mittelwertfreiheit der
beteiligten Signale voraus.
0 dB: Rauschenergie = Nutzsignalenergie
6 dB: relative Steigerung/Senkung des Nutzpegels/Rauschpegels um den Faktor 2
20 dB: Nutzpegel zehnmal höher als Rauschpegel
Satz
Für einen linearen Quantisierer mit 2B Quantisierungsstufen beträgt das
Signal-Rausch-Verhältnis unter den im Beweis genannten
Voraussetzungen
r = 6B − 7.2
[dB]
Idealisierte Voraussetzungen
1. kein Übersteuern:
fj ∈ [fmin , fmax ] für alle j
2. Amplitudenkonzentration wie N (µ, σ) oder besser:
3. näherungsweise uniformes Rauschen:
4σ-Regel
B
Intervallzahl 2 hinreichend groß
Folgerung
Mit fmax = −fmin = C σf beträgt der SRA r = 6B + 4.8 − 20 log10 C .
R
Σ
Aufgabe
Beweis.
Es bezeichne ∆ := (fmax − fmin )
2
B
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
die Schrittweite des Quantisierers.
Beispielszenarien
Ist die Zahl 2B der Quantisierungsstufen hinreichend groß und wird der Quantisierer niemals übersteuert,
so dürfen wir den Quantisierungsfehler (das Rauschen) als näherungsweise gleichverteilt annehmen:
Quantisierung audiovisueller Daten
−∆/2 ≤ nj ≤ ∆/2
sonst
1/∆
0
P(nj ) =
• Bilder — 1 Byte = 8 bit (ggf. je Farbkanal)
Wegen E[nj ] = 0 (Mittelwertfreiheit) besitzt der Quantisierungsfehler die Varianz
+∆/2
Z
2
E[nj ] =
1
2
−∆/2 ∆
· nj dnj =
∆2
• Sprache — 8 bit für Telefonqualität
12
• Audio (CD/DAT) — 2×16 bit (1.41 Mb/s)
Sei nun o.B.d.A. unser Signal mittelwertfrei, d.h. E[fj ] = 0. Die Intervallgrenzen
fmin
def
= −4σf ,
fmax
def
= +4σf ,
σf
def
• DAB (Digital Audio Broadcasting) — 256 kb/s
q
E[fj2 ]
=
vermeiden fast sicher eine Übersteuerung des Quantisierers und implizieren die konkrete Schrittweite
∆ =
(+4σf ) − (−4σf )
2B
=
8σf
Aufgabe
0
=
Schall
E[fj2 ]
E[nj2 ]
Licht
=
σ2
f
2
∆ /12
12σ 2
f
=
64σ 2 /(2B )2
=
f
Abtastung
12
64
·2
Quantisierung
2B
= 12 · 2
f min
j
Binarisierung
fmax
a0 a1
8 kHz 1×8 bit
44.1 kHz 2×16 bit
44.1 kHz 2×16 bit
Video MPEG–2
Video NTSC
Video HDTV
2B−6
Nichtlineare Quantisierer
f
SPEZIFIKATION
2B
und den Störabstand (s.u.); die Logarithmierung von r 0 ergibt dann das erwünschte Resultat.
r
TYP
Audio verständlich
Audio MPEG-Codierung
Audio CD/DAT
a2 a3 a4 a5
Codierer
24 bit/pel 640×480
24 bit/pel 640×480
24 bit/pel 1280×720
b2
bL
0.42 MB/s
27 MB/s
81 MB/s
Beweis.
Wir bilden die partiellen Ableitungen von εP nach bν und setzen sie gleich Null:
aL
b3 b4 b5
kbit/s
kbit/s
Mbit/s
MB/h)
Σ
Z
∂εP
aν
!
−2 · (f − bν ) · P(f ) df = 0
=
∂bν
b1
64
384
1.41
(635
R
f’
j
DATENRATE
aν−1
Daraus folgt auch schon die Bestimmungsgleichung für die bν .
Analog erhalten wir für die Intervallgrenzen aν :
Satz
Die optimale Quantisierungskennlinie, die den Verzerrungfehler
εP =
L Z
X
ν=1
∂εP
∂aν
aν
(f − bν )2 · P(f )df
aν−1
=
=
!
=
∂
∂aν
"Z
aν
Z
2
(f − bν ) · P(f ) df +
aν−1
2
aν+1
#
2
(f − bν+1 ) · P(f ) df
aν
2
(aν − bν ) P(aν ) − (aν − bν+1 ) P(aν )
0
Auflösen nach aν ergibt das obere System von Bestimmungsgleichungen.
minimiert, ist durch die Gleichungen
Im Beweis ist zu fordern, daß P(aν ) 6= 0 (∀ν) gilt.
aν =
bν + bν+1
2
R aν
und
bν =
f · P(f ) df
aν−1
R aν
P(f ) df
aν−1
für ν = 1, 2, . . . , L − 1 bzw. ν = 1, 2, . . . , L gegeben.
Die Bestimmungsgleichungen des Satzes sind gekoppelt und daher nur für eine iterative Berechnung der
Kennlinie zu verwenden.
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Nichtlineare Quantisierung
32000*log10(1+100*x/32000)/log10(1+100)
32000*log10(1+500*x/32000)/log10(1+500)
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Binarisierung
Codierer
R
Σ
Aufgabenstellung
Näherungsweise gleichverteilende Transformation + lineare Quantisierung
35000
Aufgabe
32000*log10(1+100*x/32000)/log10(1+100)
32000*log10(1+500*x/32000)/log10(1+500)
35000
Schallwellen — Geräusch, Klang, Sprache
30000
30000
25000
Quantisierung
Quantisierung
25000
20000
15000
Licht und Farbe
20000
15000
10000
10000
Abtastung
5000
5000
0
0
5000
10000
15000
20000
Signalamplitude
25000
30000
0
1
Bereiche großer Amplituden komprimiert
Bereiche kleiner Amplituden expandiert
10
100
Signalamplitude
1000
10000
(einfach logarithmische Darstellung)
Quantisierung
Das logarithmische Kompandierungsgesetz (µ-Law)
Binarisierung
|f |
0 def
fj = fmax · sign(fj ) ·
j
log(1 + µ fmax
)
log(1 + µ)
,
Sonstige Codierer
µ ∈ 100 . . . 500
überführt betragsmäßig exponentiell verteilte Amplitudenwerte in eine
Gleichverteilung.
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Mathematische Hilfsmittel
Codierer
R
Σ
Aufgabe
Schall
Binarisierung von Grauwertbildern
Graustufen {0, 1, . . . , L − 1}
Licht
Abtastung
Quantisierung
Binarisierung von Grauwertbildern
Schwarz-Weiß-Codes {0, 1}
Objekt-Hintergrund-Entscheidung durch Schwellwertvergleich
GRAUWERTGEBIRGE EINER BILDZEILE
160
140
Grauwertstufe
120
100
SCHWELLWERT = 90
80
60
40
20
0
100
200
300
400
500
x-Ordinate
Originalbild
(512 × 512, 8 bit)
Binärbild
Objekt(S) · Hintergrund(W )
Horizontaler Grauverlauf
(Zeile 250)
Binarisierung
· dient der Objekt-Hintergrund-Segmentierung
· gelingt wenn alle O-Punkte dunkler als alle H-Punkte
· gelingt wenn alle O-Punkte heller
als alle H-Punkte
Nachbearbeitung
· erfordert i.a. Korrektur durch
des Binärbildes
Vorverarbeitung
Originalbild
(512 × 512, 8 bit)
Binärbild
(Objekt: fjk ≤ 130)
Binärbild
(Objekt: fjk ≤ 80)
Definition
Sei f : D → {0, . . . , L − 1} ein Grauwertbild und θ ein Grauwert. Das
Binärbild f θ : D → {0, 1} mit
1
fjk > θ
θ
fjk =
, (j, k) ∈ D
0
fjk ≤ θ
heißt Binarisierung von f zum Schwellwert θ.
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
Binarisierung von Grauwertbildern
Grauwerthistogramm
Funktioniert nicht immer & ist manchmal richtig schwierig
Häufigkeitsstatistik der im Bild auftretenden Grauwerte
R
Σ
GRAUWERTGEBIRGE EINER BILDZEILE
200
MIKROSKOPISCHE BODENPROBE IN ACRYL
16000
180
14000
160
140
12000
Absolute H ufigkeit
Grauwertstufe
SCHWELLWERT = 128
120
100
80
60
10000
8000
6000
4000
40
20
0
100
200
300
400
2000
500
x-Ordinate
Originalbild
(512 × 512, 8 bit)
Binärbild
(Objekt: fjk ≤ 128)
60
80
100
Grauwertstufe
def
120
140
160
Quantisierung
(0 ≤ ` < L)
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
Binarisierungsschwellwert
Gaußsches Mischverteilungsmodell
Kriterien zur Bestimmung aus dem Grauwerthistogramm
Grauwerte von Objekt/Hintergrund folgen je einer Normalverteilung
MIKROSKOPISCHE BODENPROBE IN ACRYL
Mittiger Grauwert
16000
Histogramm-Minimum
14000
θ = L/2
θ = argmin q` = argmin Q`
θ = E[`|{q` }] =
L−1
X
q` · `
`=0
Histogramm-Hauptsenken
· das zentralste relative Minimum
· das absolute Minimum in [`max
, `max
]
1
2
Ein Wert θ mit der Eigenschaft
10000
8000
6000
4000
2000
Maximale Entropie
Hθ ({q` }) ist definiert als
Grauwertmedian
12000
`
Absolute H ufigkeit
`
Grauwertdurchschnitt
n
o
n
o
(1 − λθ ) · H( q`<θ ) + λθ · H( q`>θ )
0
0
20
q(`) =
=
θ−1
X
`=0
q` ≤ 1/2 und
L−1
X
`=θ+1
q` ≤ 1/2
180
heißt absolutes
Grauwerthistogramm von f , das Zahlenfeld {q` } mit
P
q` = Q` / m Qm heißt normiertes Grauwerthistogramm von f .
viele Objekte, Verdeckungen, problematische Beleuchtung, ...
Abtastung
40
Q` = Anzahl der (j, k) ∈ D mit fjk = ` ,
Komplexe Szenen
Licht
20
Sei f : D → {0, . . . , L − 1} ein Grauwertbild. Das Zahlenfeld {Q` } mit
· Finden eines optimalen Schwellwertes
· Vermeidung u/o Korrektur von Fehlzuordnungen
· Trick 17: Einfärben des Hintergrundes o.ä.
Schall
0
Definition
Einfache Objektansichten
Aufgabe
0
Bodenprobe in Acryl
Horizontaler Grauverlauf
(Zeile 250)
mit
Teilhistogrammen
n den
o unteren/oberen
n
o
q`<θ und q`>θ
=
40
60
80
100
Grauwertstufe
120
140
160
180
λu · qu (`) + λo · qo (`)
λu · N (` | µu , σu2 ) + λo · N (` | µo , σo2 )
1 `−µu 2
1 `−µo 2
1
1
λu · √ · e − 2 ( σu ) + λo · √ · e − 2 ( σo )
σu 2π
σo 2π
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Intermeans-Algorithmus
hAlgorithmusi
Wähle θ0 beliebig (z.B. Mittelwert); setze r = 0
1
Berechne unteren und oberen Grauwertdurchschnitt:
, θ −1
, L−1
θX
L−1
r −1
r
X
X
X
<
>
µr =
q` · `
q` und µr =
q` · `
q`
2
`=θr
3
Abtastung
Codierer
R
Binarisierung
Codierer
R
Σ
Binarisierung
Sonstige Codierer
Bemerkung
Der Intermeans-Algorithmus ist ein sehr einfacher Spezialfall der
Mischverteilungsidentifikation mittels EM-Prinzip (’expectation-maximization’).
Licht
Binarisierung
Quantisierung
µ<
µ>
r
+ r
2
2
Abbruch oder Schritt (1)
Schall
Quantisierung
Abtastung
`=θr
isumhtiroglAh
Aufgabe
Abtastung
Licht und Farbe
Berechne neue Grauwertschwelle
θr +1 =
Licht
Schallwellen — Geräusch, Klang, Sprache
0
`=0
Schall
Aufgabenstellung
Iterative Berechnung des optimalen GMV-Schwellwertes für λu = λo , σu2 = σo2
`=0
Aufgabe
Quantisierung
Binarisierung
Codierer
Mathematische Hilfsmittel
R
Σ
Aufgabe
Schall
Sonstige Mustercodierverfahren
Licht
Abtastung
Quantisierung
Σ
Kettencode (’Freeman code’)
Codierung von Linienmustern oder Konturen (Objektumrissen)
Lauflängencodierung
3
Es werden Paare der Art hGrauwert, Daueri angegeben. (Binärbilder!)
2
1
Differentielle Codierung
Statt der fj werden die Differenzen fj∆ = fj − fj−1 quantisiert.
(hohe Abtastfrequenz
kleine fj∆ )
0
4
Transformationscodierung
Die Abtastfolge f wird durch das Ergebnis einer Reihenentwicklung f 0 = Af ,
A ∈ IR(M×N) , repräsentiert.
Vektorquantisierung
Statt skalarer Abtastwerte fj werden komplette Vektoren (fj , . . . , fj+S ) auf
Quantisierercodewörter abgebildet.
Fraktale Codierung
Eine (affine) Selbstähnlichkeit der Abtastfolgen wird ausgenutzt:
f 7→ (A, b) mit f = Af + b und dem Fixpunktdecoder f n = Af n−1 + b
5
(Kontur-)Linienrasterpunkte
werden durch die Folge ihrer Richtungselemente codiert.
Beispiel
Obiges Linienmuster wird durch den Kettencode
4 4 3 2 3 2 1 2 0 0 1 0 0 0 7 0 7 7 7 7 6 7 6
verschlüsselt.
6
7
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Binarisierung
kontinuierliche
Funktion
kontinuierliches
Frequenzspektrum
f(x)
Licht und Farbe
Σ
F( ξ)
ξ
x
Satz (Fourierintegrale)
Abtastung
Wenn
R +∞ f : IR → C die Dirichletbedingungen erfüllt und das Integral
|f (x)| dx konvergiert, dann gilt für f die folgende Darstellung:
−∞
Quantisierung
f (x)
=
F (ξ)
=
Binarisierung
Z +∞
1
F (ξ) · e i ξx dξ
2π −∞
Z +∞
f (x) · e −i ξx dx
−∞
Sonstige Codierer
Bemerkung
Die Funktion F : IR → C heißt Fouriertransformierte von f , die zweite Gleichung des
Satzes ist die Hintransformation, die erste Gleichung die Rücktransformation.
Mathematische Hilfsmittel
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Kontinuierliche Fouriertransformation
Rechenregeln für Fouriertransformierte
Spezialfall: reellwertige Funktionen f : IR → IR
Zeitbereich — Frequenzbereich
Definition
Eine Funktion f : IR → IR heißt gerade, wenn für alle x ∈ IR die Aussage
f (−x) = f (x) gilt. Sie heißt ungerade, wenn für alle x ∈ IR die Aussage
f (−x) = −f (x) gilt.
Bemerkung
cos(x) ist gerade, sin(x) ist ungerade, die Gerade f (x) = a · x ist ungerade.
Lemma
Jede Funktion f : IR → IR läßt sich eindeutig in eine Summe aus geradem und
ungeradem Anteil zerlegen; wähle
f (x) + f (−x)
fg (x) =
2
def
und
f (x)
F (ξ)
f (ax)
1
F (ξ/a )
|a|
Verschiebung
f (x − x0 )
e −i ξx0 F (ξ)
Symmetrie
1
− 2π
F (x)
f (−ξ)
Ableitung
d n f (x)
dx n
(iξ)n F (ξ)
Faltungssatz
f ?g
F (ξ) · G (ξ)
Skalierung
f (x) − f (−x)
fu (x) =
.
2
def
Definition (kontinuierliche Faltung)
Folgerung
Für reellwertige Funktionen lauten die speziellen Gleichungen der
Fouriertransformation:
1
2π
R
Komplexwertige Funktionen im Zeit- und Frequenzbereich[?]
Schallwellen — Geräusch, Klang, Sprache
f (x) =
Codierer
Kontinuierliche Fouriertransformation
Aufgabenstellung
Aufgabe
Quantisierung
Z
+∞
−∞
Aξ cos(ξx) + Bξ sin(ξx) dξ und
R
Aξ = R f (x) cos(ξx) dx
Bξ =
f (x) sin(ξx) dx
Für zwei Funktionen f , g : IR → C heißt
Z +∞
h(x) =
f (ξ) · g (x − ξ) dξ
−∞
das Faltungsintegral; wir schreiben auch kürzer h = f ? g .
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Fourierreihen periodischer Funktionen
Fourierreihen periodischer Funktionen
Komplexwertige Funktionen im Zeit- und Frequenzbereich
Reellwertige Funktionen im Zeit- und Frequenzbereich
periodische
kontinuierliche
Funktion
f(x)
diskretes
Frequenzspektrum
Codierer
R
Σ
|Fκ|
Definition (reelle Fourierreihe)
x
T
Besitzt f : IR → IR die Periode T , so heißt
κ
∞
a0 X
f˜(x) =
+
{ak cos(kωx) + bk sin(kωx)}
2
Definition (komplexe Fourierreihe)
k=1
Besitzt f : IR → C die Periode T und ist ω = 2π/T , so heißt
f˜(x) =
+∞
X
mit den Fourierkoeffizienten
Z
2 T
f (x) cos(kωx) dx
ak =
T 0
Fk · e ikωx
k=−∞
mit den komplexen Fourierkoeffizienten
Z
1 T
Fk =
f (x) · e −ikωx dx
T 0
und
bk =
2
T
T
Z
f (x) sin(kωx) dx
0
die Fourierreihe von f . Dabei bezeichnet ω = 2π/T die zu T gehörende
Kreisfrequenz.
die komplexe Fourierreihe von f .
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Umrechnen der Fourierkoeffizienten
Fk
k=0
k>0
k<0
und
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
Konvergenz & Parsevalsche Gleichung
Satz
Komplexe und reelle Koeffizienten

 a0 /2
(ak − ibk )/2
=

(a−k + ib−k )/2
Schall
Ist die periodische Funktion f beschränkt und erfüllt die Dirichlet-Bedingungen,
so konvergiert ihre Fourierreihe im Mittel gegen f .

 ak = Fk + F−k

bk = i · (Fk − F−k )
Polare und reelle Koeffizienten
Summe von cos- und sin-Anteilen ist auch durch Phasenverschiebung
darstellbar:
ak cos(kωx) + bk sin(kωx) = Ak · cos(kωx + φk )
Satz
Für konvergierende reelle (komplexe) Fourierreihen periodischer Funktionen
gelten die Gleichungen
Z
∞
2 T
a02 X 2
|f (x)|2 dx =
+
ak + bk2
T 0
2
k=1
Z T
+∞
X
1
|f (x)|2 dx =
|Fk |2
T 0
k=−∞
mit den Koeffizienten
Ak =
q
ak2 + bk2
und
bzw. ak = A · cos φk und bk = −A · sin φk .
tan φk = −
bk
ak
Bemerkung
Periodische Funktionen können also im Konvergenzfall durch ein diskretes Spektrum
repräsentiert werden.
Die Signalenergie einer Periode kann im Zeitbereich integriert werden oder aber im
Spektralbereich summiert.
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
R
Σ
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Fouriertransformation diskreter Abtastfolgen
Frequenzband & Einheitskreis
f ist diskret genau dann, wenn F periodisch ist
Was bedeuten die komplexen Spektralkoeffizienten Fω ?
iω
F(e )
π
2π
ω
is
0
2π
κ
0
re
sk
fκ
eit
nh
periodisches
kontinuierliches
Frequenzspektrum
Ei
diskrete
Abtastwertfolge
Codierer
ω
z−Ebene
B
2B
Bandgrenze
AT−Frequenz
Hz
Definition
1. Das Spektrum Fω ist 2π-periodisch
Ist f = [fk ] eine Abtastwertfolge, so heißt
2. Nach Abtastung mit 2B Hertz repräsentiert Fω die Spektralinformation
für ω · B/π Hertz
F (e i ω ) = Fω =
+∞
X
fk · e −i ωk
3. Für reellwertige [fk ] sind Fω , F−ω konjugiert komplex
k=−∞
4. Die Fourierkoeffizienten sind komplexe Zahlen
die Fouriertransformierte von f und
Z +π
1
f˜k =
F (e i ω ) · e i ωk dω
2π −π
Fω = Aω · e i φω = |Fω | · e i arg Fω
5. Reelle Funktionen besitzen bei ω die Schwingungskomponente
Fω · e 2i ωBx + F−ω · e −2i ωBx = 2Aω · cos(2Bωx + φω )
die Rücktransformierte; die Summe heißt Spektralzerlegung der Folge.
Aufgabe
Schall
Licht
Abtastung
Quantisierung
Binarisierung
Codierer
Zusammenfassung (2)
1. Die Vorverarbeitung eines Musters besteht aus Diskretisierung und
Transformation.
2. Schall ist ein Gemisch aus reinen Sinustönen mit frequenzabhängigem
Lautstärkeeindruck.
3. Farbiges Licht ist ein Gemisch aus monochromen Anteilen mit
frequenzabhängigem Helligkeitseindruck.
4. Trotzdem läßt sich jede Farbe wahrnehmungstreu durch nur drei
Primärfarbkoordinaten repräsentieren.
5. Die Abtastung eines Musters ist informationsverlustfrei, wenn mindestens
mit der doppelten Nyquistfrequenz gearbeitet wird.
6. Beim linearen Quantisierer verbessert sich der Signal-Rausch-Abstand
um 6 dB je aufgewendetem Darstellungsbit.
7. Die Binarisierung eines Grauwertbildes dient der Trennung von Objekt
und Hintergrund.
8. Die optimale Grauwertschwelle wird automatisch auf Grundlage des
Grauwerthistogramms bestimmt.
9. Der Freeman-Code wird zur Repräsentation von Linienmustern oder
Objektkonturen genutzt.
R
Σ
R
Σ