DIGITALTECHNIK

Im folgenden ist beschrieben, wie ein Audiosignal auf CD aufgezeichnet wird und wieder in Schall zurückgewandelt wird:




Die Rückwandlung:






Boolsche Algebra

1.) AND





Es gilt: (gesprochen c=a und b)

Rechenregel:
ab c
000
010
100
111

Bei einem logischen AND ist das Ergebnis nur

dann eins, wenn alle Eingänge auf eins sind.

3.) EXOR (Antivalenz)





Es gilt:

Rechenregel:
ab c
000
011
101
110

Bei einem logischen EXNOR ist das Ergebnis immer dann eins, wenn beide Eingänge unterschiedlich sind.

5.) NOR (Nicht ODER)





ab c
001
010
100
110

2.) OR





Es gilt: (gesprochen c=a oder b)

Rechenregel:
ab c
000
011
101
111

Bei einem logischen OR ist das Ergebnis immer dann eins, wenn mindestens 1 Eingang auf eins ist.

4.) NAND (Nicht-AND)





Es gilt:

ab c
001
011
101
110





6..) EXNOR (Equivalenz)





ab c
001
010
100
111

Das D-Flip-Flop







Das D-Flip-Flop funktioniert nach folgendem Prinzip: Bei jedem Taktwechsel liegt an Q das an, was an D anliegt, solange bis CP sich ändert. Der Ausgang Q "merkt" sich das Signal von D zum Zeitpunkt des Taktwechsels. Ändert sich CP, wird Q aktualisiert.

Beispiel:












Das D-Flip-Flop findet Anwendung bei Geräten mit Status-LED´s (die meisten Studiogeräte). An dem Ausgang Q ist eine LED angeschlossen, die z.B. signalisieren soll, ob das Gerät in einem bestimmten Modus ist. Mit Hilfe des D-Flip-Flop´s wird ein Taktwechsel an CP angelegt, und die LED aktualisiert sich.

Der Komparator

Der Komparator hat das Symbol






Der Komparator besitzt 2 analoge Eingänge und einen "digitalen" Ausgang. Der Baustein arbeitet nach der Rechenvorschrift:

Ist die Spannung an + größer als die Spannung an -, so ist das Ergebnis gleich 1.

Ist die Spannung an - größer als die Spannung an +, so ist das Ergebnis gleich 0.

Abbildung 1Das BCD-Format

Das BCD-Format wurde entwickelt, um Dezimalstellen einfacher darstellen zu können. Für jede Dezimalstelle gibt es 4 Bits. Zum Beispiel ist die Dezimalzahl 1 im BCD-Format 0001, die 3 ist 0011

Positive und negative Werte in Binärform

Wie stellt man eine Sinusschwingung dar ?

Möglichkeit 1: Der größte negative Wert ist Null. Problem: Bei Addition wird das Ergebnis verfälscht.

Möglichkeit 2: Zweier Komplement

(Der Strich bedeutet invertieren.

Hier ein Beispiel:

Die gesuchte Zahl ist -4

+4 ist 0100

Invertieren 1011

+1 (s. Formel) 1100

Hier eine Übersicht der 2er Komplemente bei 4 Bit:
-81000
-71001
-61010
-51011
-41100
-31101
-21110
-11111
00000
10001
20010
30011
40100
50101
60110
70111

Das Nyquist Theorem

Es gilt: Ft > 2Fs, Ft = Abtastfrequenz, Fs = Signalfrequenz,

Abbildung 2

Das Nyquist theorem besagt: Die Abtastfrequenz muß doppelt so hoch sein, wie die höchste im Signal vorhandene Frequenz. Um das Theorem nicht zu verletzen, schaltete man in den Anfängen der Digitaltechnik einen Tiefpassfilter vor den A/D Wandler , der nur Frequenzen <= 20 kHz passieren lies. Ein normaler Filter funktioniert hier nicht, da er nur eine Flankensteilheit von 6 dB pro Oktave hat. Man nahm einen Parrallelschwingkreis. Dieser hat bei seiner Resonanzfrequenz einen unendlich hohen Widerstand. Man nennt dies auch einen T2-Filter (s. Zeichnung).

Aber auch ein T2-Filter verfälscht die Phasenlage eines Signals. Daher sampelt man heutzutage nicht mit 44,1 kHz, sondern mit einem vielfachen von diesem, z.B. 88,2 kHz. Dies nennt man Oversampling. Durch die verdoppelte Abtastfrequenz sind Filter mit hoher Flankensteilheit nicht notwendig.

Sample & Hold













Bei geschlossenem Schalter (Samplemodus) soll sich der Kondensator möglichst schnell aufladen.

Wenn der Schalter geöffnet ist (Hold), soll der Kondensator möglichst lange geladen bleiben.

Warum 2 Operationsverstärker ?

Es werden zwei Operatiosnverstärker benötigt, für die Entkopplung.

Der Sample & Hold Vorgang

(Zeichnung auf der nächsten Seite)

Die Sample & Hold Schaltung hält das Signal, welches zum Zeitpunkt des Schalterschließens anliegt.

In der Acquisition Time (Einschwingungsvorgang) kann nicht gewandelt werden. Der Schalter braucht eine gewisse Zeit, um sich zu öffnen (aparture delay), dies ist abhängig von der Signalspannung (aparture jitter). Nach dem öffnen des Schalters erfolgt die setting time. Weil der Schalter geöffnet ist, muß sich das System erst darauf einrichten.

Nach dem öffnen des Schalters kann sich das Audiosignal ja trotzdem weiter verändern, dies wird dem Signal beigemischt (feed through).

Wozu ist ein Sample & Hold nötig ?

Die verschiedenen Wandlerschaltungen (s. folgende Seiten) arbeiten fast immer mit Schaltern Bei einem Schalter kann die Ausschaltzeit größer sein als die Einschaltzeit, im Klartext: Ein Schalter braucht z.B. länger, um zu öffnen, als sich zu schließen. Bedenkt man, das bei einer Abtastfrequenz von 44, 1 kHz mit 2fach Oversampling der Schalter sich 132 300 mal in der Sekunde öffnen und schließen muß, kann dieser Zeitunterschied schon sehr ins Gewicht fallen. Diese Effekte nennt man Glitches. Um die Glitches auszublenden, ist ein Sample & Hold nötig. Die Sample & Hold Schaltung nennt man in diesem Fall "DeGlitcher".

Der Phase-Jitter

Für eine optimale A/D Wandlung ist es nötig, daß die Abtastmomente in gleichmäßigen Zeitabständen erfolgen. Wenn zeitliche Schwankungen passieren, wird das Signal verfälscht. Um dies zu verhindern, benutzt man hochwertige Oszillatoren, die sehr genau arbeiten. Es kann jedoch passieren, das diese von einem Störsignal moduliert werden (z.B. 50 Hz Signal vom Wechselstrom). Dann ist bei der Wiedergabe des digitalisierten Signals die Modulationsfrequenz zu hören.

Der Wandlerprozess

Abbildung 3

Alle Signale unter 0,5 Volt sind 0, alle Signale über 0,5 Volt sind 1 usw. Solange die Abstände gleichmäßig sind, spricht man von einer linearen Quantisierung. Weil aus 0,7 V als auch aus 1,3 V binär eine 1 wird, spricht man von einem Quantisierungsfehler. Dieser ist immer ½ LSB.

Bei höherer Auflösung (z.B. 8 Bit) wird der Quantisierungsfehler geringer.

Die SignalToNoise-Ratio, also der Abstand zwischen lautestem Signal und rauschen (auch Dynamikumfang genannt) berechnet man :


s/n signal to noise ratio



s/n = n * 6 dB + 1,8 dB

n = Anzahl der Bits

Durch übersteuern im digitalen Bereich wird das Signal abgeschnitten

Ein Beispiel zu der Formel:

Die Auflösung ist 16 Bit. Also gilt:

s/n = 16 * 6 + 1,8

s/n = 97,8 dB

Dies ist aber leider nur ein theoretischer Wert. Denn man muß noch folgendes beachten:

Abbildung 4

Daraus ergibt sich: Der wirklich nutzbare Bereich ist ungefähr 70 dB.

Dither

Bei einer Sinusschwingung wird der Quantisierungsfehler regelmäßig. Daher benutzt man das Dithering: Bei der Wiedergabe fügt man dem Signal Rauschen hinzu. Dadurch wird der Quantisierungsfehler zufällig, und nicht als störend empfunden.

Anmerkung zu den Wandlerschaltungen auf den folgenden Seiten

Zählverfahren

Der Nachteil bei dem Zählverfahren: Es ist für Audioanwendungen allgemein zu langsam, da die Schaltung bei jedem Sample hochzählen muß

Waegeverfahren

Das Waegeverfahren findet in nahezu allen Effektgeräten Anwendung. Es wird nicht einfach hochgezählt, sondern jedes Bit durchgetestet.

Datenreduktion

Bei einem DAT-Rekorder mit 48 kHz / 16 Bit treten 768 Kbit in der Sekunde auf (MONO).

Daher ist es sinnvoll, die Daten zu reduzieren. Es gibt verschiedene Verfahren bei der Datenreduktion:

1. Nicht-lineare Quantisierung

Bei diesem Verfahren sind die zeitlichen Abstände der Abtastung nicht gleichmäßig. Die Abstände werden mit zunehmender Spannung größer und es passieren mehr Fehler. Die Fehler hört man aber nicht sehr stark, da das Verhältnis Signal zu Fehler gleich bleibt.

Anwendung:

- DAT im Longplaymodus. Daraus ergibt sich: 32 kHz / 12 Bit. Es fallen nur noch 364 Kbit / s an. Die Reduktion erfolgt direkt beim Wandeln.

Anmerkung

Es gibt auch Systeme, die 16 Bit linear Quantisieren und erst nach dem Wandeln die Daten reduzieren ( z. B. Video 8).

2. AD-PCM








Bei diesem Verfahren benutzt man eine Auflösung von 10 Bit. Es wird nur der Unterschied zum vorherigen Signal gespeichert. Diese Methode hat sich jedoch nicht durchgesetzt, ist aber nützlich für eine Fließkommadarstellung.

3. Nicam 728

Anwendung:

Übertragung von digitalen Fernsehtönen.

Das System arbeite mit 32 kHz / 14 Bit. Es werden 32000 Samples auf einmal analysiert. Aus den 32 Samples wird das Sample mit der größten Amplitude herausgesucht. Danach richten sich die anderen Samples

4. ISO / MPEG








Das System arbeitet nach drei Gesichtspunkten:

- Irrelevanz (basierend auf dem Verdeckungseffekt, nicht wahrnehmbare Anteile werden weggelassen)

- Redundanz (einfachere Darstellung der Audiosignale. Statt fortlaufende Abtastwerte zu speichern, werden nur die Phase, Amplitude und Frequenz gespeichert).

- Entropiecodierung (Gleiche Werte, die häufiger vorkommen, werden durch ein Codewort ersetzt)

Von dem ISO / MPEG System gibt es 3 Versionen:

Layer 1: 383 Samples / 32 Bänder (Simplified Musician). Es fallen nur noch 192 Kbit / s an.

Layer 2: 1152 Samples./ 32 Bänder./ 128 Kbit / s. Anwendung: Musicam / DAB

Layer 3: 1152 Samples / 32 Bänder / 64 Kbit / s. Anwendung: digitale Audioübertragung mit ISDN

Fehlerkorrektur

Es muß erkannt werden, daß ein Fehler vorliegt. Zudem muß der Fehler korrigiert werden können und im Notfall verdeckt werden.

Eine Möglichkeit der Fehlerkorrektur ist das Paritätsbit. Zu jedem Datenwort wird ein Paritätsbit hinzugefügt, und zwar so, daß die Anzahl der im Datenwort vorhandenen 1en gerade bzw. ungerade ist. Hat man sich auf "gerade" geeinigt und kommen z.B. 5 Einsen in dem Datenwort vor, ist das Paritätsbit auf 1. Damit wird die Anzahl der Einsen auf 6 Stück ergänzt und ist gerade. Sind z.B. schon 6 Einsen in dem Datenwort enthalten, so ist das Paritätsbit = 0.

Beispiel:
D01
D10
D21
D31

In diesem Fall wäre das Paritätsbit = 1.

Die Rechenregel lautet:

Tritt nun ein Fehler auf, stimmt das Paritätsbit nicht mehr mit dem restlichen Datenwort überein und der Fehler wird erkannt.

Anwendung: Serielle Übertragung im Computerbereich (DFÜ, RS-232 Übertragung)

Es ist auch möglich, waagerechte Paritätsbits zu benutzen. Dies nennt man dann

Kreuzparität

p
a01 111
b10 100
c11 101
d00 101
p00 01

Es passiert ein Fehler...
psp
a01 111 0
b11 100 1
c11 101 0
d00 101 0
p00 01 0
sp01 00

SP ist ein Syndromwort. Die Daten werden also beim lesen erneut auf Fehler geprüft und das fehlerhafte Bit kann erkannt werden, da das Syndromwort nicht 0 ist.

Es gibt noch viele andere Methoden der Fehlererkennung, jedoch wurde hier nur die Paritätsprüfung als ein Beispiel vorgestellt.

Fehlerverdeckung

Die Fehlervderdeckung läuft in folgenden Schritten ab:

1. Interpolieren Es wird ein Mittelwert für das fehlerhafte Datenbyte eingesetzt, basierend auf dem vorherigen und dem folgenden Datenbyte.

2. letzten Wert beibehalten Falls bei Schritt Nr. 1 zu viele Fehler hintereinander auftreten, wird der letzte Wert des letzten heilen Datenbytes beibehalten.

3. Stummschalten Falls bei Schritt Nr. 2 mehr als 30 Fehler hintereinander aufgetreten sind, wird die Audiowiedergabe stummgeschaltet, um digitale Verzerrungen zu vermeiden und die Boxen zu schonen.

Kanalcodierung

Die Kanalcodierung bestimmt, wie die digitalen Informationen letztendlich auf dem Speichermedium abgelegt werden. Dazu ist folgendes zu beachten:

1. gleiche / tieffrequente Anteile: Man bildet ein DSW, dabei gilt: 0 = -1V, 1 = +1V

2. höchste Frequenz muß übertragbar sein

3. Taktrückgewinnung, Synchronisation: Da auf dem Speichermedium kein Timecode aufgezeichnet wird, muß der Takt aus den Daten selbst gewonnen werden. Hierfür sind viele Wechsel von 0 und 1 sinnvoll.

4. Fehlerfortpflanzung, Polarität: kann das Signal invertiert werden ?

Einige Arten der Kanalcodierung sind auf der folgenden Seite abgebildet. Der Aufbau einer CD


Die Vertiefungen nennt man PIT´s. Sie sind 0,833-3,56 m lang und 0,5 m breit. Die Tiefe beträgt 1,5 m.

Das ganze System muß in 2 Richtungen bewegt werden könne. (Spurlage und Brennpunkt). Man nennt dies ein 2-Achsenelement.

Eine CD besteht aus einer langen Spur ähnlich wie bei der Schallplatte. Der Abstand von einer Spur zur benachbarten beträgt 1,5 m. Auf eine CD passen 20 000 Spuren. Es wird immer von innen nach außen gelesen. Die Umdrehungsgeschwindigkeit muß nach außen hin abnehmen, um eine lineare Bitrate zu gewährleisten.

Wenn eine neue CD eingelegt wird, muß sich der Brennpunkt des Lasers auf die Nicht-Pit´s fokussieren. Dies bestimmt die Ablaufsteuerung. Aber auch während die CD abgespielt wird ist eine ständige Feinjustierung des Brennpunktes nötig. Diese wird von den Empfängerdioden berechnet.

Der TRACKING-SENSOR justiert den Laser während des Abspielens so, daß er genau in der Spur liegt. Wird aber eine Spur neu angefahren (bei Titelauswahl), so wird der Schlittensensor aktiv, der für eine Bewegung des Lasers mit größeren Abständen zuständig ist.

Der DISC-SERVO bestimmt die Drehzahl der CD. Er arbeitet aufgrund von digitalen Signalen. Trotzdem ist er noch zu ungenau, daher werden die Daten in einen Puffer gelesen und dann mit dem Takt wieder ausgelesen.

Das Inhaltsverzeichnis einer CD nennt man TOC

Das Q-Wort im Modus 1

Beschreibung:

TNO: Titelnummer 1-99

Index: 1-99 Unterabschnitte der TNO

Min, Sec, Frame Zeitangaben bezogen auf die Gesamtspielzeit

AMin, ASek, AFrame Zeitangaben bezogen auf den aktuellen Titel

Modus 2

Der Modus 2 kommt immer nach 98 mal Modus 1

Beschreibung:

Katalognummer der CD: 52 Bit im BCD-Format

AFrame

Modus 3

Beschreibung:

Länderkennung: 12 Bit

Eigentümercode 18 Bit

Aufnahmejahr: 8 Bit, bezogen auf den Titel

Seriennummer der Aufnahme: 20 Bit, bezogen auf den Titel

AFrame

Der PCM-Prozessor

In den Anfängen der digitalen Audiotechnik kam zur Aufzeichnung der digitalen Daten nur ein Medium in Frage: Der Videorecorder. Es wurde auf U-Matic aufgezeichnet. Dazu war ein PCM-Prozessor notwendig, der den Ton in Bilddaten für VHS umwandelte.

Dazu hier Details zu einem Videorecorder:

Der Videorecorder hat rotierende Köpfe und eine Schrägspuraufzeichnung

R-DAT

Als R-DAT bezeichnet man die heute üblichen DAT-Rekorder.










Professionelle Geräte (Kaufpreis: ab 10 000 DM) haben 4 Köpfe. " Köpfe dienen dann der Hinterbandkontrolle.

Der Durchmesser der Kopftrommel ist 3 cm.

Bandgeschwindigkeit: 8,15 mm / s (5 mal langsamer als MC)

Kopfrotation: 2000 RPM

Relative Bandgeschwindigkeit: 3,133 m / sDas Band


Die Breite der Spuren beträgt bei selbstbespielten DATs 13,6 m.

Bei vorgefertigten & bespielten Bändern stimmen diese Daten nicht. Man benutzt zur Vervielfältigung ein Verfahren namens Thermo Kontakt Kopie.

Bei den einzelnen Spuren muß Übersprechen verhindert werden. Daher gibt es den Azimuthversatz. Die Spalten der beiden Köpfe sind leicht versetzt. Dadurch kann jeder Kopf nur das lesen, was er auch geschrieben hat.

DASH

Die DASH ist eine digitale Mehrspur Bandmaschine. Wie der Name schon sagt, hat die DASH einen festen Schreib/Lesekopf und schreibt die Daten in Längsrichtung auf das Band (im Gegensatz zum DAT-R mit rotierenden Köpfen und Schrägspuraufzeichnung). Es gibt verschiedene Ausführungen:

Dash 1: Q (Quarter) ¼ " Bänder, 8 Spuren

Dash 1: H (Half) ½ " Bänder, 24 Spuren

Warum hat die Dash H mit doppelter Bandbreite 3 mal soviel Spuren ? Jedes Band enthält eine feste Anzahl an Analogspuren. Diese sind breiter als die Digitalspuren.

Dash 2: Q 16 Spuren

Dash 2: H 48 Spuren

Es gibt drei Geschwindigkeiten:

fast 76,2 cm/s

medium 38,1 cm/s

slow 18,05 cm/s

twin Die Daten werden doppelt (auf 2 Spuren) aufgenommen. So ist es möglich, das Band

mechanisch zu schneiden.

PD

Die PD ist die Konkurrenz zu DASH. Während die Formate der verschiedenen DASH-Ausführungen zueinander kompatibel waren, hat die PD ein ganz anderes Format. Die Bänder von PD und DASH können nicht gegenseitig gelesen werden.

¼ " 2 Kanäle

½ " 16 Kanäle

1 " 32 Kanäle

Die Daten werden auf alle Spuren verteilt. Die maximale Auflösung beträgt 20 Bit.

Digitalformate

AES / EBUSPDIF
Signalübertragung ist symmetrisch mit XLR-Steckern asymmetrische Signalübertragung mit Cinchsteckern
high = 2-7 Vhigh = 0,5 V
Abschlußimpedanz: 600 Absclußimpedanz: 10 K
ProfianwendungHomeanwendung


Synchronisation

Vor 1956 wurden schon Kinofilme mit dem Kino-Ton synchronisiert. Dazu benutze man die Löcher, die auf dem Film angebracht waren. Als 1956 der erste Videorekorder gebaut wurde, mußte man sich erneut Gedanken über eine synchronisation machen.

Erste Erfolge wurden 1963 gemacht. Man zeichnete mit den sogenannte Control-Pulten einen bestimmten Impuls auf das Video und Audio Band auf. Dadurch war es möglich, beide Bänder zu synchronisieren.

1972 wurde der SMPTE / EBU Timecode eingeführt. Die einzelnen Bilder des Filmbandes wurden einfach durchnnummeriert. Dazu kam noch eine genaue Zeitangabe. Um den SMPTE Timecode aufzuzeichnen, gabe es 2 Verfahren:

LTC war nicht geeignet für Videobänder

VITC für Video. Der Timecode wurde in die sogenannte Austastlücke aufgezeichnet. Wenn der

Elektronenstrahl des Fernsehers den rechten unteren Bildrand erreicht hat, muß er wieder in die linke

obere Ecke wandern In dieser Zeit ist keine Bilddarstellung möglich. Dafür kann man hier den

Timecode aufzeichnen.

Es gibt vewrschiedene Fernsheformate:

30 Frames / s : schwarz/weiß USA

29,97 Fr / s: Color USA = NTSC

25 Fr / s: Europe

24 Fr / s Film

Das Dropframe

Schaut man sich das Color-Format für die USA an, stellt man fest, daß die 29,97 Frames / s keine gerade Zahl sind. Durch diese "krumme" Zahl ergibt sich ein Problem. Da es nur 2 Zustände gitb, nämlich Bild oder kein Bild, ist es unsinnig, 29,97 Frames / s anzugeben. Dazu gibt es das Dropframe. Man schiebt es nach bestimmten Regeln zwischen die vorhanden Frames, und kommt somit wieder auf ganze Zahlen.

Das Colorframe

Dies Frame war bei NTSC nötig, um störende Halbbilder zu umgehen.

Analoge Bandaufzeichnung mit Time Code

Bei der analogen Timecode Aufzeichnung ist folgendes zu beachten:

Art des Netzwerkes:

FRAMELOCK: Bit-genaue Verkopplung. Wenn beim Master eine Schwankung in der Drehzahl ist,

wird sie übertragen auf die Slaves.

PHASELOCK / SYNC-LOCK

Framegenaue Verkopplung, ist nicht so genau wie die bit-genaue Verkopplung. Dadurch wird nicht

jede kleinste Drehgeschwindigkeitsänderung mit übertragen

FLYWHEEL: gibt die Fehlertoleranz an. Man stellt die Anzahl der fehlerhaften Frames ein, die das System toleriert. Wird diese Anzahl überschritten, wird abgebrochen.

Synchronisation mit MIDI

Bei MIDI gibt es 3 Arten der Synchronisation:

  1. FSK es wird ein regelmäßiger Impuls ausgegeben, abhängig von den Beats per minute.
  2. MIDICLOCK: 24 Pulse pro Viertelnote.
  3. MIDI-Timecode (MTC). Entspricht dem SMPTE-Timecode und wird heutzutage angewendet.

ENDE von Digitaltechnik 1