Es gab einmal eine Zeit, in der viel geforscht wurde . . 1990 . .

: über 200 Forschungsprojekte

. . . und das ist noch gar nicht so lange her.
von Gert Redlich im Juni 2013 - Nicht alle Projekte waren am Ende kommerziell erfolgreich, es waren eigentlich alles Machbarkeitsstudien.

Das Projekt EUREKA 95

Von Professor Dr. Hausdörfer aus Darmstadt habe ich erzählt bekommen, daß das mit dem analogen HDTV zum Beispiel daran gescheitert war, daß es zwar die mathematischen Vorbedingungen und Grundlagen für eine Datenmengen-Kompression von Bild und Ton bereits gab, doch die Realisierung scheiterte an den immensen Kosten der elektronischen Bauteile, den Chips, und ein verkaufbarer Consumer-Artikel war somit - damals jedenfalls - nicht zu machen.
So war das ganze EUREKA 95 HDTV Projekt am Ende (etwa 1994/96) daran gescheitert, daß es einfach keine vernünftige bezahlbare "Hardware" (Prozessoren und Speicherchips) gab, um das 1250 Zeilen HDTV Fernsehbild auf einem machbaren und bezahlbaren Weg ins Wohnzimmer zu bringen.

Das Projekt EUREKA 147

Auch die Speicherung von besonders edlen Hifi-Aufnahmen scheiterte damals an der noch nicht entwickelten Kompressionshardware.
Dazu gab es ein von der EU gesponsertes (also fast vollständig bezahltes) Eureka (Kompressions- Forschungs-) Projekt, Nummer 147.

Die Entwickler wollten erst mal möglichst viele Interessenten auf sich aufmerksam machen . . .

. . . und so wurde ein "qualitativ"!! ganz besonders gutes Musikstück in verschiedenen Kodierungen und Qualitäten auf eine CD geschrieben. -

Ich möchte gleich vorweg sagen, daß dieses Musikstück sehr gewöhnungsbedürftig ist. Es ist zwar nicht gleich oder ähnlich den Kreationen von Stockhausen oder Kagels neuer Musik, doch ich kann es nicht allzulange ertragen und sei die technische Qualität noch so überragend.
.

Vorwort von Frank Müller-Römer - 1990

Die elektronische Aufzeichnung und die Übertragung von Tonsignalen in digitaler Technik, wie sie heute z. B. für die Compact Disc (CD) und den Digitalen Satelliten Rundfunk (DSR) genutzt wird, erfordert einen Datenstrom von 1.410 kbit/s. (CD) bzw. 928 kbit/s. (DSR).

Dieser große Datenstrom hat bisher die Anwendung der Digitaltechnologie auf weiteren Gebieten der Audiotechnik (z. B. Tonaufzeichnung mit mehr als einer Stunde Dauer auf selbst bespielbarer CD) sowie für eine terrestrische Ausstrahlung von Hörfunkprogrammen (preisgünstige Endgeräte) verhindert.

Es funktioniert, die 10 : 1 Kompression

Anfang 1990 konnte nun nach mehrjähriger Forschungs- und Entwicklungsarbeit, an der sich das Institut für Rundfunktechnik (IRT) in München besonders intensiv beteiligte, ein Quellencodierverfahren vorgestellt werden, das es gestattet, unter Ausnutzung der speziellen Analyse-Eigenschaften des menschlichen Gehörs und seiner psychoakustischen Phänomene den Datenfluß für einen Stereokanal auf bis zu 128 kbit/s., also im Verhältnis von 11 : 1 bezogen auf die CD, zu verringern.

Dieses spezielle Verfahren, das mit dem Akronym MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing) benannt wurde, gestattet nun ohne hörbaren Qualitätsverlust neue Anwendungen. Damit wird künftig auch ein digitaler terrestrischer Hörrundfunk (DAB = Digital Audio Broadcasting) mit wesentlich verbesserter Übertragungs- und Empfangsqualität möglich.

Das Ziel heißt : Eureka-Projekt EU 147

Dieses gegenüber dem heutigen UKW-Rundfunk wesentlich verbesserte System wird im Rahmen des Eureka-Projektes EU 147 voraussichtlich ab 1995 eingeführt werden können und im nächsten Jahrhundert den UKW-Rundfunk ablösen.

Der Bundesminister für Forschung und Technologie hat zur Koordinierung aller mit der Einführung verbundenen Fragen eine nationale Plattform gegründet, in der die öffentlichrechtlichen Rundfunkanstalten aktiv mitarbeiten.

Ein Eindruck von MUSICAM

Um einen Eindruck der herausragenden Qualität des Quellencodierverfahrens MUSICAM zu vermitteln, hat der Bayerische Rundfunk diese Compact Disc produziert, auf der die "Symphonische Peripetie für Orgel und Orchester" von Rafael Kubelik zunächst mit normaler CD-Codierung und nach einigen kurzen Hörbeispielen nach dem MUSICAM-Verfahren zu hören ist. Die für den Hörer trotz drastischer Datenreduktion gleichbleibende Tonqualität ist verblüffend.

Sir Colin Davis, den Mitgliedern des Symphonieorchesters des Bayerischen Rundfunks sowie allen an der Produktion beteiligten Mitarbeitern des Instituts für Rundfunktechnik und des Bayerischen Rundfunks möchte ich meinen besonderen Dank aussprechen.
.

Frank Müller-Römer

Technischer Direktor
des Bayerischen Rundfunks
München, Dezember 1990

Was ist MUSICAM :

Ein Datenreduktionsverfahren zur digitalen Übertragung und Speicherung von Audiosignalen. Am IRT (Institut für Rundfunktechnik) wurde in Zusammenarbeit mit Wissenschaftlern des CCETT (Centre Commun d'Etudes de Teledif-fusion etTelecommunications, Frankreich) und Philips (Holland) das MUSICAM-Verfahren /l,2/, ein im Bereich der digitalen Tontechnik universell anwendbares Quellencodierverfahren für hochqualitative Audiosignale entwickelt.

Was ist auf dieser CD aus 1990 ?

Diese Compact Disc enthält erstmalig Aufnahmen, mit denen die übliche CD-Technologie dem neuen, datensparenden Quellencodierverfahren MUSICAM gegenüber gestellt wird. Eine solche Reduktion der Datenrate ist für viele zukünftige Anwendungen, wie digitalen, mobil empfangbaren Hörrundfunk, Speicherung von Tonsignalen in Rechnern, oder für eine hochqualitative Übertragung in öffentlichen Breitbandnetzen unabdingbar.

Mit MUSICAM (Maskingpattern adapted Universal Subband Integrated Coding And Multiplexing) steht neuerdings ein Codierverfahren für Audiosignale zur Verfügung, das die in Sprach- und Musiksignalen enthaltene Redundanz und Irrelevanz zu einer effektiven Datenreduktion nutzt.

Im MUSICAM-Prozeß wird das Gesamtspektrum eines Tonsignals zunächst in einzelne Teilbänder zerlegt und unter Ausnutzung der spektralen und temporären Verdeckungseigenschaften des Gehörs mit einer relativ niedrigen Datenrate beschrieben. Nach einer Aufzeichnung oder Übertragung wird der Datenstrom durch inverse Zusammensetzung der Teilbänder wieder in ein breitbandiges hochqualitatives Tonsignal umgewandelt.

1. Einleitung

Die Entwicklungen auf dem Gebiet der Audiotechnik werden sowohl im professionellen als auch im Heimbereich zunehmend durch Digitaltechnik bestimmt. Bis vor ca. 5 Jahren waren die Entwicklungen auf dem Gebiet der Quellencodierung hauptsächlich auf eine bitsparende Codierung von Sprachsignalen für Anwendungen in der Telekommunikation beschränkt.

Heute spielen Quellencodierverfahren für die Datenreduktion von hochwertigen Tonsignalen eine immer größere Rolle. Ein Grund hierfür ist der direkte Zusammenhang zwischen der hohen Übertragungsrate oder der Speicherkapazität, die für 16 Bit linear codierte Signale (DSR; CD) notwendig ist und den Kosten für Übertragungswege bzw. den Kosten für Speicherelemente.

Jedoch auch technische Gründe, wie eine optimale Ausnutzung vorhandener Frequenzbereiche für ein zukünftiges terrestrisches digitales Rundfunksystem rechtfertigen die Forderung nach leistungsfähigen Quellencodierverfahren, weil damit die Anzahl der Programme in einem solchen Hörrundfunksystem erhöht werden kann.

Durch große Fortschritte bei der Entwicklung von Quellencodierverfahren, die unsere heutigen Kenntnisse über das menschliche Gehör nutzen, ist es mittlerweile möglich, die Bitrate für hochwertige Stereo-Audiosignale, die bei einer CD 1.411 kbit/s beträgt, auf etwa 200 kbit/s zu reduzieren.

Dies bedeutet, daß bezogen auf eine Abtastfrequenz von 44,1 kHz die mittlere Quantisierung des Audiosignals im Vergleich nur etwas mehr als 2 Bit pro Abtastwert im Monokanal betragen würde. Trotz dieser starken Reduktion der Datenrate treten auch für das geschulte Gehör keine wahr-
nehmbaren Qualitätsunterschiede auf. Erst bei noch stärkerer Reduktion können geringfügig wahrnehmbare Beeinträchtigungen auftreten.

Ziel der noch laufenden Entwicklungsarbeiten ist es, für die Ausstrahlung eines Stereoprogramms in einem terrestrischen digitalen Rundfunksystem DAB(Eureka-ProjektEU 147) eine Datenrate von 128 kbit/s zu erreichen.

2. Grundlagen der Quellencodierung:

Redundanz- und Irrelevanzreduktion
Maßgeblicher Bestandteil der Quellencodierung ist die Reduktion der im Tonsignal enthaltenen Redundanz und Irrelevanz. Irrelevante Signalteile, wie sie in jedem Tonsignal enthalten sind, tragen nicht zur Identifizierung des Schallsignals also zur Bestimmung der Klangfarbe und Lokalisation bei. Sie sind damit für das menschliche Gehör und die nachfolgenden informationsverarabeitenden Stufen im Gehirn unbedeutend.

Die Irrelevanzreduktion besteht darin, daß solche Signalanteile nicht übertragen werden und darüberhinaus bestimmte Quantisierungsverzerrungen zugelassen werden, die aufgrund der Maskierungseffekte vom Gehör verdeckt werden. Jedes Tonsignal erzeugt im Gehör eine Mithörschwelle, die vom spektralen und zeitlichen Verlauf des Signals abhängt. Das Tonsignal kann deshalb als Maskierer bezeichnet werden. Die spektrale Mithörschwelle, die längs der Frequenzachse abhängig vom Maskierer und dem Abstand zu diesem bestimmt wird, ist ein Maß dafür, bei welchem Pegel ein zusätzlich eingeführter Testton oder ein Schmalbandrauschen mit der entsprechenden Frequenz gerade noch hörbar ist, d.h. an der Wahrnehmbarkeitsschwelle liegt.

: Bild 1: Mithörschwellen LT verdeckt durch Schmalbandrauschen des Pegels LSBR = 60 dB und der Mittenfrequenzen fm = 0.25,1 und 4 kHz (links), bzw. der Mittenfrequenz 1 kHz und verschiedenen Pegeln LSBR.

In Bild 1 (entnommen aus /3/) sind typische Mithörschwellen von drei Schmalbandrauschen unterschiedlicher Mittenfrequenzen aufgetragen. Teile eines Tonsignals, die unterhalb dieser Mithörschwellen liegen, können vom Gehör nicht wahrgenommen werden. Sie sind maskiert und brauchen deshalb auch nicht übertragen zu werden.

Andere Signalanteile, die oberhalb der Mithörschwelle liegen, müssen nur gerade so hoch quantisiert werden,daß das resultierende Quantisierungsrauschen unter der Mithörschwelle und somit unhörbar bleibt.

Das Verhältnis von Signalamplitude zur minimalen Mithörschwelle (signal-to-mask ratio, kurz: SMR) bestimmt die notwendige Quantisierung. Dadurch, daß bei einer genaueren spektralen Zerlegung das Quantisierungsrauschen den Mithörschwellen des menschlichen Gehörs besser angepaßt werden kann, wird dieses Verhältnis umso kleiner, je mehr Teilbänder für eine individuelle Quantisierung zur Verfügung stehen.

: Bild 2: Amplitudenspektrum SPL und Mithörschwelle LT eines typischen Vokals. Die schraffierte Fläche kennzeichnet das maximale Quantisierungsrauschen in den einzelnen Teilbändern des MUSICAMVerfahrens.

Bild 2 zeigt das Spektrum und die spektrale Mithörschwelle eines typischen Audiosignals für einen kurzen Zeitabschnitt, sowie das durch die Codierung bedingte Quantisierungsrauschen, das jedoch nicht wahrgenommen werden kann. In Abhängigkeit von der minimalen Mithörschwelle in einem Teilband, die ein Maß für das gerade nicht mehr wahrnehmbare Quantisierungsrauschen ist, wird die notwendige Quantisierung des Abtastwertes für dieses einzelne Teilband bestimmt. Solche Teilbänder, deren Nutzsignal vollständig unterhalb der Mithörschwelle liegen und somit für das Gehör irrelevant sind, brauchen nicht übertragen werden.

Die sich nach jeder neuen, aktuellen Berechnung der Mithörschwellen ändernde Auflösung der Teilbandsignale wird als „dynamische Bitzuweisung" bezeichnet. Die Audiodaten werden der dynamischen Bitzuweisung entsprechend quantisiert, wobei die hierfür notwendige Bitrate bei zeitlich Varianten Tonsignalen aufgrund der sich ständig ändernden Mithörschwelle variiert.

Der insgesamt zu übertragende Bitstrom enthält neben den codierten Abtastwerten die für den Decoder notwendige Nebeninformation, bestehend aus der Bitzuweisung und den Skalenfaktoren. Die Skalenfaktoren werden bestimmt, indem für jedes Teilband und in jedem Block der maximale Abtastwert gesucht und mit 6 Bit quantisiert wird. Die Skalenfaktoren decken einen Dynamikbereich von 120dB ab. Damit können auch zukünftige mit bis zu 20 Bit quantisierte PCM-Signale unter Beibehaltung ihres Dynamikbereiches codiert werden.

Da bei den meisten Anwendungsfällen für die Übertragung des Tonsignals eine konstante Bitrate gefordert ist, muß die dynamische Bitrate blockweise auf einen konstanten Wert, z.B. 256, 192 oder 128 kbit/s (stereo) gebracht werden. Bei einer Bitrate von 256 kbit/ s steht nahezu immer eine dynamische Bitflußreserve zur Verfügung.

Diese kann in verschiedener Hinsicht genutzt werden:

1. Erhöhung des Verhältnisses von Mithörschwelle zu Quantisierungsrauschen um eine beliebige Nachbearbeitung der codierten Audiosignale, wie Änderung des Frequenzganges, Dynamikkompression oder auch mehrmalige Codierung und Decodierung zu ermöglichen.
2. Variabler Fehlerschutz mit höherem Schutz der leisen, gegenüber Bitfehlern besondersempfindlichen Passagen.
3. Übertragung von programmspezifischer Zusatzinformation.

3. Rundfunkausstrahlung

Eine breite Anwendung für ein Toncodierverfahren wie MUSICAM ist in einem zukünftigen digitalen terrestrischen Hörrundfunksystem (/4/) zu sehen. Hierbei ergeben sich folgende Anforderungen an die Quellencodierung:

• Tonqualität entsprechend dem heutzutage erreichbaren Standard (z.B. Compact Disc, oder R-DAT).
• Vielfältiges, d.h. großes Programmangebot auch von Anbietern aus überregionalen Bereichen. Die Datenrate sollte für ein Stereoprogramm so gering sein, daß in einer Bandbreite von 4 MHz bis zu 16 Stereoprogramme inklusive Fehlerschutz und Zusatzinformationen untergebracht werden können.
• Deutliche Verbesserung der Qualität bei mobilem Empfang, durch Wegfall der typischen Empfangsbeeinträchtigungen, die sonst bei einer UKW-FM-Übertragung auftreten.

128 kbit/s pro Stereokanal

Mit einer Bitrate von 128 kbit/s pro Stereokanal werden sich diese Forderungen auf jeden Fall realisieren lassen. Damit eignet sich MUSICAM als Quellencodierverfahren besonders für hochqualitative Übertragungen von Musik-signalen bei digitalem Rundfunk, für Fernsehton mit mehreren Kanälen bei HDTV, sowie für die Speicherung von Tonsignalen in digitaler Form mit allen denkbaren unterschiedlichen Speichermedien. Neben der direkten Rundfunkausstrahlung terrestrisch oder über ein Satellitensystem kann MUSICAM auch für die Verbesserung von Übertragungen eingesetzt werden, die die Rundfunkanstalten zu Reportagezwecken über das allerorten verfügbare öffentliche Telefonnetz abwickeln.

In einer höheren Qualitätsstufe eignet sich MUSICAM auch für die Übertragung von Tonsignalen zwischen Rundfunkanstalten im nationalen und internationalen Programmaustausch. Mit z.B. 384 kbit/s (stereo) kann ein ausreichender „Headroom" geschaffen werden, um im Studio die typischen Nachbearbeitungen wie Filterung, Verhallung, Bearbeitung mit Effektgeräten, Kompression und Schneiden zu ermöglichen.

Schrifttum

Stoll, G. und Dehery, F.: High quality audio bit-rate reduction family for different applications. IEEE International -Conference on Communications, April 1990, Nr. 322.3, S. 937-941.
Wiese, D. und Stoll, G.: Bitrate Reduction of High Quality Audio Signals by Modeling the Ears Masking Thresholds. - 89th AES Convention, 1990, Los Angeles Preprint No. 2970.
Zwicker, E. und Feldtkeller, R.: Das Ohr als Nachrichtenempfänger. S.Hirzel Verlag, Stuttgart, 1967.
Müller-Römer, F.: Digitaler terrestrischer Hörfunk (Digital Audio Broadcasting - DAB). Veröffentlichung der Technischen Direktion des Bayerischen Rundfunks zu Fragen der zukünftigen Medientechnik, März 1990.

Hinweise zur "Schallplatte" (gemeint ist diese CD)

Die CD beginnt mit der „Symphonischen Peripetie" von Rafael Kubelik (Track Nr.l). Das Werk wurde ohne Datenreduktion in konventioneller 16 bit PCM-Technik aufgenommen. Die Tracknummern 2 bis 14 kennzeichnen 3 Abschnitte des Werkes von jeweils etwa 20 Sekunden Dauer, die die subjektive Tonqualität der Signale in Abhängigkeit von der für die Codierung zur Verfügung gestellten Bitrate aufzeigen.

Gegenwärtig wird für die praktische Anwendung mit hohem Qualitätsanspruch die Bitrate von 192 kbit/s pro Stereokanal empfohlen. Die beiden anderen Bitraten dienen hier nur zum Vergleich und eignen sich für andere Anwendungen.

Für jeden Ausschnitt werden die Tonbeispiele in der Reihenfolge „A - B - A - B" dargeboten, wobei A jeweils die Referenz, d.h. der in 16-Bit PCM-Technik aufgezeichnete Ausschnitt(1411 kbit/s, Stereo) und B jeweils die MUSICAM-codierte Version desselben Ausschnitts beinhaltet; die Datenrate bezieht sich auch hier auf das Stereosignal.

Die einzelnen Sequenzen sind auf der CD folgendermaßen aufgezeichnet.

Ausschnitt 1
Track	A	B
2	Original	256 kbit/s
3	Original	192 kbit/s
4	Original	128 kbit/s

Ausschnitt 2
Track	A	B
5	Original	256 kbit/s
6	Original	192 kbit/s
7	Original	128 kbit/s

Ausschnitt 3
Track	A	B
8	Original	256 kbit/s
9	Original	192 kbit/s
10	Original	128 kbit/s

Ergänzend zum Ausschnitt 1

Die Differenz zwischen dem 16-Bit PCM-Originalsignal und dem MUSICAM-codierten Tonsignal stellt, didaktisch gesehen, ein ausgezeichnetes Hilfsmittel dar, um den irrelevanten Anteil des Tonsignals zu veranschaulichen.

Dieser Teil des Tonsignals setzt sich aus all den unwichtigen, nicht übertragenen Teilbandsignalen und den aufgrund der Verdeckungs-eigenschaften des Gehörs erlaubten Quantisierungsverzerrungen zusammen.

Das Differenzsignal ist folglich ein Maß für den „erlaubten Fehler" bei der Codierung, ohne daß dieser beim Anhören des codierten Signalswahrgenommen werden kann.

Für den Ausschnitt 2 wurde das Differenzsignal bei den Bitraten 256,192 und 128 kbit/ s pro Stereokanal berechnet und auf die CD aufgezeichnet.
Um ein Gefühl für die Lautstärke des „erlaubten Fehlers" zu erhalten, werden die Differenzsignale im Vergleich zum Originalsignal dargeboten. Beachten Sie bitte, daß keinerlei Pegelkorrekturen zwischen Original- und Differenzsignal vorgenommen wurden.

Ausschnitt 2

Track 11 Original
12 256 kbit/s >
13 192 kbit/s > Differenzsignal
14 128 kbit/s >

Die CD endet mit einer Wiederholung des kompletten Werks von R. Kubelik (Track 15), das im Vergleich zum ersten Mal einer Codierung mit MUSICAM bei einer Bitrate von 256 kbit/s (Stereokanal) unterzogen wurde.
.

Reinhard Schulz erläutert das Musikbeispiel:
Zur »Symphonischen Peripetie« von Rafael Kubelik

Entstanden: 19. Januar-3. März 1983,
La Quinta (Kalifornien), korrigiert 1984.
Uraufführung: 14. März 1985, Concert Hall Chicago, Chicago Symphony Orchestra unter der Leitung des Komponisten, Solist: Edgar Krapp.

An einem ließ Rafael Kubelik nie Zweifel aufkommen: an seiner Skepsis gegenüber musikalischen Entwicklungen unserer Zeit. Kubelik meint hierbei nicht nur die schöpferische Arbeit, sondern auch die interpretatorische, die im Streben nach »High-Tech« und sonstigen Eitelkeiten die ideale Ganzheit des Musikers zerreißt.

Die »Symphonische Perpetie« für Orgel und Orchester entstand in den Jahren 1983 und 1984. Das Werk wurde für die neue Orgel der Concert Hall in Chicago geschrieben und dort im März 1985 uraufgeführt. Obwohl zur Orgeleinweihung komponiert, handelt es sich nicht um ein Konzert für Orgel und Orchester, wie es vielleicht nahegelegen hätte. Das Werk ist einsätzig, gleichwohl integriert es im Verlauf unterschiedliche Satztypen.

Die Musik tritt aus aufgewühltem Zustand fast unmerklich über in eine Ebene naturhafter Lösung. Kompositorisch wird diese Idee verwirklicht durch Änderung des Klangs, der harmonischen Schärfung.

Die Zitate sind Interviews entnommen, die Ursula Hübner mit Rafael Kubelik geführt hat (NEUE ZÜRCHER ZEITUNG, DIE PRESSE WIEN)
Abdruck mit Genehmigung von C.F.Peters, Frankfurt