[NO GERMAN, PLEASE]

the symbolic lynX on MP3

"Die Plattenlabels raufen sich die Haare, aber es ist bereits zu spät. Die Technologie, welche die gesamte Plattenindustrie umkrempeln wird, ist schon da, und bereits in den 'falschen' Händen: denen des Volkes."

Also schrieb ich im Jahre 1998 für G+J. Inzwischen wird auch die Kinoindustrie von der einfach bedienbaren, kostenlosen, und inzwischen sogar legalen DVD nach CDROM-Umkodierungssoftware bedroht - Dabei kommt gerne das berüchtigte DivX;-)-Format zum Einsatz, welches nichts anderes ist als MPEG4-Video kombiniert mit MP3-Audio. Die erste Version davon entstand einst aus modifizierten MS-Treibern, ist aber inzwischen neu geschrieben und vollkommen legal, sogar für Linux, Mac, BeOS, ja sogar Amiga erhältlich. Aber diese Website handelt von MP3, also hier der Stand Mai 2002 in Sachen MP3:

"MP3, eigentlich MPEG Audio Layer III, wird nicht das letzte Musikdateiformat sein, aber es ermöglicht schon heute, eine Musiksammlung von 13 Audio-CDs auf eine einzige CD-ROM zu bringen, da eine Minute Musik in CD-Qualität lediglich einen Megabyte Speicher benötigt. Technische Details."


Image courtesy of Dan Forrest probably.

Diese Aussage bezieht sich auf die populäre Bitrate "128", welcher leider auf keinen Fall mehr zu empfehlen ist und ganz gewiss nicht "CD-Qualität" darstellt. 128 kann für synthetisierte Musik ausreichen, das trifft auf dancefloor techno meistens zu, aber auch auf Kraftwerk. Bei Gitarrenmusik erkennt man nach etwas Übung schon bald die unangenehmen akustischen "Schlieren", die sogenannten Artefakte.

Selbst 160 kbps können manchen Gesangspassagen nicht gerecht werden, während 192 kbps schon am Plattenplatz nagen. Und dann heisst es, dass man erst ab 256 kbps von "CD-Qualität" sprechen kann. Nur wer genau weiss was er tut, sollte noch statische mp3s erzeugen. Wer möglichst wenig Sorgen damit haben will, für den lautet heutzutage die vernünftige Empfehlung:

MP3s sollte man in variabler Bitrate (VBR) encoden!

Da wird die Bitrate im Laufe der Datei fortwährend verändert und automatisch an die Komplexität einer musikalischen Passage angepasst. Man spart also Plattenplatz nur an den einfachen Stellen des Songs während die schwierigen Partien hochbittig gecoded werden - bis zu 320 Kilobit pro Sekunde. Das leuchtet doch ein, dass das besser sein muss. Und manche Audio-Profis teilen diese Ansicht, sie haben sogar Frequenzanalysen angestellt und die Abweichungen der Wellenformen vom Original gemessen - VBR ist viel näher an der CD dran als vergleichbar grosse statische Dateien (CBR) oder ABR (eine Variante von VBR bei der man einen Durchschnittsbitratenwert "erzwingen" kann, zur Zeit nicht empfehlenswert).

Software zum Erstellen solcher Musikdateien gibt es bei den Erfindern des Formats. Inzwischen ist jedoch allgemein anerkannt, dass der freie LAME-Encoder die beste bekannte MP3-Qualität erzeugt. Ganz in Internet-Tradition ist diese Software auch noch kostenfrei open source. LAME ist allerdings nur eine "Engine" welche den Kodierungsjob erledigt. Programme, die dem Benutzer eine einfache Handhabung ermöglichen gibt es in riesiger Auswahl, und viele ermöglichen zusätzlich das Extrahieren der Musikdaten von Audio-CDs, welches auch keine einfache Aufgabe ist, da Audio-CDs an sich nicht dafür konzipiert waren perfekt digital extrahiert zu werden. Wer mit einem der Produkte aus Redmonds napoleonischen Monopolschmiede geschlagen ist, wird in CDex ein wertvolles Werkzeug finden zum Umwandeln von CDs nach MP3. Ganz wichtig dabei ist jedoch die Encoderoptionen umzukonfigurieren:

Die Einstellungen zur optimalen MP3 Codierung können phänomenal kompliziert sein, deshalb hat sich ein Herr mit Spitznamen "r3mix" eine gleichnamige Voreinstellung ausgedacht, welche auf jeden Fall CD-Qualität garantieren soll. Sie entspricht in etwa VBR Level 1 mit vielen kleinen Extra-Einstellungen. Die Dateien werden in der Regel etwas groß, wer's kleiner braucht kann sich tiefer in die Materie begeben. Die folgenden Absätze tun das:

Manuelle Konfiguration eines brauchbaren MP3-Encoders.

Unbedingt VBR einschalten! VBR-Qualität wird in 9 bis 0 abwärts zählend bezeichnet, wobei 0 die Beste ist. Je nach Einstellung werden die Dateien mikroskopisch bis gigantisch. Schon ab Level 6 sind die resultierenden MP3s in der Regel brauchbar. Natürlich kann es auch mal bereits mit 7 gut klingen - ich verwende 7 oder 8 für meine Web-Download-Dateien, die sind dann schön klein und gerade noch gut anzuhören. In anderen hartnäckigen Fällen habe ich schonmal Stücke auf Level 3 codiert, weil 4 noch ganz knapp imperfekt war. Na, spätestens bei diesen Qualitätsstufen ist es eine sehr subjektive Angelegenheit, und eine Frage von Übung und Gehör, ob man überhaupt noch Unterschiede erkennen kann. Wer einfach auf Nummer sicher gehen möchte, nehme Level 5 oder 4. Man kann sich ja auch nicht dauernd die Zeit nehmen ganz genau hinzuhören.

Das Eingabefeld in dem üblicherweise die herkömmliche Bitrate eingestellt wird, leider meistens auf 128 voreingestellt, hat bei VBR-Codierung eine andere Bedeutung, es stellt die Mindestbitrate dar. Entgegen vieler anderslautender Dokumentation ist es absolut sinnvoll hier die Mindesteinstellung von 32 zu wählen, das hat nämlich nur zur Folge, dass Stille im Musikstück die Datei kaum anwachsen lässt. Solange Musik zu hören ist, kommt der Encoder niemals auf so kleine Bitraten.

Wenn man nach dieser Methode mp3s erzeugt, kann auch die alte Behauptung wieder stimmen: ein VBR 6 verbraucht ungefähr 1 Megabyte pro Minute Musik, ist aber ungleich besser in der Qualität gegenüber einem 128er mp3.

Es gibt noch ganz viele kleine Detailoptimierungen wie man noch bessere mp3s erzeugen können kann, ich schalte etwa gerne einen Lowpass-Filter "--lowpass 19" zu um Höhen bis zu 19 kHz zu erhalten. Aber die Meinungen über die Tauglichkeit vieler Einstellungen sind noch vielfältiger. Letztendlich ist man mit VBR so oder so im grünen Bereich, ausser man übertreibt es mit den Einstellungen absichtlich.

Wer wirklich dauernd Einstellungen wechselt je nach Musikmaterial ist mit RazorLame geholfen, weil es diese in einzelne fertige Konfigurationen speichert. Wer's stattdessen gerne unkompliziert mag, ist mit winLAME besser bedient. Es versteckt den Wust an Einstellungsmöglichkeiten und bietet stattdessen die offiziellen LAME-Voreinstellungen, bei denen tatsächliche CD-Qualität schlicht mit "standard" bezeichnet wird. Also einfach Dateien hineinwerfen und hinten kommt Top-Qualität heraus. Weiterer Pluspunkt: mit winLAME kann man Mixes und Alben mit fliessenden Songübergängen korrekt in mp3 umcodieren, also ohne den sonst unvermeidlichen Knacksern. Dazu Bedarf es nämlich besonderer Unterstützung von LAME's "--nogap" Option. Das macht winLAME aber einfach in dem man statt standard "standard (nogap)" anwählt. Anschliessend die Dateien in ein unkomprimiertes Zip stecken (kann jedes Zip Programm) oder einfach zusammenkonkatenieren und fertig ist das mp3-Album, welches man bei Bedarf wieder in Einzelstücke trennen kann. Eine Stunde Musik ist dann um die 70 megabyte groß und macht Spaß.

Unter Unix verwende ich mein eigenes perlscript ripncode, welches manches besser und manches schlechter macht als andere Programme. Ganz besonders die Inexistenz der Liedernamenerkennung beim Extrahieren von CDs ist nicht mehr zeitgemäß. Aber für Mac und Linux/Unix gibt es ja die oben bereits verlinkte Liste von LAME-Programmen. Die Einstellungsempfehlungen sind dieselben wie für CDex.

Wenn zum Eigenbedarf Musik von einer CD auf die Festplatte überspielt werden soll, muß diese zuvor "gerippt" (Unix: cdda2wav aus cdrtools · cdparanoia; Win: cdex · eac; Mac; mehr) werden.

Normalisieren, wenn ja wann?

Besonders ältere Audio-CDs könnte man nach dem Extrahieren vor der Kodierung normalisieren wollen (auf eine einheitliche Lautstärke bringen mit modernen CDs und den daraus erzeugten MP3s). Die Brachialmethode ist es, diese auf 98% hochzurechnen - das bedeutet, dass die lauteste Stelle des Musikstückes auf maximale Lautstärke gerechnet wird, und alles andere sich dem anpasst. CDex bietet diese Funktion an. Feinschmecker stellen aber fest, dass die Stücke subjektiv menschlich gehört überhaupt nicht gleich laut wirken. Schlauere Normalisierungsmethoden sorgen dafür, dass die Durchschnittslautstärke einheitlich ist - ich verwende typischerweise 60%. Eventuell wird die Musik zu dem Zweck in ihrer Dynamik komprimiert so wie es im Radio üblich ist. Jedem klassischen Musiker stehen dabei die Haare zu Berge.. Geschmackssache letztendlich. "normalize" ist ein kleines Unix-Programm dessen Autor sich wahnsinnig viele Gedanken gemacht hat zum subtilen Problem der perfekten Normalisierung, nachzulesen auf der Website. Ich musste leider aber feststellen, dass es nicht das tut was ich wollte, also blieb ich hängen beim kommerziellen Windows-Programm AudioGrabber. Es versteckt schlaue Normalisierung hinter dem "Advanced"-Knopf, auch in der kostenfreien Version. Mehr Theorie gibt es hierzu vom renommierten Musikinstrumentehersteller e-mu. Vielleicht sollte man letztendlich gar nicht mehr vor der Erstellung der MP3s normalisieren, sondern erst bei der Zusammenstellung einer CD aus unterschiedlichen Musikstücken, sowie mittels eines MP3-Players welcher beim Abspielen der Musik die Lautstärke anpasst. Ich habe mich inzwischen gegen Normalisierung entschieden - allzu leise CDs aus alten Zeiten nutzen in Wirklichkeit die Dynamik der CD viel besser aus als die modernen, welche gnadenlos auf maximale "Loudness" ausgelegt sind. Die MP3s sollten lieber möglichst nah am Original bleiben, das Abgleichen der Lautstärkeunterschiede lässt man dann von einem smarten MP3-Player machen (siehe unten), oder man wendet die Normalisierung erst kurz vor der Erstellung einer Audio-CD an. Oder man mastert sämtliche Stücke nochmal, aber damit verlassen wir eindeutig den Aktionsradius des Hobbyisten.

MP3s im Netz aufstöbern und anhören.

Viele Underground-Musiker bieten ihre Werke im praktischen MP3-Format direkt im Internet an. Und sonst deckt man sich eben mit den berüchtigten File-Sharing-Programmen ein. Um mp3s in brauchbarer Qualität rauszufischen sollte man möglichst ein VBR rausfischen - die erkannt man daran, dass sie meistens eine "ungerade" Bitrate haben. Die geraden Bitraten sind 32 40 48 56 64 80 96 112 128 160 192 224 256 320.

Anschliessend kann man sie mit einem der zahlreichen Abspielprogramme anhören. Unter Windows habe ich eine Schwäche für SqrSoft® Advanced Crossfading entwickelt, welches hübsche gemixte Übergänge zwischen den Liedern macht - wie im Radio, nur ohne Werbung. Dabei ist es schlauer als die meisten anderen Automatik-Deejays, weil es den richtigen Moment abpasst für einen angenehmen Übergang. Das Ding arbeitet mit WinAMP. Unter Linux gibt es zuviel, da fange ich gar nicht erst an. Ich selbst verwende nach wie vor meinen psycmp3.

Zum Thema mixen mit mp3s schreibe ich nichts, da ich inzwischen digital DJing nur noch mit mindestens CD-Qualität mache, oder gleich mit Vinyl, weil's Spaß macht.

Im Jahre 1998 schrieb ich.. "Meine Prognose an die Plattenindustrie: Die fetten Jahre sind bald vorüber - langfristig wird der Preis einer typischen Musik-CD unter die 10.- DM Grenze fallen müssen um Akzeptanz beim Kunden zu finden."

..und jetzt gips was auf die Lauscher!