Aussprache im Isländischen – Teil 2

Hier neu editiert wegen der freenet-Timeout-Probleme in drpagel.log.ag:

Seit Tagen suche ich schon nach einer freien online-zugänglichen, kostengünstigen, möglichst kostenlosen Möglichkeit, mir meinen isländischen Text vorlesen zu lassen. Die google-Suchen waren ausgelutscht. Mein Tagebucheintrag bei hexia.net hat auch nicht weitergeholfen. Da besann ich mich darauf, dass man im Firefox-Browser auch eine andere Suchmaschine, nämlich Yahoo zu hilfe nehmen kann. Es ergab sich gleich wieder die marktbeherrschende Acapela-Musterstimme ohne die Möglichkeit, eigene Texte vorsprechen zu lassen. Veilleicht brauche ich da ein wenig Geduld!

Also habe ich mal die Stichworte icelandic speech recognition eingegeben und eine interessante Webseite der Hochschule Islands gefunden (Lit. PDF). Dort heisst es, dass in 2002 ein Projekt namens ‚Hjal‘, umgesetzt von der Hochschule Islands und 4 führenden Unternehmen der Telekommunikation und Software-Industrie existierte, um Isländische Sprache für Rechenmaschinen automatisch aussprechbar werden zu lassen. Gefördert wurde diese Arbeit vom Icelandic Language Technology Fund. Ziel des Projektes war, dass die Ergebnisse in Form von Dateien für interessierte (Unternehmen?) öffentlich frei zugänglich seien. Projektleiter sei Helga Waage, MS, von der Fa. Hex Software. Vermutlich hängt dieser Name mit hexia.net zusammen, bei der ich kürzlich zu Testzwecken mein isländisches Tagebuch angelegt habe. Für die linguistische Betreuung war Prof. Eirikur Rögnvaldsson von der Universität von Island zuständig. Eines der führenden Software-Unternehmen war ScanSoft. Sie haben die Lautschrift SAMPA für die Transkribierung von isländisch zu sprechendem oder zu lesendem Text in automatische Stimmwiedergabe benutzt.

Neben höherwertigen Lautkombinationen (z.B.: Triphone) sind insbesondere Diphone von Bedeutung. Wenn ein Alphabet aus 2Buchstaben bestünde (binärer Code, z.B.: A, B), dann würden sich 4 Diphune ergeben (z.B.: AA, AB, BA, BB). Gut vorstellbar ist dann, dass es bei einem Alphabet von 20 Buchstaben 400 Diphonmöglichkeiten gäbe. Kommt noch dazu, dass Lautzeichen je nach Kontext unterschiedlich ausgesprochen werden, so gibt es entsprechend mehr SAMPA-Code; die Isländische Sprache soll mit 800 Diphonen darstellbar sein.

So ist verständlich, dass im Langenscheits Universalwörterbuch (LUB) Isländisch bei 7 Ausspracheseiten erwähnt wird, dass diese Aussprachemöglichkeiten noch nicht erschöpfend das Isländische wiedergeben. Der Grund seien regionale Besonderheiten aufgrund diverser Sprachinsellagen. So spricht man, wie fast in jedem Land der Welt, im Westen anders als im Osten, Norden, Süden, Zentrum. Man sagt, im Großraum Braunschweig-Hannover würde man das beste Hochdeutsch reden, im Gebiet um Oxford das beste Englisch.

Das war 2002 und nun ist 2008: und gefunden habe ich noch keine frei zugängliche Datensammlung (SAMPA-Codetablle) zur Umwandlung von isländischen Text in Aussprache oder Lautschrift. Muss ich noch weiter sichen.

Dagegen gibt es bereits öffentlich zugängliche Transkriptionstabellen mit SAMPA-Code oder internationaler Lautschrift zu anderen Sprachen (siehe mein früherer Beitrag v.heute)

(dp) (1,5h)

Nachtrag am 16.8.2008 um 21.57Uhr:

Möglicherweise kann die Isländische Sprache durch 58 Laute dargestellt werden. Dies ergäbe 3364 Diphone (582). Glücklicherweise kommen nicht alle Lautkombinationen im Isländischen vor. Vermutlich ist eine Diphone-Tabelle im SAMPA-Code im Anhang der PDF-Datei von „isländische Zungentechnik“ www.tungutaekni.is publiziert. Muss ich mal bei Gelegenheit nachzählen, ob dieses die versprochenen 800 Stück sind? …

Nach einer kleinen Weile habe ich mit Hilfe von Copy+Paste in ein Tabellen-Dokument festgestellt: es sind tatsächlich 2106 Diphone. Nur, was nützt mir das Diphone-Alphabet, wenn ich nicht weiss, bei welcher Silbe diese Diphone angewendet werden können. Es fehlt immer noch das „Schlüsselerlebnis“. (dp) (1h)

Nachtrag am 18.8.2008 um 01.00Uhr:

Der Schlüssel ist gefunden. Er liegt auf Seite 9 bsi 12 in oben zitierter Lit.: ‚Language Technology MA Dissertation‘ von Björn Kristinsson „Towards Speech Synthesis for Icelandic, October 2004. Man muss halt alles lesen. Wenn ich wieder mehr Zeit habe, werde ich mir eine Transkription von meinem Isländischem Text in SAMPA-Code von hand anfertigen, sollte ich keine automatisches, freies, kostenloses Formular finden. (dp) (0,75h)

Nachtrag am 19.8.2008 um 22.55Uhr:

Da mit Hilfe eines SAMPA2WAV-Anwendung für Brittisches Englisch nur 12 von 58 isländische Laute richtig vorgelesen werden und es im Deutschen z.B. auch keinen Laut „c0“ gibt, nützen die schriftlichen Lautbeispiele noch wenig. Es gibt aber von der Berliner Humbold-Universität eine Isländisch-Lehrseite BRAGI, die AUDIO-Beispiele über den Quicktime-Player ausgibt, nur leider kann man den Text dabei nicht lesen, falls man die gleiche Webseite nicht gleichzeitig, zusätzlich in einem anderen Browserfenster öffnet.

Die Ausgabe der Lautschrift IPA sei bei Bragi aus technischen Gründen nicht möglich. Ich vermute nach der Erfahrung mit der Transkription meiner Musterseite einen zu hohen Arbeitsaufwand bei der HTML-Seitenerstellung, der nur mit Hilfe eines komfortablen HTML-Editors (z.B. freeware NVU) zu handhaben ist.

So bietet

  • (zum Glück) eine Webseite SAMPA-Schlüssel mit Lautbeispielen, die nur die Isländer nachsprechen können und
  • (zum Pech) eine andere Webseite andere Vokabeln im Sonderangebot, die im vorgenannten SAMPA-Schlüssel nicht vorkommen, kennt auch keine IPA-Systematik, so dass man IPA nach Sampa umwandeln könnte, sondern nur eine eigene Bragi Code-Lauttabelle

Ein Test dieser Bragi-Seite werde ich an anderer Stelle vornehmen. Immerhin werden von Bragi einige MP3-Dateien ausgegeben. (dp) (0,5h)

Nachtrag am 21.8.2008 um 01.10Uhr:

Eine phontische Ausgabe diverser Laute (Vokale, Konsonanten) für den IPA-Code steht im vorangegangen allgemeinen Eintrag „SAMPA und maschinensprechbare Texte“ im Linksammler gelistet. Leider ist dort noch nicht zu erkennen, wie denn z.B. der isländische SAMPA-Code „c0“ in IPA umgesetzt wird, auch fehlt er in der dort ebenfalls verlinkten phonetischen SAMPA-Übersicht. Muss ich noch weiter suchen, denn auch der SAMPA/XSAMPA2IPA-Translator (dortiger Linksammler-Eintrag) deklariert diesen Laut als illegales Zeichen. (dp)(0,75h)

Linksammler:

Kommentar verfassen

Bitte logge dich mit einer dieser Methoden ein, um deinen Kommentar zu veröffentlichen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s


%d Bloggern gefällt das: