Lieber Situx, Zitat:
ich (...) versuche die ägyptischen Hieroglyphen der maschinellen Sprachverarbeitung näher zu bringen. |
|
Das ist ein löbliches Unterfangen! Aber kommst Du nicht ein bisschen zu spät? Die "Beinlich Wordlist" ist überholt. Inzwischen gibt es das Thesaurus Linguae Aegyptiae (TLA)1, ein professionelles Tool, das auf dem fünfbändigen Wörterbuch von Erman-Grapow beruht, das in der ersten Hälfte des 20. Jahrhunderts aus einer Verzettelung zahlloser ägyptischer Texte entstanden ist. Das TLA enthält eine weitaus vollständigere Wortliste. Jedes Wort verweist auf die entsprechende Seite oder gar Stelle des Wörterbuchs, das komplett digitalisiert ist. Die Lemmata sind auf jeder Wörterbuchseite durchnummeriert. Klickt man auf eine solche Nummer, wird man in die zugehörige Teilmenge des Zettelarchivs geführt. Dieses Archiv enthält fast 1,5 Millionen Zettel. Zum TLA gehört auch eine umfangreiche Textsammlung (in Transkription), mit der man allerlei statistische Analysen durchführen kann. Die Benutzung ist kostenfrei. Bevor Du weiter darüber nachdenkst, die Hieroglyphen der maschinellen Sprachverarbeitung näher zu bringen, solltest Du Dich mit diesem Tool vertraut machen. Melde Dich als "gast" mit Passwort "gast" an. Da es sich um eine ziemliche komplexe Anwendung handelt, solltest Du zuerst einen Blick in das Handbuch werfen. In Frankreich ist auch ein Riesenprojekt angelaufen: Véga (Vocabulaire de l'égyptien ancien)2, das bis September 2017 kostenfrei zu nutzen ist; danach kostet die Benutzung aber etwas. Mit diesem Tool habe ich selbst noch keine eigenen Erfahrungen, kann also nichts dazu sagen. Von französischen Amateuren wird schon seit vielen Jahren das Projet Rosette3 betrieben. Ein englisches (autographiertes) Wörterbuch - Raymond O. Faulkner, The Concise Dictionary of Middle Egyptian - wurde ins Französische übersetzt und in eine Datenbank gebracht: Dictionnaire Rosette4. Zur Suche kann man auch Hieroglyphen in MdC angeben, neben der üblichen Methode in Transkription. Alle diese Tools zeigen die Wörter auch in hieroglyphischer Schreibung an, nicht aber als MdC. Eine gewisse Ausnahme stellt das "Projet Rosette" dar, das in seiner Textsammlung die Texte in Hieroglyphen, MdC, Transkription und Übersetzung anbietet. Beispiel: Semna-Stele5. Es ist also auf diesem Gebiet schon eine Menge gemacht worden. Man darf auch den enormen Aufwand nicht unterschätzen, den diese Projekte verursacht haben und noch weiter verursachen. Meiner Meinung nach ist der Versuch, ein neues maschinenlesbares Wörterbuch zu schaffen, vergebliche Liebesmüh - außer vielleicht zu Übungszwecken. Viele Grüße, Michael Tilgner
> Antwort auf Beitrag vom: 27.06.2017 um 22:20:15
|