Beitrag: 1;2;3 oder 1-3 oder 1;2-7;8
 

Anhänge ausblenden | QR-Code einblenden

http://www.aegyptologie.com/forum/cgi-bin/YaBB/YaBB.pl?board=guan&action=display&num=1498594815

Ägyptologie Forum >> Schrift & Sprache


1) Frage zu Manuel de Codage
 situx am 27.06.2017 um 22:20:15

Hallo an alle Ägyptologen,

ich forsche derzeit in der Computerlinguistik und versuche die ägyptischen Hieroglyphen der maschinellen Sprachverarbeitung näher zu bringen.
Essentiell ist hierbei der Aufbau eines maschinenlesbaren Wörterbuchs. Im Internet finde ich bereits auch einige Quellen mit denen ich potenziell arbeiten kann. Mein Plan ist wie folgt:
Ein Wörterbuch das pro Eintrag folgende Elemente enthält:

Hieroglyphen Unicode - Transkription - Manuel de Codage - Wortart - Bedeutungskonzept(aus Wikidata)

Die Resourcen die ich im Internet finde weisen jedoch meist nur die Zeichen als Gardinerzeichen auf, d.h. ohne Positionierung der Hieroglyphen untereinander (z.B. Zeichen : und * in MdC)
z.B. in der http://www.fitzmuseum.cam.ac.uk/er/beinlich/beinlich.html  Beinlichwortliste.

Hierzu meine Fragen:

1. Ist euch ein Wörterbuch/Tool im Internet bekannt in der Manuel de Codage Beschreibungen mit dabei stehen?

2. Spielt die Position der Zeichen untereinander für die Bedeutung eine Rolle?
D.h. kann ich sicher sein, dass wenn ich eine Beschreibung von Gardiner für ein Wort habe wie z.B. "D2 - Z1 - D21 - D36 - Z1", diese in allen mglw. existierenden Zeichenpositionierungen z.B. "D2*Z121-D36-Z1" immer noch die gleiche Bedeutung hat?
In diesem Fall könnte ich einfach D2 - Z1 - D21 - D36 - Z1 abspeichern und in ägytischen Manuel de Codage Texten nach Wortvorkommen mit "D2 - Z1 - D21 - D36 - Z1" suchen und so Wortformen herausfinden.

3.Gibt es Regeln welche Hieroglyphen immer beispielsweise aufeinander stehen? Sehr oft ist mir das z.B. bei Y1:Z2 aufgefallen

4. Kann ich die Positionierung der Zeichen aus der Transkription ablesen? Meine Vermutung ist nein, aber vll weiß hier jemand einen Trick

Vielen Dank im Voraus!


2) Re: Frage zu Manuel de Codage
 Michael Tilgner am 28.06.2017 um 22:25:52

Lieber Situx,

Zitat:
ich (...) versuche die ägyptischen Hieroglyphen der maschinellen Sprachverarbeitung näher zu bringen.

Das ist ein löbliches Unterfangen! Aber kommst Du nicht ein bisschen zu spät?

Die "Beinlich Wordlist" ist überholt. Inzwischen gibt es das Thesaurus Linguae Aegyptiae (TLA)1, ein professionelles Tool, das auf dem fünfbändigen Wörterbuch von Erman-Grapow beruht, das in der ersten Hälfte des 20. Jahrhunderts aus einer Verzettelung zahlloser ägyptischer Texte entstanden ist.

Das TLA enthält eine weitaus vollständigere Wortliste. Jedes Wort verweist auf die entsprechende Seite oder gar Stelle des Wörterbuchs, das komplett digitalisiert ist. Die Lemmata sind auf jeder Wörterbuchseite durchnummeriert. Klickt man auf eine solche Nummer, wird man in die zugehörige Teilmenge des Zettelarchivs geführt. Dieses Archiv enthält fast 1,5 Millionen Zettel. Zum TLA gehört auch eine umfangreiche Textsammlung (in Transkription), mit der man allerlei statistische Analysen durchführen kann. Die Benutzung ist kostenfrei.

Bevor Du weiter darüber nachdenkst, die Hieroglyphen der maschinellen Sprachverarbeitung näher zu bringen, solltest Du Dich mit diesem Tool vertraut machen. Melde Dich als "gast" mit Passwort "gast" an. Da es sich um eine ziemliche komplexe Anwendung handelt, solltest Du zuerst einen Blick in das Handbuch werfen.

In Frankreich ist auch ein Riesenprojekt angelaufen: Véga (Vocabulaire de l'égyptien ancien)2, das bis September 2017 kostenfrei zu nutzen ist; danach kostet die Benutzung aber etwas. Mit diesem Tool habe ich selbst noch keine eigenen Erfahrungen, kann also nichts dazu sagen.

Von französischen Amateuren wird schon seit vielen Jahren das Projet Rosette3 betrieben. Ein englisches (autographiertes) Wörterbuch - Raymond O. Faulkner, The Concise Dictionary of Middle Egyptian - wurde ins Französische übersetzt und in eine Datenbank gebracht: Dictionnaire Rosette4. Zur Suche kann man auch Hieroglyphen in MdC angeben, neben der üblichen Methode in Transkription.

Alle diese Tools zeigen die Wörter auch in hieroglyphischer Schreibung an, nicht aber als MdC. Eine gewisse Ausnahme stellt das "Projet Rosette" dar, das in seiner Textsammlung die Texte in Hieroglyphen, MdC, Transkription und Übersetzung anbietet. Beispiel: Semna-Stele5.

Es ist also auf diesem Gebiet schon eine Menge gemacht worden. Man darf auch den enormen Aufwand nicht unterschätzen, den diese Projekte verursacht haben und noch weiter verursachen. Meiner Meinung nach ist der Versuch, ein neues maschinenlesbares Wörterbuch zu schaffen, vergebliche Liebesmüh - außer vielleicht zu Übungszwecken.

Viele Grüße,
Michael Tilgner

> Antwort auf Beitrag vom: 27.06.2017 um 22:20:15


1: http://aaew.bbaw.de/tla/
2: http://vega-vocabulaire-egyptien-ancien.fr/actualite-du-projet/
3: http://projetrosette.info/page.php?Id=1
4: http://projetrosette.info/page.php?Id=599
5: http://projetrosette.info/page.php?Id=799&TextId=79&line=1&bloc=0&langue=FR


3) Re: Frage zu Manuel de Codage
 Sinuhe20 am 03.07.2017 um 10:06:02

Hallo,

ich glaube, du brauchst eher eine Datenbank als eine einfache Wörterbuchliste, weil alles in komplexer Beziehung zueinander steht.

Hieroglyphen Unicode - Transkription: n : 1 (z.B. verschiedene Determinative, dieselbe Transkription)
Hieroglyphen Unicode - Manuel de Codage: 1 : n (Gruppierungen variieren)
Hieroglyphen Unicode - Wortart: n : n (aus den Hieroglyphen allein lässt sich die Wortart nicht ablesen, eine Hieroglyphengruppe kann zugleich Substantiv, Verb und Adjektiv sein)
Hieroglyphen Unicode - Bedeutungskonzept: n : n (verschiedene Bedeutungskonzepte für eine Hieroglyphengruppe, mehrere Darstellungsmöglichkeiten für ein Bedeutungskonzept)
Transkription - Manuel de Codage: 1 : n (für eine Transkription kann es verschiedene Darstellungen geben, für einen Hieroglyphenblock ist die Transkription aber eindeutig)
Transkription - Wortart: n : n (wie Punkt 3)
Transkription - Bedeutungskonzept: n : n (wie Punkt 4)
Manuel de Codage - Wortart: n : n (wie Punkt 3)
Manuel de Codage - Bedeutungskonzept: n : n (wie Punkt 4)
Wortart - Bedeutungskonzept: 1 : n

Als Wörterbuch würde ich die Hannig-Lexika oder das TLA empfehlen, den MDC muss man sich aber selbst herleiten.

Hier noch eine (nicht mehr ganz aktuelle) Linkliste von mir zu dem Thema: http://algoria.de/hieromat/links.html

Viele Grüße
Sinuhe20

> Antwort auf Beitrag vom: 27.06.2017 um 22:20:15