Universität Mannheim / Philosophie / Anglistisches Seminar / Anglistik I / Forschung / DAT - Datenbank für Transkripte

DAT - Datenbank für Transkripte

Leitung: Dr. Dieter Thoma (Ansprechpartner)

Wiss. Mitarbeiter:  Klaus-Peter Laube, Dipl. Math. / Ing. grad. Informatik (ausgeschieden)

Finanzierung: Rektorat der Universität Mannheim, Eigenmittel


 

 

Das Projekt (Datenbankentwicklung) ist abgeschlossen, DAT wird aber in diversen Forschungsprojekten weiterhin eingesetzt.

Als Bezeichnung für die Datenbank bzw. ihre Benutzeroberfläche hat sich das Kürzel DAT etabliert. DAT steht für Datenbankanwendung zur Analyse von Transkripten. Das Programm, das ursprünglich im Rahmen des Projekts ‚Zweitspracherwerb in der Kindheit’ entwickelt wurde, soll Werkzeuge für die Analyse von Transkripten bereitstellen und dabei in der Lage sein, Transkripte, die mit anderen Werkzeugen ( z.B. dem Transkriptionseditor EXMARaLDA) erstellt wurden, zu integrieren. Die vorliegende Version der Anwendung ist als Access-Projekt realisiert, bei dem die relationale Datenbank "SQL Server 2005 Express" für die Datenhaltung eingesetzt wird. In der jetzigen Form eignet sich das Programm unter Verwendung von "Remote Desktop Connection" zur Benutzung innerhalb des Netzes der Universität Mannheim. Eine internetfähige Version des Programms wird zur Zeit erstellt. Folgende Funktionsschwerpunkte sind bis jetzt realisiert:

  • Einteilung des Datenbestandes nach Forschungsprojekten
  • Allgemeine Verwaltungsfunktionen
  • Import und Export von Daten in einem XML-Format, das zu EXMARaLDA kompatibel ist
  • Verschiedene Darstellungen der Daten eines oder mehrerer Transkripte
  • Hinzufügen und Entfernen von Auswertespuren (Kodierung)
  • Definition von Kennzahlen und deren Einbeziehung in die Auswertungen
  • Verschiedene Such- und Zählfunktionen für alle Transkripte über mehrere Ebenen
  • Darstellung der Ergebnis-Daten im HTML- und Excel-Format
  • Speicherung, Zusammenfassung und Reproduktion von Abfragen

Zum gegenwärtigen Zeitpunkt ist die direkte Erstellung eines neuen Transkripts in DAT nicht vorgesehen. Grundlage für die Arbeit in DAT sind stets importierte Transkripte, die hier mit zusätzlichen Kodierungsspuren versehen und ausgewertet werden können.

Beim Kodieren (Bild 1) ist eine Überwachungsfunktion aktiv, die nur solche Eingaben zulässt, die mit einem vorher festgelegten Vorrat der erlaubten Kodierzeichen übereinstimmen. Damit wird sichergestellt, dass die Suche korrekte Werte liefert. Als Erweiterung des Kodiersystems kann der Benutzer Kennzahlen, wie zum Beispiel die mittlere Satzlänge einer Spur oder die Anzahl der Wörter eines Segments definieren. Diese werden anschließend automatisch berechnet und einzelnen Spuren bzw. Segmenten zugeordnet. Die Kennzahlen können mit in nachfolgende Auswertungen einbezogen werden.

Während der Kodierung, aber auch unabhängig davon, kann das Programm die in der Datenbank enthaltenen Transkripte als Partiturdarstellung (Bild 2) anzeigen, bei der die Äußerungen der Sprecher entlang einer horizontalen Zeitachse notiert sind. Suchergebnisse werden als Liste von Fundstellen dargestellt.

Zur Auswertung sind Such- und Zählfunktionen für die gleichzeitige Suche auf bis zu fünf Ebenen (Kriterien über fünf Kategorien) und für die vorher definierten Kennzahlen möglich (Bild 3). Das Ergebnis der Abfragen wird zunächst auf dem Bildschirm angezeigt (Bild 4). Alle Auswerteergebnisse können aber auch als Excel-Dateien gespeichert und dort z.B. für die grafische Darstellung aufbereitet werden. Um Abfragen bei stetig wachsendem Datenbestand exakt in der gleichen Weise wiederholen zu können, besteht eine Möglichkeit zum Abspeichern und Reproduzieren von Abfragen. Außerdem können mehrere Abfragen zu Auswerteaufträgen zusammengefasst werden.

Bild 1)   

 

Bild 2)  

 

Bild 3)  

 

Bild 4) 

 

 

 


 
 
HomeAnglistik IAnglistik IIAnglistik IIIAnglistik IVJuniorprof.Anglistik für WWProf. MehrsprachigkeitDruckenSuche
 
Home SeminarStartseite Anglistik ITeamSprechstundenLehreForschungStellenangeboteMedien