Typesetting
2023
Kalapodi Legacy Data und die digitale Welt
Projekt
1Im Rahmen des Projektes »Digitalisierung und Retrokontextualisierung der Legacy-Data der Grabung Kalapodi« wird schrittweise die analoge Dokumentation der früheren Grabungen – von 1973 bis 1982 unter der Leitung von Rainer Felsch und von 2004 bis 2013 unter Wolf-Dietrich Niemeier – digitalisiert und aufbereitet. Auch die neueren Grabungen unter der Leitung von Katja Sporn ab 2014, die weitestgehend bereits digital angelegt wurden, werden in die Planung miteinbezogen, damit ein einheitliches Konzept für alle drei Grabungsperioden geschaffen werden kann.
2Ziele sind neben der Langzeitarchivierung auch eine leichtere Zugänglichkeit sowie eine Vernetzung der idai.world. Dadurch sollen die Forschungsdaten in einen größeren Kontext gesetzt werden und als Grundlage für die Aufarbeitung der Grabungsergebnisse sowie für weitere Publikationen dienen.
3Generell können dabei auch allgemeingültige Workflows und Standards zur Retrokontextualisierung von Altgrabungen des DAI geschaffen werden. Diese Workflows dienen der Optimierung der Fundbearbeitung und digitalen Felddokumentation. 2020 wurde im DAI Athen eine neue Projektstelle für das FDM geschaffen, wobei das Projekt fortwährend von der Zentrale in Berlin, durch Therese Burmeister (2019–2021), Fabian Riebschläger und Juliane Watson, tatkräftig unterstützt und betreut wurde. Die langfristige Projektplanung wurde immer in Absprache mit diesen durchgeführt.
iDAI.archives und Datenstruktur
4Am Beginn des Projektes stand der Wunsch, alle vorhandenen Grabungsdaten digital und strukturiert gemeinsam abrufbar zu machen. Insofern noch keine Digitalisate vorlagen, wurden in den letzten Jahren Scans für die nachhaltige Langzeitarchivierung erstellt. Dazu zählen ca. 36.000 Fotografien (Fotonegative, Diapositive, Röntgenbilder), ca. 6000 Zeichnungen (bspw. Architektur, Plana/Profile) und 74.600 Seiten Dokumentation (Befundbücher, Tagebücher, Inventarhefte etc.). So wurden bisher für das Projekt Kalapodi 13,5 TB Daten erzeugt.
5Mit iDAI.archives gibt es ein eigenes Erschließungs- und Verwaltungssystem, in welchem die Kernstruktur der Archivbestände der Grabung Kalapodi verzeichnet wurden[1] (Abb. 1).
6Dieses derzeit noch nicht veröffentliche System verweist auf die Standorte des Archivgutes und gibt kurze Beschreibungen zu den einzelnen Ordnern und Mappen. Dieses soll in Zukunft auch für die Öffentlichkeit recherchierbar gemacht und weiter ausgearbeitet werden.
7Nach Begutachtung der Archivgüter wurden auch alle weiteren digitalen Forschungsdaten, wie z. B. die digitalen Fotos von Kalapodi, miteinbezogen. Daneben wurden einige handschriftliche Listen bereits mit Excel als digitale Listen erstellt. In einem im Sommer 2020 stattgefundenen Fern-Praktikum wurden vor allem zu den Befunden der Grabung zahlreiche Listen erstellt.
8Daneben wurde bereits seit der zweiten Grabungsperiode in den Jahren 2004 bis 2013 die iDAI.field1-Version mit der Datenbankanwendung filemaker (Abb. 2) genutzt, um dort Befunde und Funde einzutragen. Diese Version wurden dann in iDAI.field2 mit einigen Zusatzfeldern migriert.
9Es stellte sich dabei heraus, dass die Datenstruktur und einige Begrifflichkeiten noch nicht direkt in dem Datenmodell von iDAI.field abbildbar waren und das digitale sowie das analoge Dokumentationskonzept des Projektes aller drei Grabungsperioden vereinheitlicht werden musste[2]. Ab 2020 wurde ein neues Datenmodell entwickelt, das alle Daten und die schrittweise Digitalisierung und Erstellung von Metadaten miteinbezieht, wobei der Schwerpunkt auf dem Import in die neue Datenbank field liegt.
Konfiguration für field
10Im Einklang mit diesem Datenmodell wurde das field-Projekt Kalapodi neu geplant, damit die Daten strukturiert und schrittweise erstellt und hochgeladen werden können (Abb. 3). Neben den Grabungsarealen und -schnitten stehen als wichtigstes Kernelement die Befunde im Fokus, da diese in der Datenbank vorhanden sein müssen, bevor die Funde angefügt werden können.
11Dafür wurden alle Daten der drei Grabungsperioden zusammengetragen und analysiert, um ein gemeinsames Aufbauschema mit einheitlichem Vokabular zu erhalten. Diese arbeitsintensive Tätigkeit ist für die Vergleichbarkeit und Recherche der Altdaten sehr wichtig.
12Für field wurde ein Plan mit projektspezifischen Feldern und Wertelisten (Abb. 4) auf Deutsch und Englisch entwickelt. Diesem Schema folgend sind Excel-/CSV-Listen daran angepasst worden.
132022 wurde die Datenbank field von der Zentrale umgearbeitet, so dass die Konfiguration der projekteigenen Datenstruktur viel leichter angeglichen werden kann. Da die projektspezifischen Anpassungen für Kalapodi davor schon umfassend geplant waren, konnten die neuen Anpassungen leicht in field eingearbeitet werden.
14Exemplarisch werden hier (Abb. 5) die blau eingefärbten Felder als neukonfigurierte Felder bei den Befundanpassungen gezeigt.
Grabungsraster
15In den verschiedenen Grabungsperioden von Kalapodi wurden mehrere lokale Rastersysteme zur Datendokumentation verwendet. In der ersten Grabungsperiode (Grabung Felsch) wurde ein alphanumerisches System basierend auf 1 m-Quadranten benutzt, wohingegen bei den neuen Grabungsperioden unter Niemeier und Sporn ein gemeinsames numerisches Koordinatensystem angewendet wurde.
16Um alle Daten miteinander vergleichbar machen zu können, mussten diese Rastersysteme miteinander kombiniert werden. Zudem sollen beide Systeme zukünftig in jedem Befund und Fund angezeigt werden, damit die Daten schneller miteinander abzugleichen sind.
17Erfreulicherweise lassen sich die verschiedenen Grabungssysteme gut übereinanderlegen. So wurden seit den neueren Grabungen unter Niemeier und Sporn die Quadranten nach dem Schema 4960/5025 benannt und entsprechen jeweils 5 x 5 m-Schnitten (Abb. 6, rote Linien). Vier dieser Schnitte bilden zusammen einen Großquadranten vom Grabungsraster der alten Grabung unter Felsch (hier P17), also 10 x 10 m-Schnitte. In diesen Großquadranten liegen wiederum 100 Kleinquadranten (1 x 1 m-Schnitte) (Abb. 6, grüne Linien). Zu jedem dieser 5 x 5 m-Schnitte der neuen Grabungsperioden lassen sich also eindeutig 25 Kleinquadranten der Grabungskampagne Felsch zuweisen.
18Um diese Datengrundlage räumlich zu erfassen und zu analysieren, wurden die Rastersysteme in QGIS (Geoinformationssystemsoftware) erstellt. Diese Daten konnten dann automatisiert als Listen exportiert werden.
19Als zweiter Schritt wurden in QGIS die Grabungsflächen der Grabungen Niemeier und Felsch umgezeichnet (Abb. 7). Auch von Stefan Biernath umgezeichnete Schnitte der Grabungsperiode unter Sporn wurden in das Projekt importiert. Umgezeichnet wurden hierbei zusammengefasste Grabungsareale (Bsp. KAL Nordtempel, KAL Südtempel) und die Grabungsflächen sowie auch die 1973 durchgeführten Suchschnitte. All diese shapefiles wurden als geoJSON exportiert und als Multipolygon in field (Abb. 8) hochgeladen.
20Zudem wurden mit QGIS als Grundlage verschiedene Kartenhintergründe erstellt, die in field ausgewählt werden können. Neben den einzelnen und kombinierten Rastersystemen wurden auch die architektonischen Bauelemente der Grabung Kalapodi als Hintergrund hinzugezogen (Abb. 9).
Excel-Makro und Pythonskript
21Die in QGIS erstellten Grabungsumrisse wurden als Konkordanzlisten exportiert und sollen als Grundlage für eine automatisierte Berechnung dienen. Ziel soll hier sein, den Schnitten der neuen Grabungskampagnen automatisch den passenden Großquadranten (Schema L25) und Kleinquadranten (L25-00, L25-01, L25-02...) des alten Grabungsrasters zuzuordnen und umgekehrt.
22Als erstes wurde ein Excel-Makro (Abb. 10) entwickelt, in welchem diese Umrechnung automatisch durchgeführt werden kann. Hier konnte festgestellt werden, dass die automatische Berechnung sehr gut funktioniert, solange nur eine Angabe enthalten ist. Bei mehrfacher Angabe von Schnitten oder Quadranten liefert das Makro jedoch keine Ergebnisse (siehe Abb. 11, Quadrant Felsch). Für die Umrechnung von dem neuen Grabungsraster zu dem alten Grabungsraster ist das Makro ausreichend und mit nur wenig händischer Nacharbeit lassen sich die Quadranten des alten Grabungsaster in die jeweiligen Befund- und Fundlisten kopieren.
23Für die umgekehrte Umrechnung (vom alten zum neuen Grabungsraster) der prozentual sehr häufig vorkommenden Variante mit mehrfacher Nennung von Kleinquadranten ist die Nacharbeit viel zu zeitineffektiv? Juliane Watson (FDM Berlin) erklärte sich bereit, ein eigenes Python-Skript zu schreiben, welches diese Funktion übernehmen soll, wofür ihr an dieser Stelle nochmals gedankt sei. Mithilfe dieses effektiven Skriptes lässt sich nun automatisch von jedem einzelnen Kleinquadranten der Grabung Felsch der zugehörige Schnitt des neuen Grabungsrasters angeben, sogar direkt für eine Liste (Abb. 11).
Field-Upload
24Nach der oben skizzierten Vorarbeit in der Datenbereinigung mit dem vereinheitlichten Vokabular, der Konfigurationsanpassung und der automatischen Berechnung der Quadranten, konnten nun die ersten fertigen CSV-Listen in field importiert werden. Schrittweise wurden 2022 deshalb die 22 Grabungsareale und 79 Grabungsschnitte aller Grabungsperioden in field hochgeladen. Danach wurde die nächste Ebene mit ca. 12.000 Befunden, 600 Architekturteilen und 50 Gräbern importiert.
25Hier ist anzumerken, dass die Listen am besten erst mit nur den nötigen Angaben identifier und relations.isChildOf importiert werden sollten. So sind die jeweiligen Befundnummern schon vorhanden und die jeweiligen Entsprechungen und Verweise (wie beispielsweise die stratigraphischen Lageangaben »Liegt Über«, »Verfüllt«, »Schneidet«…) können so beim Import der komplett ausgefüllten Listen auch richtig von der Datenbank erkannt werden. Wenn dies nicht getan wurde, meldet field einen Fehler, da der Datenbank die zugewiesene Befundnummer erstmal noch unbekannt ist.
26Lobenswert an der neuen field-Version ist, dass sie immer weitere Fehlermeldungen angibt, mit Hilfe derer man die Listen erneut bereinigen und überprüfen kann. Typische Fehler sind hierbei: Leerzeichen in der Kopfzeile, falsche Jahres- oder Schnittangaben und generell Rechtschreibfehler bei den Feldangaben oder den Wertelisten. Beispielsweise wird auch bei Funden angezeigt, wenn die dazugehörige Befundnummer noch fehlt oder unterschiedliche Jahresangaben im identifier auftauchen.
27Im Januar 2023 konnten zudem die ersten Funde hochgeladen werden. Da der handschriftlich verfasste Bronzekatalog der Grabung Felsch in großen Teilen schon abgetippt war, konnte das gesamte Bronzeinventar damit gefüllt werden. Fast 3200 Metallobjekte sind nun hochgeladen.
Best Practice
28Durch die Arbeiten der letzten Jahre lassen sich übergreifend einige wichtige Punkte für die Aufarbeitung von Altgrabungen in der field-Datenbank festhalten:
  1. Der erste Schritt bei der Aufarbeitung von alten Grabungsdaten muss immer eine umfassende und detaillierte Einarbeitung in die gesamten Daten und verwendeten Programme oder Datenbanken des Projektes sein.
  2. Erst danach kann eine sorgfältig durchdachte Datenstruktur erstellt werden. Diese kann je nach Projekt auch mehrere Gefüge enthalten, wie eine eigene Archivstruktur und einen Datenbankaufbau.
  3. In dieser Datenstruktur müssen von Anfang an fest genutzte Begriffe integriert und eingehalten werden, ggf. auch mit Wertelisten. Dafür sollten von allen Grabungsjahren Begriffe gesammelt und ein übergreifendes Vokabular für die Datenbank geschaffen werden, wobei man eventuell auch die originale Ansprache als zusätzliches Feld behalten kann.
  4. Diese Datenstruktur mit festem Vokabular wird direkt als erstes im Projekt konfiguriert.
  5. Daneben müssen zu Beginn gleich die Projekteigenschaften erstellt werden, wozu eine Entscheidung über die Sprachen, in denen das Projekt angelegt werden soll, eine Namensliste aller Bearbeiter:innen, wie auch die Kampagnenjahre zählen.
  6. Über die Exportfunktion von field können für alle Kategorien das Blanko-Schema der CSV-Listen (auch andere Formate) heruntergeladen werden. So können diese Listen als Vorlage zum Ausfüllen dienen.
  7. Wie bereits in field selbst vorgesehen, sollten zuerst Grabungsareale und Schnitt als oberste Kategorien angelegt werden. Hier lassen sich zur besseren Visualisierung auch umgezeichnete Pläne aus QGIS/AutoCAD einbeziehen.
  8. Darauf bauen wiederum die stratigraphischen Einheiten auf, deren Unterkategorien flexibel angepasst werden können.
  9. Schließlich folgen die Funde, welche ebenfalls durch angepasste Unterkategorien oder neue Gattungen angepasst werden können.
  10. Da für Kalapodi bereits eine eigene field-Datenbank und teils ausgefüllte Bereiche vorhanden waren, ist hier kurz explizit anzumerken, dass die Daten vor dem Import unbedingt bereinigt sein sollten, da die Datenqualität ansonsten nicht ausdrücklich gesichert werden kann. Wenn es jedoch notwendig ist (wie in Kalapodi), können die importierten Daten wieder exportiert und als CSV-Liste bearbeitet und bereinigt werden. Dort kann über Filter gezielter die Einhaltung von festem Vokabular gesichert werden. Die Datensätze lassen sich danach problemlos wieder importieren und überschreiben.
29Zum Schluss ist festzuhalten, dass all die Schritte projektspezifisch angepasst werden müssen. Zudem können sich grundsätzlich im Laufe eines Projektes weitere Änderungen ergeben, weshalb eine flexible Datenstruktur notwendig ist.
Fazit
30Generell sind Aufarbeitungen von Altgrabungen immer als Langzeitprojekt anzusehen, die sich als sehr zeitaufwendig und arbeitsintensiv herausstellen und außerdem mit riesigen Datenmengen einhergehen. Dennoch lässt sich ein immenser Mehrwert erkennen, da die Daten deutlich schneller durchsuchbar sind und die verschiedenen Grabungsmetadaten besser veranschaulicht und miteinander verglichen werden können.
31Durch die Arbeiten der letzten Jahre wurde eine umfassende Datenstruktur erstellt und die ersten Daten in die Datenbank field integriert. Zukünftig kann für die Legacy Data von Kalapodi weiter auf dieser Vorlage aufgebaut und die weitere Herstellung von Metadaten sowie der Import von Datenpaketen vorangetrieben werden.
32Durch die neue digitale Welt und die Vernetzung der iDAI.world lassen sich alle Prozesse deutlich beschleunigen. Projektspezifische Anwendungen (wie das Python-Skript) können Vorgänge und einzelne Arbeitsschritte in den jeweiligen Projekten unterstützen und extrem wertvoll sein. Zukünftig sollten immer mehr solcher digitaler Werkzeuge eingesetzt werden, um die Arbeitsprozesse effizienter zu gestalten und flexibel an projektspezifische Herausforderungen anpassen zu können.
Abstracts
Zusammenfassung
Kalapodi Legacy Data und die digitale Welt
Michelle Greif, Dimitris Grigoropoulos
Im Forschungsdatenmanagement steht neben der Archivierung und Dokumentation der Daten auch deren Aufbereitung im Vordergrund. Dafür bietet die iDAI.world einige hilfreiche Tools, wobei sie als Datenbank ein essenzielles Kernelement darstellt. In diesem Artikel wird exemplarisch die Retrodigitalisierung und Rekontextualisierung der Legacy Data von Kalapodi und deren Einbindung in moderne Software erläutert. Hier soll das Potential der digitalen Instrumente sowie der Mehrwert dieser Dokumentationsmethodik präsentiert werden.
Schlagwörter
Forschungsdatenmanagement, Digitale Dokumentation, Retrodigitalisierung, Datenbanken
Abstract
Kalapodi Legacy Data and the Digital World
Michelle Greif, Dimitris Grigoropoulos
Research data management not only focuses on archiving and documenting large datasets but is also meant to enable better ways of processing them. For this purpose, iDAI.world and especially iDAI.field as one of its core elements can offer valuable tools. This article outlines the work carried out so far as part of the retro-digitization and re-contextualisation of legacy data from the DAI excavation at Kalapodi in central Greece and their integration into modern software. The project illustrates the potential of digital tools as well as the value of this approach to organizing and processing old excavation data.
Projekt
iDAI.archives und Datenstruktur
Konfiguration für field
Grabungsraster
Excel-Makro und Pythonskript
Field-Upload
Best Practice
Fazit
Abstracts
2023