Service heiARCHIVE
Zentraler Archivierungsdienst für Forschungsdaten der Universität Heidelberg
heiARCHIVE ist der zentrale Archivierungsdienst für Forschungsdaten der Universität Heidelberg. Der Dienst ist für die langfristige Archivierung von Forschungsdaten konzipiert ("cold data") - ein regelmäßiger Rückruf der archivierten Daten ist nicht vorgesehen. Für die Archivierung müssen die Daten strukturiert und mit einem bestimmten Satz an Metadaten angereichert werden. heiARCHIVE verfügt über unterschiedliche Varianten, die sich im Hinblick auf die Funktionalität unterscheiden, z.B. in der Anzahl der vorgehaltenen Kopien, der Möglichkeit einer Georeplikation, der Vergabe von eindeutigen Identifiern und der Möglichkeit der Formaterkennung, -validierung und -konvertierung.
Der Dienst wird durch das Research Data Unit (RDU) betrieben und kontinuierlich weiter entwickelt. Das RDU ist eine gemeinsame Serviceeinrichtung des Universitätsrechenzentrums und der Universitätsbibliothek Heidelberg.
Status des Dienstes: Offener Pilotbetrieb
Der neue Archivierungsdienst heiARCHIVE befindet sich im Pilotbetrieb. In dieser Phase werden Archivdaten bereits sicher und dauerhaft verwahrt. Die technischen Merkmale des Dienstes sind weitgehend vorhanden. Die genauen Nutzungsbedingungen und das Service-Level-Agreement sind noch als vorläufig zu betrachten. In der Pilotphase ist es insbesondere nicht erlaubt sensible personenbezogene Daten zu archivieren. Die Anzahl der erlaubten 'projects', 'archives' und 'archive packages' ist limitiert und kann bei Bedarf in Rücksprache mit uns erhöht werden. Suchfunktion für die Metadaten, Georedundanz, die Vergabe von eindeutigen Identifiern und die Formaterkennung, -validierung und -konvertierung sind im aktuellen Pilotbetrieb noch nicht möglich.
Sobald die letzten noch offenen Punkte geklärt sind, wird heiARCHIVE in den Produktivbetrieb überführt werden. Das heiARCHIVE-Team wird dann darüber informieren. Die im Pilotbetrieb archivierten Daten werden selbstverständlich erhalten bleiben. Sofern Teilnehmer:innen des Pilotbetriebs mit den finalen Nutzungsbedingungen oder Service-Level-Agreement nicht einverstanden sein sollten, wird eine Möglichkeit angeboten, die Daten kurzfristig zu löschen.
Verlauf der Dienstöffnung
- 28.04.2023: Öffnung des Dienstes als Pilotdienst für alle Nutzer:innen
- 31.08.2022: Öffnung des Dienstes als Pilotdienst für SDS@hd Nutzer:innen
Informationsveranstaltungen
Im Rahmen der Data Hour werden regelmäßig Informationsveranstaltungen zu heiARCHIVE angeboten, in denen der aktuelle Status des Dienstes mit seinen Dienstmerkmalen vorgestellt und Starthilfe bei der Verwendung gegeben wird (siehe auch verlinkte Folien).
Darüber hinaus können auf Anfrage von Forschungsgruppen weitere virtuelle Informationsveranstaltungen zu heiARCHIVE angeboten werden.
Zielgruppe
- Beschäftigte
- Studierende
- Promovierende
- Forschende
Nutzen
Der Dienst ermöglicht die Langzeitarchiverung von wissenschaftlichen Daten mit folgenden Merkmalen:
- sichere Speicherung (mehrere Dateikopien, bei Bedarf standortübergreifende Speicherung)
- lange Verwahrungszeiten (z.B. 10 Jahre oder mehr)
- Verwaltung von Metadaten mit Suchfunktion
- Dateiformaterkennung, -validierung und -konvertierung (optional)
Zugang und Voraussetzungen
Für die Nutzung des Dienstes heiARCHIVE ist eine gültige Uni-ID erforderlich.
Neue Nutzer:innen müssen sich zunächst im heiARCHIVE Webinterface über den Link 'Sign up' für den Dienst heiARCHIVE registrieren. Dort erhalten Sie weitere Informationen zum Registrierungsprozess.
Technische Informationen und Finanzierung
Die Daten werden auf Hardware gespeichert (Online-Speicher, Tape), die durch Mittel der Universität Heidelberg finanziert wurde.
Die Entwicklung des Dienstes wurde gefördert vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg.
Häufig gestellte Fragen
Tabelle
Wohin kann ich mich bei Supportanfragen wenden? | Anfragen zum Support richten Sie bitte an |
Können Daten von SDS@hd direkt archiviert werden? | Es ist möglich, Daten in einem SDS@hd-Speichervorhaben direkt zu archivieren. Dafür ist es erforderlich, den Zugriff für heiARCHIVE im SDS@hd Management zu aktivieren. Damit wird in dem Speichervorhaben ein neues Unterverzeichnis angelegt, das als Inbox für heiARCHIVE dient. Details dazu finden Sie im heiARCHIVE-Wiki. |
Wie kann ein Zugriff auf archivierte Daten erfolgen und mit welcher Performance / Wartezeit ist zu rechnen? | Für die Datenspeicherung kommt bei heiARCHIVE Band-Technologie zum Einsatz, die für die langefristge Speicherung sehr gut geeignet, kosteneffizient und insbesondere sehr energieeffizient ist. Technologiebedingt setzt ein Datenzugriff voraus, dass diese zunächt angefordert und vom Band-Medium gelesen auf Online-Speicher übertragen werden, bevor Sie als Nutzer:in auf die Daten zugreifen können. heiARCHIVE hat hierfür einen Prozess implementiert, den Sie von der Web-UI initiieren können. Sie werden dann per E-Mail darüber informiert, sobald Sie auf die Daten zugreifen können. Die einhergehende Wartezeit zwischen Anforderung und Zugriffsmöglichkeit hängt von der Datenkapazität ab (konkret: je kleiner ein archive-package umso kürzer die Übertragungsdauer) und von der Auslastung der Infrastruktur (wenn viele Nutzer:innen parallel Daten anfordern, dauert es länger). Die Infrastruktur erweitern wir nach Bedarf, sodass bei höherer Nutzung die Systeme entsprechend skaliert, d.h. erweitert werden. Wir sind dabei Erfahrungswerte zu sammeln, sodass wir perspektivisch Richtwerte für die erwartete Dauer benennen können. |
Dürfen personenbezogene Daten in heiARCHIVE gespeichert werden? | Aktuell ist es nicht erlaubt personenbezogene Daten in heiARCHIVE zu archivieren. Dies könnte sich in Zukunft aber ändern - wir sind hierzu im Gespräch mit der Datenschutzstabsstelle der Universität Heidelberg. Wenn sich der Status ändert, werden wir alle Nutzer:innen darüber informieren. |