Recommendations on Data Versioning

We often say that “A is a version of B” but do not explain what we mean by “version”. We imply that B was somehow derived from A or that they share a common ancestor. But how is B related to A? How do they differ? Do they differ in content or format? What is the significance of this difference? While this sounds like a question about the provenance of a dataset, it goes beyond that and asks questions about the identity of a digital object and the intellectual and creative work it embodies.

The project “PID Reference Model for the Versioning of Research Data” at the Chair of Information Management at the Berlin School of Library and Information Science (IBI) at Humboldt Universität zu Berlin focused on the versioning of research data publications in the context of ongoing discussions about the reform of research evaluation from an infrastructural perspective. As an output of the project, the team led by visiting fellow Jens Klump developed a set of guidelines on how to version research data.

Klump, J., Pampel, H., Rothfritz, L., & Strecker, D. (2024). Recommendations on Data Versioning. Berlin, Germany: Humboldt-Universität zu Berlin. https://doi.org/10.5281/zenodo.13743876

This recommendation outlines key aspects of research data versioning for scientists and information management professionals at research-performing organisations. It is based on prior work by the Research Data Alliance Data Versioning Working Group.

Here is a presentation by the team lead in German: https://www.ibi.hu-berlin.de/de/von-uns/bbk/abstracts/ss_24/klump_versionen

Women in Data Science: Munich Conference, October 10, 2024

On October 10, 2024 there will be some fantastic speakers in the heart of Munich.
WiDS Munich is independently organized by LMU, TUM, MDSI, BERD@NFDI, TUM Think Tank and Sixt SE to be part of the mission to increase participation of women in data science and to feature outstanding women doing outstanding work.Women in Data Science (WiDS) Munich is a regional one-day event organized by the Ludwig-Maximilians-University Munich (LMU), the Technical University Munich (TUM) and Sixt, associated with the WiDS worldwide non-profit organization.

WiDS worldwide holds an annual conference at Stanford University and an estimated 150+ locations worldwide. This conference provides an opportunity for folks in the Munich community to learn about and celebrate the accomplishments of women applying data science in a variety of domains.

All genders are invited to attend WiDS regional events, which features outstanding women doing outstanding work.

https://www.widsmunich.de/

#EDDI2025 in Chur

Der Call for Papers für die 16. Europäische DDI Users Conference (#EDDI2025) in Chur (Schweiz) wurde veröffentlicht. Beiträge können bis 2. September eingereicht werden. Die Konferenz findet am 3. und 4. Dezember statt, an den Tagen davor und danach gibt es Side Meetings, Workshops und Tutorials.

Abtracts können hier eingereicht werden: https://events.geant.org/event/1637/abstracts/

Bericht von SLOW 2024 in Bamberg

Am LIfBi in Bamberg wurde der diesjährige SLOW ausgerichtet. Nachdem in bewährter Form die Teilnehmenden sich ein Programm erarbeitet haben. Wurden in über 30 selbst organisierten Sessions die verschiedensten Themen diskutiert:

In der Session „Dokumentation“ wurden die notwendigen und möglichen Aspekte der Dokumentation intensiv besprochen. Diskutiert wurde, welche Abdeckung und Tiefe der Dokumentation angestrebt werden sollten und wie diese Dokumentation effektiv an die Datennutzenden weitergegeben werden kann. Besondere Herausforderungen wurden bei der internen Dokumentation identifiziert, wobei die übergeordnete Frage war, was überhaupt dokumentiert werden muss und kann.

Im Bereich des Projektmanagements stellte sich heraus, dass es sich bei laufenden Studien oft um „Standardprojekte“ handelt. Daher wurde die Methodik des agilen Projektmanagements, wie Scrum, als weniger passend empfunden. Stattdessen wurden strukturierte Zeitpläne als geeigneter angesehen. Bewährte Methoden und Strategien in Projekten umfassen die Verwendung eines Backlogs für Querschnittsaufgaben, das Setzen von Meilensteinen zur klaren Definition abgeschlossener Schritte und regelmäßige Retrospektiven zur Reflexion der Zusammenarbeit. Forschung sollte als Bestandteil des Projekts gesehen werden, um Fortschritte und organisatorische Hürden sichtbar zu machen. Eine klare Definition von Prozessschritten und Verantwortlichkeiten wurde als wesentlich erachtet, um Konflikte zu vermeiden.

Die Session „KI – Wozu, warum?“ widmete sich der kritischen Diskussion des Einsatzes von Künstlicher Intelligenz in der Datenaufbereitung. Es wurde festgestellt, dass Sprachmodelle erfolgreich in Bereichen wie Programmierunterstützung und Übersetzung eingesetzt werden können. Die Diskussionsgruppe kam jedoch zu dem Schluss, dass KI-Tools die Arbeit von Datenaufbereitungs-Spezialisten nicht ersetzen können, sondern eher als zusätzliche Werkzeuge dienen sollten.

Aktuelle Herausforderungen bei der Verwendung von Prepaid-Incentives wurden ebenfalls thematisiert. Diese umfassen die Skandalisierung durch die Presse sowie Versand- und Abrechnungsprobleme. Dennoch bringen Incentives stabile Effekte. Vorschläge zur Verbesserung umfassen die gute Kommunikation der wissenschaftlichen Ergebnisse zu Incentives, die Einrichtung einer Hotline für Support und Feldtests sowie Experimente zur Aktualisierung historischer Befunde.

Ein weiterer Diskussionspunkt war die Erstellung eines Stellenplans für das GGP, insbesondere im Hinblick auf die Rolle des Data Stewards. Mögliche Aufgabenbereiche umfassen Projektmanagement, Feldarbeit, Datenverarbeitung, Daten-Dokumentation und IT-Support. Die Diskussion umfasste auch die Stellenplanung an großen Instituten und das Tool der LIfBi-Erhebungskoordination.

Der Anspruch der Longitudinalität in Studien kann dazu führen, dass diese den Anschluss verlieren. Größere Studien neigen dazu, aufgebläht zu werden, was den Überblick erschwert. Entscheidungsgrundlagen für die Evaluierung von Items und die Beteiligung der Community an den Studien wurden diskutiert. Hierbei wurde die Möglichkeit einer kritischen Überprüfung bestehender Programme durch die Community hervorgehoben.

Eine Handreichung zur Plausibilisierung und Datenprüfung, die aus einer Neigungsgruppe des SLOW 2018 hervorgegangen ist, wurde vorgestellt.

Die Vorstellung der Nationalen Forschungsdateninfrastruktur (NFDI), einschließlich BERD@NFDI und KonsortSWD, beinhaltete Diskussionen über die Nachnutzung von NFDI-Systemen und die damit verbundenen Herausforderungen bei der Anpassung bestehender Systeme. Es wurden Fördermöglichkeiten wie Network Development Grants und NFDI4Datascience Speedboat Projects erwähnt.

Unterschiede im Antwortverhalten bei verschiedenen Befragungsmodi (CAPI, CAWI, CATI) wurden ebenfalls analysiert. Faktoren wie die Darstellungsform der Fragen, soziale Erwünschtheit und die Befragungsdauer spielen dabei eine Rolle.

Die geringe Fallzahl von „divers“-Angaben beim Geschlecht stellt eine besondere Herausforderung dar, da die Anonymität der Befragten gefährdet ist. Verschiedene mögliche Vorgehensweisen zur Wahrung der Anonymität wurden diskutiert, wobei keine ideale Lösung gefunden wurde.

Die Notwendigkeit einer Harmonisierung der Anonymisierungspraktiken in Forschungsdatenzentren wurde betont. Eine ganzheitliche Betrachtung der Anonymisierung, einschließlich Rechtsgrundlagen und Angriffsszenarien, soll vorangetrieben werden.

Metadaten werden zunehmend strukturiert erfasst und nachgenutzt. Kooperationen zur stärkeren Standardisierung und Nachnutzung solcher Daten wurden im Abschlussplenum verabredet.

Es wurden verschiedene Ansätze zum Monitoring der Feldentwicklung diskutiert. Neben mathematischen Modellen ist oft eine intuitive Analyse der Teilnahmeentwicklung üblich.

Strategien zur Beteiligung der wissenschaftlichen Community an den Studien wurden ebenfalls erörtert. Dies umfasst Call for Questions, Nutzendenbefragungen und Community Workshops.

Die User Experience (UX) gewinnt bei CAWI an Bedeutung. Aspekte wie responsive Programmierung, Barrierefreiheit und die Vermeidung von Medienbrüchen sind wichtig, um die Panel-Abnutzung zu minimieren.

Die zunehmende Komplexität der Erhebungen erfordert Gegenmaßnahmen. Dazu gehören die Reduktion der Modianzahl und die Anpassung der Kommunikation bei der Erhebungsvorbereitung.

Es wurde die Bedeutung der Prinzipien guter wissenschaftlicher Praxis betont. Die Anforderungen an den Studien- und Datenmanagementprozess sollten bereits in der Erhebungsvorbereitung berücksichtigt werden, um die Dokumentation der Datenerhebung zu verbessern.

Dieser Bericht basiert auf den zum Teil ausführlicheren Stichworten der Teilnehmenden, die zumindest für einige Zeit noch unter https://t1p.de/slow2024 erreichbar sind. Die Zusammenfassung erledigte ChatGPT-4.

Digitale Tools im Studienmanagement

Nachfolgend findet sich eine Tabelle von bereits existierenden digitalen Tools, welche in der Studienmanagementpraxis genutzt werden. Bei Interesse an (der Nutzung) eines Tools/einer Praxis, können die Ansprechpartner direkt kontaktiert werden. Bei Interesse am Teilen selbstgenutzter Tools in der Tabelle, einfach einloggen und den Beitrag bearbeiten :).

Nr. Bereich Name Kurze Beschreibung Ansprechpartner
1 Instrumente
Datenbanken
R-Skript Der Skript ermöglicht das Einlesen von Programmiervorlagen in Word und eine automatische Erstellung einer Excel-Datenbank. Jan Marquardt | GESIS/GLES
2 Instrumente   Erstellung von Befragungen anhand eines Online-Tools aus einer existierenden Datenbank mit der Option verschiedene Ausgabemodi (PAPI, CAWI) zu generieren. Daniel Bela | LIfBi – Surveytechnologie
3 Feldmonitoring R-Shiny Selbst gebautes Dashboard zum Monitoring der Feldverläufe anhand eingehender Reportings. Christiane Diestler | IAB/OPAL
4 Feldmonitoring Grafana Mit Hilfe von Grafana entwickeltes Dashboard zum Live-Monitoring von Entwicklung von CAWI-Feldern. Simon Dickopf | LIfBi – Surveytechnologie
5 Studienmanagement Redmine Ticket-System für Zusammenarbeit von Teams – besonders geeignet bei gemeinsamer Softwareentwicklung und Wissensmanagement via Wiki Magdalena Hecher | SHARE Berlin
6 Studienmanagement
Datenbank
LIfBi Study Manager Im Haus programmierte Software mit Übersicht über Projektteams, Studiendesigns und einem Direktzugriff auf Dokumente, Instrumente etc. Lea Rauh & Nils Lerch | LIfBi – Erhebungskoordination
7 Studienmanagement
Zeitplanung
LIfBi Study Manager Im Haus programmierters Tool mit zwei Funktionen: (a) Zeitplanung einer konkreten Teilstudie und (b) “Monitoring Workload”: aktuersbezogener Überblick über anstehende Aufgaben, in allen Projekten/Studien und in selbst ausgewähltem Zeithorizont. Lea Rauh & Nils Lerch | LIfBi – Erhebungskoordination
 

Offene Stelle für Survey Researcher bei SHARE

Wir suchen bei SHARE ein/e/n Survey Reseacher um uns beim NIMLAS/NIH-geförderten Projekt Investigating Consent Rates for Linking Survey and Administrative Data in a Multilingual, Multinational, and Multicultural Context” (SHARE-CoRaL) zu unterstützen. Die volle Stellenausschreibung findet Ihr hier.

Treffens des Hands-on-Datenpersonals an den Leibniz-Einrichtungen

Der Sprecher:innenkreis des AK Forschungsdaten lädt herzlich zum virtuellen Treffen aller an Einrichtungen der Leibniz-Gemeinschaft aktiv an der Umsetzung des Forschungsdatenmanagement beteiligten Personen am 15. Mai 2024 ein.

In der Annahme, dass sich die technischen, administrativen als auch motivationsbedingten Herausforderungen in der alltäglichen Arbeit im Bereich FDM ähneln, möchte der AK den unmittelbaren Austausch von Erfahrungen und Best Practices aus dem Arbeitsalltag des beschriebenen FDM-Personals mit Wissenschaftler:innen und ihren Daten innerhalb der Leibniz-Gemeinschaft unterstützen.

Um bei der Planung die Bedarfe, Interessen und Probleme der Kolleg:innen zu berücksichtigen, sind alle herzlichen eingeladen, im Vorfeld Themen zu benennen, zu denen Austausch gewünscht wird. Unter https://umfrage.leibniz-gemeinschaft.de/index.php/634233?lang=de können Interessierte sowohl die Themen benennen als auch einen Hinweis zu ihren Sprachkompetenzen hinterlassen. Um für alle zugänglich zu sein, planen wir die Veranstaltung ggf. zweisprachig oder durchgängig auf Englisch.

Interessierte werden um Rückmeldung bis zum 1. Mai 2024 gebeten. Anschließend wird das Programm fertig gestellt und mit dem Programmversand die Möglichkeit zur Anmeldung eröffnet.

Der Sprecher:innenkreis freut sich auf den Austausch und auf die Gelegenheit auch jene Kolleg:innen kennenzulernen, die nicht im AK aktiv sind.

SLOW 2024: Anmeldung läuft (15.04. bis 17.04.2024), Details zum Programm

Wir freuen uns, zum diesjährigen SLOW am Zentrum für Studienmanagement des Leibniz-Instituts für Bildungsverläufe (LIfBi) einladen zu dürfen. Wir starten am Montag, 15.04.2024, um 13.30 Uhr im LIfBi (Wilhelmsplatz 3, 96047 Bamberg) wie gewohnt thematisch offen, um uns gemeinsam inhaltliche Schwerpunkte für die Sessions der folgenden Tage zu erarbeiten. Für den Abschluss am Mittwoch möchten wir gern eine Anregung der vergangenen Jahre aufgreifen und die Ergebnissicherung, den Austausch über eventuelle Follow-ups, etc. in den Mittelpunkt stellen.

Neu in diesem Jahr: Wir stellen dem SLOW einen fokussierten thematischen Austausch unter dem Motto „Digitales Studienmanagement: Tools und Praktiken“ voran (im Sinne einer Pre-Session). Wir würden dort gern mit allen Interessierten in einen dezidierten Austausch zu diesem Aspekt des gesamten Survey Life Cycle kommen (detailliertere Informationen auf der Website zum SLOW). Dafür laden wir herzlich zu diesem Teil am ersten Tag (15.04.2024) bereits ab 9.00 Uhr am LIfBi ein.

Das Wichtigste zum Schluss: Die Anmeldeseite zum SLOW 2024 ist jetzt online! Registriert euch gern so schnell wie möglich, damit wir einen Überblick darüber bekommen, wie groß der Andrang sein wird.

Viele Grüße
Bela (für das Orga-Team)