Preisverleihung des Basic Track der Bremen Big Data Challenge 2025 zeichnet junge Programmiertalente aus. Mehr lesen
Coming Soon….
Menschen auf den Mars zu schicken und unseren roten Nachbarplaneten zu erkunden ist ein lang gehegter Traum der Raumfahrt. Der Mars unterscheidet sich aber in vielerlei Hinsicht von unserer Erde. Die fehlende Atmosphäre, kein flüssiges Wasser und eine hohe Strahlenbelastung machen es aktuell noch unmöglich eine Crew auf die Reise zu schicken. Daher nutzt man Marsrover, aber auch die stehen auf der Marsoberfläche ohne direkte Eingriffsmöglichkeiten von der Erde vor zahlreichen Herausforderungen. Wenn in einigen Jahren die ersten Menschen den Mars betreten kommen weitere Schwierigkeiten hinzu. Eine davon sind viele fehlenden Ressourcen, die von der Erde mitgebracht und sorgfältig auf dem Mars genutzt und recycelt werden müssen.
Um dieser Bandbereite an Problemstellungen einer Marsmission (mit Menschen oder ohne) gerecht zu werden, bietet das ZARM für die Challenge 2026 zwei Aufgaben an.
Der Alltag wird immer stärker durch digitale Technologien geprägt, und tragbare Geräte wie Smartwatches nehmen dabei eine zentrale Rolle ein. Sie begleiten uns unauffällig, erfassen jedoch kontinuierlich eine Vielzahl von Daten über unsere Aktivität und unseren körperlichen Zustand. Herzfrequenz, Bewegungsmuster und andere Biosignale liefern wertvolle Einblicke, doch ihre wahre Bedeutung entfaltet sich erst durch eine gezielte Analyse.
Gerade bei großen Datenmengen, wie sie moderne Sensoren erfassen, stößt die menschliche Beobachtung schnell an ihre Grenzen. Rohdaten in Millionenzeilen-Format lassen sich nicht mehr mit bloßem Auge oder einfachen Methoden auswerten. Um Muster zu erkennen, Zusammenhänge zu verstehen und verlässliche Vorhersagen zu treffen, braucht es spezialisierte Verfahren der Datenanalyse und des maschinellen Lernens.
Im Rahmen der Bremen Big Data Challenge 2026 steht genau eine solche Aufgabe im Fokus: die Klassifikation von Emotionen anhand von Biosignalen. Die hierfür bereitgestellten Daten wurden mit Smartwatches auf verschiedenen Jobmessen erfasst. Neben Beschleunigungsdaten auf den drei Achsen (X, Y, Z) liefern Photo-Plethysmographie-Sensoren (PPG) Messwerte, aus denen bereits Herzrate und „inter beat intervals“ (IBI) berechnet wurden. Zusätzlich wurden zu bestimmten Zeitpunkten die Emotionen der Teilnehmenden direkt abgefragt.
Die Challenge besteht darin, für über 48 Proband:innen auf Basis der vorhandenen Biosignale Emotionen HAPPY, RELAXED, ANGRY und SAD vorherzusagen.
Die Herausforderung besteht darin, Emotionen auf Basis von Biosignalen zu klassifizieren, die mit Smartwatches erfasst wurden. Dafür erhalten alle Teilnehmer:innen einen Trainings- sowie einen Testdatensatz. Zur Bearbeitung dieser Aufgabe wird von dir lediglich eine beliebige Python-Entwicklungsumgebung vorausgesetzt.
Lies dir die mitgelieferte Challenge-Beschreibung sorgfältig durch, bevor du mit der Bearbeitung der Aufgabe beginnst.
Konzentriere dich zunächst auf die Datenstruktur der Trainingsdaten:
Welche Merkmale enthält der Datensatz?
Welche Bedeutung haben die einzelnen Merkmale?
Bereite den Trainingsdatensatz für deine gewählte Klassifikationsstrategie vor. Die Art der Datenaufbereitung kann sich je nach Klassifikationsmethode unterscheiden. Informiere dich deshalb über deine gewählte Methode:
Welche Datenstruktur setzt sie voraus?
Gibt es Einschränkungen, die die Leistung der Klassifikation negativ beeinflussen könnten?
Implementiere anschließend deine Klassifikationsmethode und führe ein Training auf den vorbereiteten Daten durch. Ein gutes Modell zeichnet sich nicht nur durch eine hohe Accuracy aus. Informiere dich deshalb über geeignete Evaluationsmethoden, um sicherzustellen, dass deine Ergebnisse nicht auf Zufall beruhen.
Anschließend bearbeitest du die Testdaten. Diese enthalten Zeitpunkte, an denen ursprünglich Emotionsmessungen durchgeführt wurden, die jedoch aus dem Datensatz entfernt wurden. Nutze für alle Zeitpunkte in den Testdaten die entsprechenden Informationen aus den Trainingsdaten, um die Emotionen zu klassifizieren.
Füge alle Testdaten (bestehend aus sessionId, timestamp, affect) in eine .csv-Datei ein und achte darauf, die ursprüngliche Reihenfolge beizubehalten. Lade deinen Testdatensatz mit den vorhergesagten Emotionen im BBDC Submission Portal im Track CSL hoch. Hierfür ist eine einmalige Registrierung erforderlich. Melde dich mit deinen festgelegten Zugangsdaten an und lade die vorbereitete Datei hoch.
Nimm dir ausreichend Zeit, um die vorliegenden Daten zu verstehen. Informiere dich hierfür zum Beispiel im Internet oder in Bibliotheken über bewährte Praktiken im Umgang mit großen Datenmengen. Achte auch auf die Verwendbarkeit deiner Daten(-punkte) und nutze nur solche, die tatsächlich aussagekräftig sind.
Nutze Visualisierungstools wie Diagramme, um sinnvolle Erkenntnisse zu gewinnen. Bewährte Python-Bibliotheken hierfür sind z. B. Matplotlib oder Plotly.
Eine gute Dokumentation deiner Arbeit, besonders für Anfänger:innen, erleichtert es später, den geschriebenen Code und die gewählten Schritte nachzuvollziehen. Schreibe daher zu jedem Schritt ein paar erklärende Sätze, damit du ihn auch später noch nachvollziehen kannst.
Achte darauf, dass die Labels (HAPPY, RELAXED, ANGRY, SAD) in genau diesem Format im endgültigen Datensatz vorliegen. Achte außerdem darauf, dass die geforderten Spalten in ihrer ursprünglichen Reihenfolge enthalten sind.
Der Zweck des Wettbewerbs besteht darin, zu erlernen, wie Computer mithilfe von künstlicher Intelligenz große Datenmengen verarbeiten können. Die geforderten Emotionen (Labels) müssen daher von der von dir gewählten KI generiert werden. Alle Schritte zur Generierung sollten im eingereichten Code nachvollziehbar sein. Ergebnisse, die nicht mithilfe eines Computers erzeugt wurden, werden grundsätzlich nicht akzeptiert. Sollte ersichtlich sein, dass der eingereichte Code nicht zum angegebenen Ergebnis führen kann oder gar kein Code bereitgestellt wurde, behalten wir uns das Recht vor, das Ergebnis sowie die Platzierung aus der Wertung zu entfernen.
Coming Soon….
Menschen auf den Mars zu schicken und unseren roten Nachbarplaneten zu erkunden ist ein lang gehegter Traum der Raumfahrt. Der Mars unterscheidet sich aber in vielerlei Hinsicht von unserer Erde. Die fehlende Atmosphäre, kein flüssiges Wasser und eine hohe Strahlenbelastung machen es aktuell noch unmöglich eine Crew auf die Reise zu schicken. Daher nutzt man Marsrover, aber auch die stehen auf der Marsoberfläche ohne direkte Eingriffsmöglichkeiten von der Erde vor zahlreichen Herausforderungen. Wenn in einigen Jahren die ersten Menschen den Mars betreten kommen weitere Schwierigkeiten hinzu. Eine davon sind viele fehlenden Ressourcen, die von der Erde mitgebracht und sorgfältig auf dem Mars genutzt und recycelt werden müssen.
Um dieser Bandbereite an Problemstellungen einer Marsmission (mit Menschen oder ohne) gerecht zu werden, bietet das ZARM für die Challenge 2026 zwei Aufgaben an.
Der Alltag wird immer stärker durch digitale Technologien geprägt, und tragbare Geräte wie Smartwatches nehmen dabei eine zentrale Rolle ein. Sie begleiten uns unauffällig, erfassen jedoch kontinuierlich eine Vielzahl von Daten über unsere Aktivität und unseren körperlichen Zustand. Herzfrequenz, Bewegungsmuster und andere Biosignale liefern wertvolle Einblicke, doch ihre wahre Bedeutung entfaltet sich erst durch eine gezielte Analyse.
Gerade bei großen Datenmengen, wie sie moderne Sensoren erfassen, stößt die menschliche Beobachtung schnell an ihre Grenzen. Rohdaten in Millionenzeilen-Format lassen sich nicht mehr mit bloßem Auge oder einfachen Methoden auswerten. Um Muster zu erkennen, Zusammenhänge zu verstehen und verlässliche Vorhersagen zu treffen, braucht es spezialisierte Verfahren der Datenanalyse und des maschinellen Lernens.
Im Rahmen der Bremen Big Data Challenge 2026 steht genau eine solche Aufgabe im Fokus: die Klassifikation von Emotionen anhand von Biosignalen. Die hierfür bereitgestellten Daten wurden mit Smartwatches auf verschiedenen Jobmessen erfasst. Neben Beschleunigungsdaten auf den drei Achsen (X, Y, Z) liefern Photo-Plethysmographie-Sensoren (PPG) Messwerte, aus denen bereits Herzrate und „inter beat intervals“ (IBI) berechnet wurden. Zusätzlich wurden zu bestimmten Zeitpunkten die Emotionen der Teilnehmenden direkt abgefragt.
Die Challenge besteht darin, für über 48 Proband:innen auf Basis der vorhandenen Biosignale Emotionen HAPPY, RELAXED, ANGRY und SAD vorherzusagen.
Die Herausforderung besteht darin, Emotionen auf Basis von Biosignalen zu klassifizieren, die mit Smartwatches erfasst wurden. Dafür erhalten alle Teilnehmer:innen einen Trainings- sowie einen Testdatensatz. Zur Bearbeitung dieser Aufgabe wird von dir lediglich eine beliebige Python-Entwicklungsumgebung vorausgesetzt.
Lies dir die mitgelieferte Challenge-Beschreibung sorgfältig durch, bevor du mit der Bearbeitung der Aufgabe beginnst.
Konzentriere dich zunächst auf die Datenstruktur der Trainingsdaten:
Welche Merkmale enthält der Datensatz?
Welche Bedeutung haben die einzelnen Merkmale?
Bereite den Trainingsdatensatz für deine gewählte Klassifikationsstrategie vor. Die Art der Datenaufbereitung kann sich je nach Klassifikationsmethode unterscheiden. Informiere dich deshalb über deine gewählte Methode:
Welche Datenstruktur setzt sie voraus?
Gibt es Einschränkungen, die die Leistung der Klassifikation negativ beeinflussen könnten?
Implementiere anschließend deine Klassifikationsmethode und führe ein Training auf den vorbereiteten Daten durch. Ein gutes Modell zeichnet sich nicht nur durch eine hohe Accuracy aus. Informiere dich deshalb über geeignete Evaluationsmethoden, um sicherzustellen, dass deine Ergebnisse nicht auf Zufall beruhen.
Anschließend bearbeitest du die Testdaten. Diese enthalten Zeitpunkte, an denen ursprünglich Emotionsmessungen durchgeführt wurden, die jedoch aus dem Datensatz entfernt wurden. Nutze für alle Zeitpunkte in den Testdaten die entsprechenden Informationen aus den Trainingsdaten, um die Emotionen zu klassifizieren.
Füge alle Testdaten (bestehend aus sessionId, timestamp, affect) in eine .csv-Datei ein und achte darauf, die ursprüngliche Reihenfolge beizubehalten. Lade deinen Testdatensatz mit den vorhergesagten Emotionen im BBDC Submission Portal im Track CSL hoch. Hierfür ist eine einmalige Registrierung erforderlich. Melde dich mit deinen festgelegten Zugangsdaten an und lade die vorbereitete Datei hoch.
Nimm dir ausreichend Zeit, um die vorliegenden Daten zu verstehen. Informiere dich hierfür zum Beispiel im Internet oder in Bibliotheken über bewährte Praktiken im Umgang mit großen Datenmengen. Achte auch auf die Verwendbarkeit deiner Daten(-punkte) und nutze nur solche, die tatsächlich aussagekräftig sind.
Nutze Visualisierungstools wie Diagramme, um sinnvolle Erkenntnisse zu gewinnen. Bewährte Python-Bibliotheken hierfür sind z. B. Matplotlib oder Plotly.
Eine gute Dokumentation deiner Arbeit, besonders für Anfänger:innen, erleichtert es später, den geschriebenen Code und die gewählten Schritte nachzuvollziehen. Schreibe daher zu jedem Schritt ein paar erklärende Sätze, damit du ihn auch später noch nachvollziehen kannst.
Achte darauf, dass die Labels (HAPPY, RELAXED, ANGRY, SAD) in genau diesem Format im endgültigen Datensatz vorliegen. Achte außerdem darauf, dass die geforderten Spalten in ihrer ursprünglichen Reihenfolge enthalten sind.
Der Zweck des Wettbewerbs besteht darin, zu erlernen, wie Computer mithilfe von künstlicher Intelligenz große Datenmengen verarbeiten können. Die geforderten Emotionen (Labels) müssen daher von der von dir gewählten KI generiert werden. Alle Schritte zur Generierung sollten im eingereichten Code nachvollziehbar sein. Ergebnisse, die nicht mithilfe eines Computers erzeugt wurden, werden grundsätzlich nicht akzeptiert. Sollte ersichtlich sein, dass der eingereichte Code nicht zum angegebenen Ergebnis führen kann oder gar kein Code bereitgestellt wurde, behalten wir uns das Recht vor, das Ergebnis sowie die Platzierung aus der Wertung zu entfernen.