Basic Track

Kommen Sie vorbei & erleben Sie Big Data!

Der Basic Track richtet sich an Gymnasiasten. In dem Datenanalyse-Wettbewerb der Cognitive Systems Lab (CSL), Zentrum für angewandte Raumfahrttechnologie und Mikrogravitation (ZARM) und dem Fraunhofer-Institut für digitale Medizin (MEVIS) der Universität Bremen messen sich Teilnehmende um Preisgelder bis 1.500 Euro, und attraktive Sachpreise.

Ablauf

Neues

2025 Results and Event 

Preisverleihung des Basic Track der Bremen Big Data Challenge 2025 zeichnet junge Programmiertalente aus. Mehr lesen

MEVIS-Track Challenge

Coming Soon….

Abgabefristen

Aufgabenstellung

  1. Lade die Daten aus der csv.-Datei und analysiere diese. Dabei wird dir auffallen, dass einige Datensätze unvollständig sind. Eine KI kann aber nur auf vollständigen Daten trainiert werden. Wie gehst du mit fehlenden Informationen um
  2. Definiere einen geeigneten Train/Validation Split.
  3. Challenge Part 1: Trainiere einen Zufallswald (random forest) zur Vorhersage, ob irgendeine Komplikation nach dem Herzinfarkt auftreten wird. Dabei soll noch nicht unterschieden werden, welche Komplikation das ist. Du darfst dabei bestehende Routinen aus frei verfügbaren python-Packages verwenden.
  4. Challenge Part 2:Trainiere einen Zufallswald (random forest) oder ein beliebiges anders frei verfügbares KI-Modell zur Vorhersage der verschiedenen Komplikationen. Hierbei soll nun explizit ausgegeben werden, welche Komplikation oder Komplikationen auftreten.

Challenge deine KI ! – Das Testen:​

  • Datei unter dem Namen „Prognosen.csv“. Dabei soll jede Zeile für einen Patienten/eine Patientin und die Spalten für eine bestimmte Komplikation stehen. Tritt eine Komplikation auf, soll in der entsprechenden Spalte eine 1 eingetragen werden, analog zu den gegebenen Trainings- und Testdaten. Die erste Zeile der csv.-Datei soll die Spaltennamen enthalten. Ein Beispiel ist in der Datei „Beispiel-Ergebnisse.csv“ zu finden.
  • Lade deine Datei „Prognosen.csv“ hier hoch und bekomme deinen Score. Der maximale Score liegt bei 1.0, das Minimum bei 0.0. Er gibt prozentual an, für wie viele der Patient:innen deine Prognose richtig ist.
  • Du bist nicht zufrieden mit deinem Ergebnis oder andere sind noch besser? Dann tune deine KI und versuche es erneut!

 Hinweise (Bitte Beachten):

  • Challenge Part 1: Zur Auswertung von Part 1 wird lediglich die letzte Spalte deiner eingereichten Ergebnistabelle verwendet. Alle anderen Spalten dürfen hier also leer bleiben.
  • Challenge Part 2: Zur Auswertung von Part 2 werden alle Spalten deiner eingereichten Ergebnistabelle verwendet. Die letzte Spalte ist hier also auch entsprechend eurer Vorhersagen auszufüllen.

Leaderboard Part 1

Leaderboard Part 2

Organizers

ZARM-Track Challenge

Menschen auf den Mars zu schicken und unseren roten Nachbarplaneten zu erkunden ist ein lang gehegter Traum der Raumfahrt. Der Mars unterscheidet sich aber in vielerlei Hinsicht von unserer Erde. Die fehlende Atmosphäre, kein flüssiges Wasser und eine hohe Strahlenbelastung machen es aktuell noch unmöglich eine Crew auf die Reise zu schicken. Daher nutzt man Marsrover, aber auch die stehen auf der Marsoberfläche ohne direkte Eingriffsmöglichkeiten von der Erde vor zahlreichen Herausforderungen. Wenn in einigen Jahren die ersten Menschen den Mars betreten kommen weitere Schwierigkeiten hinzu. Eine davon sind viele fehlenden Ressourcen, die von der Erde mitgebracht und sorgfältig auf dem Mars genutzt und recycelt werden müssen.

Um dieser Bandbereite an Problemstellungen einer Marsmission (mit Menschen oder ohne) gerecht zu werden, bietet das ZARM für die Challenge 2026 zwei Aufgaben an.

Abgabefristen

  • Finaler Parkour: –
  • Finaler Labortest: –
  • Finale Abgabe für beide Aufgaben: –

Aufgabenstellung

Aufgabe 1 – Stressstress Mars:

  • Konstruiert mittels eines CAD Programms einen kleinen Rover (max. 30cm lang/breit/hoch) der in der Lage ist folgende Aufgaben zu bewältigen
    • Bewältigen einer Steigung von 5%, 10% und 15% sowohl hoch als auch runter
    • Fahren trotz Gegen- und Seitenwind
    • Fahren auf glattem Boden, Sand und Kies
    • Fahren mit einer Ladung (100g, 300g und 500g)
    Als Antrieb erhaltet ihr zum Kick Off die Motoren und den Brick von Lego Spike Prime. Dokumentiert euren Arbeitsprozess und stellt dar wie ihr bei der Lösungsfindung vorgegangen seid.
  • Aufgabe 2 – Lebenserhaltungssystem:

  • Baut ein Wasserrecyclingsystem, was in der Lage ist eine vom ZARM vorgegebene Flüssigkeit so gut wie möglich zu reinigen und wieder nutzbar zu machen.
    • Erstellt eine Projektskizze. Was für Verschmutzungen sind im Wasser? Wie kann man diese entfernen? In welcher Reihenfolge sollte das Recycling stattfinden? Was brauchen wir für Materialien?
    • Macht erste Tests zuhause oder in der Schule und erstellt eine Materialliste mit allem was ihr braucht. Schickt diese bis zum 17.11.2024 an Challenge@zarm.uni-bremen.de. Die Materialliste sollte alle Gegenstände, Materialien und Chemikalien enthalten, die ihr benötigt.
    • Baut das Recyclingsystem gemeinsam mit dem ZARM im Labor auf und testet eure Idee aus.
    • Dokumentiert euren Arbeitsprozess und stellt dar wie ihr bei der Lösungsfindung vorgegangen seid.
  • ZARM – Track Leaderboard

    Platz
    1
    2
    3
    >3





    Organizers

    CSL-Track Challenge

    Der Alltag wird immer stärker durch digitale Technologien geprägt, und tragbare Geräte wie Smartwatches nehmen dabei eine zentrale Rolle ein. Sie begleiten uns unauffällig, erfassen jedoch kontinuierlich eine Vielzahl von Daten über unsere Aktivität und unseren körperlichen Zustand. Herzfrequenz, Bewegungsmuster und andere Biosignale liefern wertvolle Einblicke, doch ihre wahre Bedeutung entfaltet sich erst durch eine gezielte Analyse.

    Gerade bei großen Datenmengen, wie sie moderne Sensoren erfassen, stößt die menschliche Beobachtung schnell an ihre Grenzen. Rohdaten in Millionenzeilen-Format lassen sich nicht mehr mit bloßem Auge oder einfachen Methoden auswerten. Um Muster zu erkennen, Zusammenhänge zu verstehen und verlässliche Vorhersagen zu treffen, braucht es spezialisierte Verfahren der Datenanalyse und des maschinellen Lernens.

    Im Rahmen der Bremen Big Data Challenge 2026 steht genau eine solche Aufgabe im Fokus: die Klassifikation von Emotionen anhand von Biosignalen. Die hierfür bereitgestellten Daten wurden mit Smartwatches auf verschiedenen Jobmessen erfasst. Neben Beschleunigungsdaten auf den drei Achsen (X, Y, Z) liefern Photo-Plethysmographie-Sensoren (PPG) Messwerte, aus denen bereits Herzrate und „inter beat intervals“ (IBI) berechnet wurden. Zusätzlich wurden zu bestimmten Zeitpunkten die Emotionen der Teilnehmenden direkt abgefragt.

    Die Challenge besteht darin, für über 48 Proband:innen auf Basis der vorhandenen Biosignale Emotionen HAPPY, RELAXED, ANGRY und SAD vorherzusagen.

    Fristen

    • Trainings- und Testdaten werden zum  verschickt.
    • Leaderboard Einreichung von  möglich.
    • Pro Woche stehen insgesamt 3 Einreichungsversuche zur Verfügung.

    Aufgabenstellung

    Die Herausforderung besteht darin, Emotionen auf Basis von Biosignalen zu klassifizieren, die mit Smartwatches erfasst wurden. Dafür erhalten alle Teilnehmer:innen einen Trainings- sowie einen Testdatensatz. Zur Bearbeitung dieser Aufgabe wird von dir lediglich eine beliebige Python-Entwicklungsumgebung vorausgesetzt.

    • Lies dir die mitgelieferte Challenge-Beschreibung sorgfältig durch, bevor du mit der Bearbeitung der Aufgabe beginnst.

    • Konzentriere dich zunächst auf die Datenstruktur der Trainingsdaten:

      • Welche Merkmale enthält der Datensatz?

      • Welche Bedeutung haben die einzelnen Merkmale?

    • Bereite den Trainingsdatensatz für deine gewählte Klassifikationsstrategie vor. Die Art der Datenaufbereitung kann sich je nach Klassifikationsmethode unterscheiden. Informiere dich deshalb über deine gewählte Methode:

      • Welche Datenstruktur setzt sie voraus?

      • Gibt es Einschränkungen, die die Leistung der Klassifikation negativ beeinflussen könnten?

    • Implementiere anschließend deine Klassifikationsmethode und führe ein Training auf den vorbereiteten Daten durch. Ein gutes Modell zeichnet sich nicht nur durch eine hohe Accuracy aus. Informiere dich deshalb über geeignete Evaluationsmethoden, um sicherzustellen, dass deine Ergebnisse nicht auf Zufall beruhen.

    • Anschließend bearbeitest du die Testdaten. Diese enthalten Zeitpunkte, an denen ursprünglich Emotionsmessungen durchgeführt wurden, die jedoch aus dem Datensatz entfernt wurden. Nutze für alle Zeitpunkte in den Testdaten die entsprechenden Informationen aus den Trainingsdaten, um die Emotionen zu klassifizieren.

    • Füge alle Testdaten (bestehend aus sessionId, timestamp, affect) in eine .csv-Datei ein und achte darauf, die ursprüngliche Reihenfolge beizubehalten. Lade deinen Testdatensatz mit den vorhergesagten Emotionen im BBDC Submission Portal im Track CSL hoch. Hierfür ist eine einmalige Registrierung erforderlich. Melde dich mit deinen festgelegten Zugangsdaten an und lade die vorbereitete Datei hoch.

    • Zum Abschluss der Challenge sende bitte deinen Code sowie die Datensätze als .zip-Datei an folgende Adresse: belousov@uni-bremen.de.

    Hinweise

    • Nimm dir ausreichend Zeit, um die vorliegenden Daten zu verstehen. Informiere dich hierfür zum Beispiel im Internet oder in Bibliotheken über bewährte Praktiken im Umgang mit großen Datenmengen. Achte auch auf die Verwendbarkeit deiner Daten(-punkte) und nutze nur solche, die tatsächlich aussagekräftig sind.

    • Nutze Visualisierungstools wie Diagramme, um sinnvolle Erkenntnisse zu gewinnen. Bewährte Python-Bibliotheken hierfür sind z. B. Matplotlib oder Plotly.

    • Eine gute Dokumentation deiner Arbeit, besonders für Anfänger:innen,  erleichtert es später, den geschriebenen Code und die gewählten Schritte nachzuvollziehen. Schreibe daher zu jedem Schritt ein paar erklärende Sätze, damit du ihn auch später noch nachvollziehen kannst.

    Bitte Beachten:

    • Achte darauf, dass die Labels (HAPPY, RELAXED, ANGRY, SAD) in genau diesem Format im endgültigen Datensatz vorliegen. Achte außerdem darauf, dass die geforderten Spalten in ihrer ursprünglichen Reihenfolge enthalten sind.

    • Der Zweck des Wettbewerbs besteht darin, zu erlernen, wie Computer mithilfe von künstlicher Intelligenz große Datenmengen verarbeiten können. Die geforderten Emotionen (Labels) müssen daher von der von dir gewählten KI generiert werden. Alle Schritte zur Generierung sollten im eingereichten Code nachvollziehbar sein. Ergebnisse, die nicht mithilfe eines Computers erzeugt wurden, werden grundsätzlich nicht akzeptiert. Sollte ersichtlich sein, dass der eingereichte Code nicht zum angegebenen Ergebnis führen kann oder gar kein Code bereitgestellt wurde, behalten wir uns das Recht vor, das Ergebnis sowie die Platzierung aus der Wertung zu entfernen.

    Leaderboard: BBDC Basic CSL-Track​

    Sub-Heading