Basic Track

Come by & experience big data!

Der Basic Track richtet sich an Gymnasiasten. In dem Datenanalyse-Wettbewerb der Cognitive Systems Lab (CSL), Zentrum für angewandte Raumfahrttechnologie und Mikrogravitation (ZARM) und dem Fraunhofer-Institut für digitale Medizin (MEVIS) der Universität Bremen messen sich Teilnehmende um Preisgelder bis 1.500 Euro, und attraktive Sachpreise.

Schedule

News

2025 Results and Event 

Preisverleihung des Basic Track der Bremen Big Data Challenge 2025 zeichnet junge Programmiertalente aus. Mehr lesen

MEVIS-Track Challenge

Coming Soon….

Submission Deadlines:

Aufgabenstellung

  1. Load the data from the CSV file and analyze it. You will notice that some datasets are incomplete. However, an AI can only be trained on complete data. How do you handle missing information?
  2. Define an appropriate train/validation split.
  3. Challenge Part 1: Train a random forest model to predict whether any complication will occur after a heart attack, without differentiating the type of complication. You may use existing routines from freely available Python packages.
  4. Challenge Part 2: Train a random forest or any other freely available AI model to predict the specific complications. In this case, the model should explicitly indicate which complication(s) are likely to occur.

Challenge your AI! – Testing:

  • Save the predictions of your AI for the validation dataset as a CSV file named "Prognosen.csv." Each row should represent a patient, and each column should correspond to a specific complication. If a complication occurs, a "1" should be entered in the respective column, following the format of the provided training and test data. The first row of the CSV file should contain the column names. An example format can be found in the file "Beispiel-Ergebnisse.csv."
  • Please upload your "Prognosen.csv" file here to receive your score. The maximum score is 1.0, and the minimum is 0.0. The score indicates the percentage of patients for whom your predictions are correct.
  • Not satisfied with your result, or others are scoring higher? Then tune your AI and give it another try!

 Notes (Please Note):

  • Challenge Part 1: For the evaluation of Part 1, only the last collumn of your submitted results table will be used. Therefore, all other columns may remain empty in this case.
  • Challenge Part 2: For the evaluation of Part 2, all collumns of your submitted results table will be used. Therefore, the last column should also be filled according to your predictions.

Leaderboard Part 1

Leaderboard Part 2

Organizers

ZARM-Track Challenge

Sending humans to Mars and exploring our red neighboring planet has long been a dream of space exploration. However, Mars differs from Earth in many ways. The lack of atmosphere, absence of liquid water, and high radiation levels currently make it impossible to send a crew on such a journey. Instead, Mars rovers are used, but even they face numerous challenges on the Martian surface, with no direct intervention possible from Earth. When the first humans step onto Mars in a few years, additional difficulties will arise. One of these is the scarcity of resources, which must be brought from Earth and carefully utilized and recycled on Mars.

Um dieser Bandbereite an Problemstellungen einer Marsmission (mit Menschen oder ohne) gerecht zu werden, bietet das ZARM für die Challenge 2026 zwei Aufgaben an.

Submission Deadlines:

  • Finaler Parkour: –
  • Finaler Labortest: –
  • Finale Abgabe für beide Aufgaben: –

Aufgabenstellung

Task 1 – Stress on Mars:

  • Using a CAD program, design a small rover (maximum dimensions of 30 cm in length, width, and height) capable of completing the following tasks:
    • Navigate slopes of 5%, 10%, and 15%, both ascending and descending
    • Drive despite headwinds and crosswinds
    • Drive on smooth surfaces, sand, and gravel
    • Drive while carrying a load of 100g, 300g, and 500g
    Als Antrieb erhaltet ihr zum Kick Off die Motoren und den Brick von Lego Spike Prime. Dokumentiert euren Arbeitsprozess und stellt dar wie ihr bei der Lösungsfindung vorgegangen seid.
  • Task 2 – Life Support System:

  • Build a water recycling system capable of purifying a liquid provided by ZARM as effectively as possible, making it reusable.
    • Create a project outline. Identify the types of contaminants in the water. How can these be removed? In what sequence should the recycling process occur? What materials do we need?
    • Conduct initial tests at home or at school and create a list of all required materials. Send this list by November 17, 2024, to Challenge@zarm.uni-bremen.de. The material list should include all items, materials, and chemicals you need.
    • Build the recycling system together with ZARM in the lab and test your idea.
    • Document your work process and outline how you approached finding the solution.
  • ZARM – Track Leaderboard

    Place
    1
    2
    3
    >3





    Organizers

    CSL-Track Challenge

    Der Alltag wird immer stärker durch digitale Technologien geprägt, und tragbare Geräte wie Smartwatches nehmen dabei eine zentrale Rolle ein. Sie begleiten uns unauffällig, erfassen jedoch kontinuierlich eine Vielzahl von Daten über unsere Aktivität und unseren körperlichen Zustand. Herzfrequenz, Bewegungsmuster und andere Biosignale liefern wertvolle Einblicke, doch ihre wahre Bedeutung entfaltet sich erst durch eine gezielte Analyse.

    Gerade bei großen Datenmengen, wie sie moderne Sensoren erfassen, stößt die menschliche Beobachtung schnell an ihre Grenzen. Rohdaten in Millionenzeilen-Format lassen sich nicht mehr mit bloßem Auge oder einfachen Methoden auswerten. Um Muster zu erkennen, Zusammenhänge zu verstehen und verlässliche Vorhersagen zu treffen, braucht es spezialisierte Verfahren der Datenanalyse und des maschinellen Lernens.

    Im Rahmen der Bremen Big Data Challenge 2026 steht genau eine solche Aufgabe im Fokus: die Klassifikation von Emotionen anhand von Biosignalen. Die hierfür bereitgestellten Daten wurden mit Smartwatches auf verschiedenen Jobmessen erfasst. Neben Beschleunigungsdaten auf den drei Achsen (X, Y, Z) liefern Photo-Plethysmographie-Sensoren (PPG) Messwerte, aus denen bereits Herzrate und „inter beat intervals“ (IBI) berechnet wurden. Zusätzlich wurden zu bestimmten Zeitpunkten die Emotionen der Teilnehmenden direkt abgefragt.

    Die Challenge besteht darin, für über 48 Proband:innen auf Basis der vorhandenen Biosignale Emotionen HAPPY, RELAXED, ANGRY und SAD vorherzusagen.

    Fristen

    • Trainings- und Testdaten werden zum  verschickt.
    • Leaderboard submissions are possible from January 15, 2025, to February 21, 2025. A total of 3 submissions are available per week.  möglich.
    • Pro Woche stehen insgesamt 3 Einreichungsversuche zur Verfügung.

    Aufgabenstellung

    Die Herausforderung besteht darin, Emotionen auf Basis von Biosignalen zu klassifizieren, die mit Smartwatches erfasst wurden. Dafür erhalten alle Teilnehmer:innen einen Trainings- sowie einen Testdatensatz. Zur Bearbeitung dieser Aufgabe wird von dir lediglich eine beliebige Python-Entwicklungsumgebung vorausgesetzt.

    • Lies dir die mitgelieferte Challenge-Beschreibung sorgfältig durch, bevor du mit der Bearbeitung der Aufgabe beginnst.

    • Konzentriere dich zunächst auf die Datenstruktur der Trainingsdaten:

      • Welche Merkmale enthält der Datensatz?

      • Welche Bedeutung haben die einzelnen Merkmale?

    • Bereite den Trainingsdatensatz für deine gewählte Klassifikationsstrategie vor. Die Art der Datenaufbereitung kann sich je nach Klassifikationsmethode unterscheiden. Informiere dich deshalb über deine gewählte Methode:

      • Welche Datenstruktur setzt sie voraus?

      • Gibt es Einschränkungen, die die Leistung der Klassifikation negativ beeinflussen könnten?

    • Implementiere anschließend deine Klassifikationsmethode und führe ein Training auf den vorbereiteten Daten durch. Ein gutes Modell zeichnet sich nicht nur durch eine hohe Accuracy aus. Informiere dich deshalb über geeignete Evaluationsmethoden, um sicherzustellen, dass deine Ergebnisse nicht auf Zufall beruhen.

    • Anschließend bearbeitest du die Testdaten. Diese enthalten Zeitpunkte, an denen ursprünglich Emotionsmessungen durchgeführt wurden, die jedoch aus dem Datensatz entfernt wurden. Nutze für alle Zeitpunkte in den Testdaten die entsprechenden Informationen aus den Trainingsdaten, um die Emotionen zu klassifizieren.

    • Füge alle Testdaten (bestehend aus sessionId, timestamp, affect) in eine .csv-Datei ein und achte darauf, die ursprüngliche Reihenfolge beizubehalten. Lade deinen Testdatensatz mit den vorhergesagten Emotionen im BBDC Submission Portal im Track CSL hoch. Hierfür ist eine einmalige Registrierung erforderlich. Melde dich mit deinen festgelegten Zugangsdaten an und lade die vorbereitete Datei hoch.

    • Zum Abschluss der Challenge sende bitte deinen Code sowie die Datensätze als .zip-Datei an folgende Adresse: belousov@uni-bremen.de.

    Hinweise

    • Nimm dir ausreichend Zeit, um die vorliegenden Daten zu verstehen. Informiere dich hierfür zum Beispiel im Internet oder in Bibliotheken über bewährte Praktiken im Umgang mit großen Datenmengen. Achte auch auf die Verwendbarkeit deiner Daten(-punkte) und nutze nur solche, die tatsächlich aussagekräftig sind.

    • Nutze Visualisierungstools wie Diagramme, um sinnvolle Erkenntnisse zu gewinnen. Bewährte Python-Bibliotheken hierfür sind z. B. Matplotlib oder Plotly.

    • Eine gute Dokumentation deiner Arbeit, besonders für Anfänger:innen,  erleichtert es später, den geschriebenen Code und die gewählten Schritte nachzuvollziehen. Schreibe daher zu jedem Schritt ein paar erklärende Sätze, damit du ihn auch später noch nachvollziehen kannst.

    Bitte Beachten:

    • Achte darauf, dass die Labels (HAPPY, RELAXED, ANGRY, SAD) in genau diesem Format im endgültigen Datensatz vorliegen. Achte außerdem darauf, dass die geforderten Spalten in ihrer ursprünglichen Reihenfolge enthalten sind.

    • Der Zweck des Wettbewerbs besteht darin, zu erlernen, wie Computer mithilfe von künstlicher Intelligenz große Datenmengen verarbeiten können. Die geforderten Emotionen (Labels) müssen daher von der von dir gewählten KI generiert werden. Alle Schritte zur Generierung sollten im eingereichten Code nachvollziehbar sein. Ergebnisse, die nicht mithilfe eines Computers erzeugt wurden, werden grundsätzlich nicht akzeptiert. Sollte ersichtlich sein, dass der eingereichte Code nicht zum angegebenen Ergebnis führen kann oder gar kein Code bereitgestellt wurde, behalten wir uns das Recht vor, das Ergebnis sowie die Platzierung aus der Wertung zu entfernen.

    Leaderboard: BBDC Basic CSL-Track​

    Sub-Heading