Die Datenbank besteht aus Audioaufnahmen, von denen jede zehn Sekunden lang ist. Jede Audiodatei enthält zwischen zwei und vier akustische Ereignisse, die sich nicht überlappen. Zudem sind verschiedene Hintergrundgeräusche in den Aufnahmen vorhanden. Die möglichen akustischen Ereignisse (Klassen) umfassen unter anderem: Shatter, Bark, Doorbell, Shout, Cough, Camera, Church_bell, Scratching (performance technique), Fireworks, Burping and eructation, Meow und Cheering.
Für jede Audiodatei existiert eine Annotationsdatei, die die genauen Start- und Endzeitpunkte der Ereignisse sowie deren jeweilige Klassen enthält. Insgesamt umfasst der Datensatz etwa 36 Stunden Audiomaterial, wovon 28 Stunden für das Training und 8 Stunden für Testzwecke vorgesehen sind.






Die Aufgabe besteht in der Erkennung akustischer Ereignisse, wie beispielsweise dem Miauen einer Katze oder dem Läuten einer Glocke, sowie in der genauen Bestimmung ihrer jeweiligen Start- und Endzeitpunkte.
| Rank | Score | Team Name | Member Name(s) |
|---|---|---|---|
| 🥇1 | 0.6890 | Error040 | Lennart Heinbokel |
| 🥈2 | 0.5978 | L’audio_locaï | Andreas Baude, Jonas Klaff, Timo Urban |
| 🥉3 | 0.4570 | import teamName | Akira Janssen |
| 4 | 0.4159 | when_life_gives_you_data | Max Gaber, Jannes Adam, Alexander Jochim |
| 5 | 0.3923 | Atropos | Hannes Raith |