Was hör ich da? Audio event detection

Die Challenge

Daten

Die Datenbank besteht aus Audioaufnahmen, von denen jede zehn Sekunden lang ist. Jede Audiodatei enthält zwischen zwei und vier akustische Ereignisse, die sich nicht überlappen. Zudem sind verschiedene Hintergrundgeräusche in den Aufnahmen vorhanden. Die möglichen akustischen Ereignisse (Klassen) umfassen unter anderem: Shatter, Bark, Doorbell, Shout, Cough, Camera, Church_bell, Scratching (performance technique), Fireworks, Burping and eructation, Meow und Cheering.

Für jede Audiodatei existiert eine Annotationsdatei, die die genauen Start- und Endzeitpunkte der Ereignisse sowie deren jeweilige Klassen enthält. Insgesamt umfasst der Datensatz etwa 36 Stunden Audiomaterial, wovon 28 Stunden für das Training und 8 Stunden für Testzwecke vorgesehen sind.

Aufgabe

Die Aufgabe besteht in der Erkennung akustischer Ereignisse, wie beispielsweise dem Miauen einer Katze oder dem Läuten einer Glocke, sowie in der genauen Bestimmung ihrer jeweiligen Start- und Endzeitpunkte.

Ergebnis

Student Track

Rank Score Team Name Member Name(s)
🥇1 0.6890 Error040 Lennart Heinbokel
🥈2 0.5978 L’audio_locaï Andreas Baude, Jonas Klaff, Timo Urban
🥉3 0.4570 import teamName Akira Janssen
4 0.4159 when_life_gives_you_data Max Gaber, Jannes Adam, Alexander Jochim
5 0.3923 Atropos Hannes Raith