Was hör ich da? Audio event detection

Die Challenge

Daten

Die Datenbank besteht aus Audioaufnahmen, von denen jede zehn Sekunden lang ist. Jede Audiodatei enthält zwischen zwei und vier akustische Ereignisse, die sich nicht überlappen. Zudem sind verschiedene Hintergrundgeräusche in den Aufnahmen vorhanden. Die möglichen akustischen Ereignisse (Klassen) umfassen unter anderem: Shatter, Bark, Doorbell, Shout, Cough, Camera, Church_bell, Scratching (performance technique), Fireworks, Burping and eructation, Meow und Cheering.

Für jede Audiodatei existiert eine Annotationsdatei, die die genauen Start- und Endzeitpunkte der Ereignisse sowie deren jeweilige Klassen enthält. Insgesamt umfasst der Datensatz etwa 36 Stunden Audiomaterial, wovon 28 Stunden für das Training und 8 Stunden für Testzwecke vorgesehen sind.

Aufgabe

Die Aufgabe besteht in der Erkennung akustischer Ereignisse, wie beispielsweise dem Miauen einer Katze oder dem Läuten einer Glocke, sowie in der genauen Bestimmung ihrer jeweiligen Start- und Endzeitpunkte.

Ergebnis

Student Track

Rank	Score	Team Name	Member Name(s)
🥇1	0.6890	Error040	Lennart Heinbokel
🥈2	0.5978	L’audio_locaï	Andreas Baude, Jonas Klaff, Timo Urban
🥉3	0.4570	import teamName	Akira Janssen
4	0.4159	when_life_gives_you_data	Max Gaber, Jannes Adam, Alexander Jochim
5	0.3923	Atropos	Hannes Raith