EPFL gegen Cambridge gegen MIT

Das Rennen um die Corona-Diagnose via Smartphone

Uhr
von Rodolphe Koller und Übersetzt von Fabian Kindle

An der EPFL, der Universität Cambridge und dem MIT arbeiten Forscher an der Entwicklung von Algorithmen zur Diagnose von Covid-19-infizierten Personen. Das auf der Grundlage von mit dem Smartphone aufgenommenen Hustengeräuschen. Die Ergebnisse sind manchmal verblüffend, aber schwer zu reproduzieren.

(Source: Annie Spratt / Unsplash)
(Source: Annie Spratt / Unsplash)

Ins Handy husten könnte bald verraten, ob jemand unter dem Coronavirus leidet. Zumindest ist dies das Ziel von Forschern auf beiden Seiten des Atlantiks. Eine künstliche Intelligenz (KI) soll anhand von mit dem Smartphone aufgenommenen Hustengeräuschen voraussagen, ob eine Person infiziert ist.

Anfang April lancierten die Wissenschaftler der EPFL das Projekt "Coughvid" zur Sammlung von Onlineaufnahmen von freiwilligen Hustenden. Das ist ein notwendiger Schritt in der anschliessenden Entwicklung eines Prognosemodells und einer App. "Die Anwendung zielt darauf ab, eine Genauigkeitsrate von 70 Prozent zu erreichen, wenn genügend Daten gesammelt und für Tests verwendet werden", sagt David Atienza, Direktor des Labors für eingebettete Systeme der EPFL. In fünf Monaten sammelten die Forscher einen Korpus von mehr als 20'000 Datensätzen, darunter etwa 1500 positive Fälle, um ihre algorithmischen Modelle zu trainieren.

Pulmologen versus Algorithmen

Tomás Teijeiro, Leiter des Forscherteams, das sich an der EPFL mit Coughvid befasst, erklärt auf Anfrage, dass mehrere Tausend Aufnahmen bei den Pulmologen eingereicht wurden. Diese tun sich jedoch schwer sich, abgesehen von einigen klar identifizierbaren Fällen, auf eine Diagnose zu einigen.

Dr. Tomás Teijeiro, Leiter des Forscherteams, das an der EPFL an Coughvid arbeitet. (Source: zVg)

Die Forscher hoffen, dass die künstliche Intelligenz besser wird. Sie haben daher die Aufzeichnungen bereinigt von Umgebungsgeräuschen und demografischen Daten in die Machine-Learning-Systeme eingespeist. "Beim derzeitigen Stand unserer Arbeit sind wir zu einem Modell gelangt, das in der Lage ist, 40 Prozent der Infizierten anhand ihres Hustengeräusches zu erkennen und nur in 3 Prozent der Fälle eine Person fälschlicherweise als positiv zu identifizieren", erklärt Teijeiro. Der Spezialist räumt ein, dass dies für eine diagnostische App oder gar ein Diagnosehilfsmittel derzeit nicht ausreicht. Die Forscher der EPFL setzen daher ihre Experimente fort.

Algorithmus versus Algorithmus

Und sie sind nicht die Einzigen. Auch an der Universität Cambridge begannen Forscher in diesem Frühjahr damit, mehrere tausend Hustenaufzeichnungen zu sammeln, um einen Diagnosealgorithmus zu entwickeln. Im Juli gaben sie bekannt, dass ihr Vorhersagemodell eine 80-prozentige Genauigkeit erreicht hat.

Doch die beeindruckendsten Ergebnisse kommen von der anderen Seite des Atlantiks. In einem kürzlich erschienenen Artikel gaben MIT-Forscher bekannt, dass sie ein Modell entwickelt haben, das in der Lage ist, 98,5 Prozent der Fälle mit weniger als 6 Prozent falsch-positiven Ergebnissen zu diagnostizieren. Und bei asymptomatischen Personen wäre ihr Modell sogar in der Lage, Covid-19-Fälle mit weniger als 20 Prozent falsch-positiven Ergebnissen zu erkennen. MIT-Wissenschaftler schreiben: "KI-Techniken können ein kostenloses, nicht-invasives, gross angelegtes, jederzeit in Echtzeit und sofort verteilbares Screening-Tool bieten, das die derzeitigen Ansätze zur Eindämmung der Ausbreitung von Corona unterstützt. Die Methode könnte in täglichen Screenings von Studenten, Arbeitern und der allgemeinen Bevölkerung praktische Anwendungen finden."

Schwierig zu reproduzieren

An der EPFL ist Tomás Teijeiro von den Leistungen der MIT-Forscher beeindruckt. Er nennt die Ergebnisse "fast zu schön, um wahr zu sein", und bedauert, dass es ihm nicht möglich war, das MIT-Modell mit den von ihm gesammelten Datensätzen zu testen oder mit dem Modell der EPFL an den Daten des MIT zu experimentieren.

Alle Wissenschaften sind vom Problem der Reproduzierbarkeit betroffen, aber in der Datenwissenschaft ist es besonders offensichtlich. Denn das Vorhersagemodell ist das Ergebnis mehrfacher Anpassungen. Abhilfe kann schaffen, die Daten anderen Forschern zur Verfügung zu stellen, damit diese sich an der Reproduktion versuchen können - was die Forscher aus Cambridge und der EPFL getan haben. Oder eine Challenge zu starten, zum Beispiel auf der Kaggle-Plattform. Hierbei werden Aussenstehende eingeladen, ein algorithmisches Modell auf der Grundlage eines Trainingsdatensatzes zu entwickeln und es dann an einem Testdatensatz zu testen. Teijeiro denkt laut eigenen Angaben ernsthaft darüber nach.

Die ETH Zürich hat am 20. Oktober ein AI Center eröffnet und dabei einen Einblick in die Forschungsthemen geboten, die durch das Center unterstützt werden. Mehr dazu lesen Sie hier.

Webcode
DPF8_197377