Künstliche Intelligenz in Hörsystemen – jetzt klinisch getestet
Seit Mai 2004 wird das erste Hörsystem mit Künstlicher Intelligenz erfolgreich angepasst. Akustiker, die mit dieser Technik aus Dänemark arbeiten, berichten von wahren Wundern. Von Tagen der offenen Tür, bei denen sich Menschen von der Straße sofort für Hörsysteme entscheiden, egal ob mit oder ohne Verordnung. Von Menschen, die, ob über Kopfhörer oder im Freifeld, niemals mehr als 50 % Sprachverstehen hatten, mithilfe Künstlicher Intelligenz 90 % verstehen konnten. Von Hörsituationen, in denen Normalhörende weniger verstehen als die Menschen mit den Hörgeräten. Von Akustikern, die in »zuzahlungsfreien Zonen« plötzlich einen erheblichen Anteil von HighEnd-Geräten anpassen. Da fragt sich der kritische Praktiker, ob hier nicht gewaltig übertrieben wird. Insofern ist es von besonderer Bedeutung, dass nun die erste klinische Studie über die Hörsysteme mit Künstlicher Intelligenz, die unter dem Markennamen »Syncro« vertrieben werden, vorliegt.
Apfel oder Birne – oder auch: Komfort oder Sprachverstehen
In der Vergangenheit war es mit Hörsystemen nicht möglich, relativ komfortabel zu hören und gleichzeitg alles zu verstehen. Es musste stets ein Kompromiss gefunden oder sogar eine Ja/Nein-Entscheidung getroffen werden. Berühmtes Beispiel ist der »K-Amp«, ein Verstärker, der in vielen Hörsystemen eingebaut war. Er hatte einen sehr angenehmen Klang – speziell im Lärm – weil hier einfach die Höhen abgesenkt wurden. Eben diese Höhen benötigt man aber gerade zum Verstehen. Das genaue Gegenteil hat dann konsequenterweise auch das erste vollautomatische Gerät gemacht. Beim »MultiFocus« (1990) wurden im Lärm die Tiefen abgesenkt, weil dort die meiste störende Energie übertragen wird. Die für das Sprachverstehen so wichtigen Höhen blieben erhalten. Die Akustiker erfanden dann auch entsprechende Kategorien: MultiFocus war das Verstehgerät, der K-Amp ein Weichspüler. Die nächsten 10 Jahre gab es einen ständigen Wettstreit der Hersteller und Akustiker zwischen diesen beiden Extremen, entweder Komfort oder Verstehen.
Der 1. Schritt, beide Ziele in einem Gerät zu vereinen, wurde durch die Digital-Technik möglich. Hiermit war es nämlich erstmals realisiert worden, den von vielen als äußerst unangenehm empfundenen Verschlusseffekt der Ohren auch für breitbandige Hörverluste zu beseitigen. Diese als »Open-Ear Acoustics« bezeichnete Technik wurde erstmals im Jahre 2001 im »Adapto« angeboten. Inzwischen gibt es diese Technik in drei weiteren Geräte-Familien des dänischen Herstellers, so dass ca. 80 % aller Hörverluste offen angepasst werden können. Und zwar in fast allen Preisklassen, lediglich im Kassen-Segment gibt es die offene Versorgung vorerst »nur« für Hochton-Verluste. (Über diese Technik ist in der »Hörakustik« ausführlich berichtet worden). Weil die offene Versorgung so angenehm ist, kann getrost behauptet werden, dass dadurch der größte Sprung in Richtung eines allgemeinen Hörkomforts erreicht worden ist. Deshalb hat auch die dänische Hörgeräte-Schmiede beschlossen, alle zukünftigen Entwicklungen mit dieser Technik auszustatten. Verschlossene Ohren gehören der Vergangenheit an, lediglich für schwerste Hörverluste muss noch eine Otoplastik zur Unterdrückung von Rückkopplungen eingesetzt werden.
«Offen ist gar nicht gut»?
Mit dem breiten Angebot der offenen Versorgung für fast alle Hörverluste waren Tatsachen geschaffen worden. Meilensteine in Richtung Komfort. Weil dies so war, gleichzeitig aber kein anderer Anbieter über das entsprechende Know-How zur Entwicklung entsprechender Geräte verfügte, wurde nach Argumenten gegen die offene Versorgung gesucht. Im Wesentlichen wurden immer wieder folgende Behauptungen aufgestellt:
- Offene Versorgung macht den Vorteil von Richtmikrofonen zunichte!
- Bei offenen Ohren kommt der Lärm ungehindert an das Trommelfell!
- Offene Versorgungen sind nicht laut genug!
- Jedes Hörgerät hat Rückkopplungen, offen geht nur für Hochton-Verluste!
Diese falschen Behauptungen sind u.a. in den letzten Ausgaben der »Hörakustik« bereits ausführlich widerlegt worden. Trotzdem sollen in kurzen Worten die wesentlichsten Punkte genannt werden:
zu 1.: Die Aufnahme-Charakteristik eines Richtmikrofons wird durch die Otoplastik in keiner Weise beeinflusst.
zu 2.: Beim Sprachverstehen mit Hörsystemen stört das Sprach-/Lärm-Gemisch im Gerät. Wird der Lärm mit moderner Digital-Technik möglichst weit reduziert, bleibt die Sprache übrig und wird verstärkt. Damit schwebt sie quasi über dem unverstärkten Lärm – der dann auch nicht mehr stört. Im Gegenteil, der durch den Vent eindringende Schall sorgt für ein natürliches Klangbild, lediglich die fehlenden Sprach-Anteile werden hinzugefügt.
zu 3.: Die Praxis zeigt, dass breitbandige Hörverluste bis ca. 75 dB HL mit der vorhandenen Technik offen versorgt werden können (in Einzelfällen sogar Hörverluste bis 90 dB HL).
zu 4.: Jedes Hörsystem hat eine Grenze zur Rückkopplung, das ist richtig. Diese Grenze kann aber dank ausgefeilter Algorithmen immer weiter hinausgeschoben werden. In Einzelfällen können dies die schon genannten 90 dB Hörverluste sein.
Ziel der Studie
Ziel der Studie war also zu überprüfen, ob es möglich ist, Sprachverständlichkeit und Komfort miteinander zu verbinden. Zusätzlich sollte überprüft werden, ob Richtmikrofone und Störschall-Unterdrückung auch bei offener Versorgung einen spürbaren Nutzen bringen.
Zusammenfassend war also zu klären, ob die Künstliche Intelligenz auch in der Realität die Wirkung zeigt, die in der Werbung versprochen wird. Da weltweit im HighEnd-Sektor mehrheitlich ImOhr-Geräte angepasst werden, wurden die Probanden mit ImOhr-Testgeräten versorgt.
Künstliche Intelligenz [DNN]
Das Thema Künstliche Intelligenz wird in einer der nächsten Ausgaben der »Hörakustik« beschrieben, insofern an dieser Stelle nur eine kurze Erläuterung der Technik.
Bisherige Hörsysteme arbeiten alle auf der Basis von Vorhersagen. Entsprechend diesen Vorhersagen werden Formeln (»Algorithmen«) entwickelt, die in die Chips der Hörsysteme einprogrammiert werden. Einmal dort gespeichert, laufen anschließend die Schaltvorgänge in den Hörsystemen entsprechend diesen Formeln ab, egal, ob es in dieser speziellen Situation audiologisch sinnvoll oder eher kontraproduktiv ist.
Ein Beispiel für eine derartige Vorhersage ist die Annahme, ein Sprecher befinde sich immer vor dem Hörgeräte-Träger. Deshalb schalten alle bisher verfügbaren Hörsysteme mit so genannten adaptiven Richtmikrofonen ab einem bestimmten Pegel (meist ca. 75 bis 80 dB SPL) von Omni- auf Richt-Charakteristik. Dabei ist das Mikrofon mit seiner Richtkeule immer nach vorne ausgerichtet – auch wenn der Sprecher hinter dem Hörgerät steht.
Ein anderes Beispiel: Die Annahme, Sprache sei 65 dB SPL laut. Diesen Wert kann man in jedem Lehrbuch nachlesen, trotzdem stimmt er für Hörgeräte-Träger meistens nicht. Weil die Messungen zur Sprachlautstärke in schalltoten Räumen vorgenommen wurden, die Hörgeräte-Träger aber im Lärm verstehen wollen. Und im Lärm sprechen wir intuitiv anders, wir heben die Stimme an. Also ist Sprache für das Hörsystem meistens lauter als 65 dB SPL.
Wird untersucht, wie automatische Hörsysteme auf Basis solcher Vorhersagen schalten, stellt man fest, dass bis zu 30% dieser Schaltvorgänge kontraproduktiv sind. Zum Beispiel weil von hinten gesprochen wird, das Richtmikrofon aber zielt nach vorne.
Um genau diese Fehler zu vermeiden, wird die Künstliche Intelligenz eingesetzt. Ziel ist dabei, den bestmöglichen Signal-/Stör-Abstand für Sprache zu erreichen. Egal unter welchen Umständen, egal aus welcher Richtung. Um dies zu erreichen, findet eine permanente Signalanalyse statt. Dabei wird die Lautstärke und die Eintallsrichtung der verschiedenen Signale gemessen und wenn Sprache erkannt wird, wird der Signal-/Stör-Abstand bestimmt. Gleichzeitig wird aus den (fast) unendlich vielen Einstell-Möglichkeiten, die im Gerät denkbar sind, diejenige ausgewählt, die den bestmöglichen Sprach-/Stör-Abstand garantiert.
Die Einstellungen werden permanent hintertragt und auch ständig nachgeregelt. Dabei werden 3 Haupt-Bausteine im Syncro parallel gesteuert und aufeinander abgestimmt: ein vierkanaliges Richtmikrofon, eine dreistufige Lärmunterdrückung und eine Sprach-stabilisierende Multi-Kompression. Alle Bausteine werden in einem weiteren Artikel erläutert.
Bei der Entwicklung dieser verschiedenen Automatiksysteme war ein ganz wichtiges Ziel, dass der Nutzer der Hörsysteme keine »Schaltvorgänge« hören soll. Die Künstliche intelligenz hat also auch die Aufgabe, das Hörsystem selbst unhörbar zu machen. Die Benutzer sollen besser verstehen können, aber nicht merken, dass ihre Geräte irgendwelche Eigengeräusche produzieren.
Das Studiendesign
37 Probanden mit einem leicht abfallenden Hörverlust nahmen an der Studie teil. Alle waren zufriedene und dauerhafte Benutzer von hochwertigen digitalen ImOhr-Geräten verschiedener Hersteller. Die Probanden waren zwischen 31 und 87 Jahre alt (Ø 67 Jahre). Alle wurden mit Syncro ImOhr-Geräten verschiedener Ausführungen entsprechend ihrem Hörverlust binaural versorgt (ITE 312; ITC 312; ITE 13; ITC 10). Aufgrund der geringen Abmessungen der Geräte wurden diese mit trichterförmigen Belüftungskanälen (»Collection-Vent«) ausgestattet. Dadurch wird das Restvolumen vor dem Trommelfell größer, der Strömungswiderstand für Luft wird geringer und damit wird eine akustische Wirkung erreicht, die sonst nur mit wesentlich größeren Vent-Öffnungen auf der Geräteoberfläche möglich wäre. Die Durchmesser betrugen auf der Face-Plate Ø 2.16 mm (es wurden 1- bis 3-mm – Bohrungen verwendet), das entspricht in etwa der akustischen Wirkung einer durchgehenden 3-mm – Bohrung.
Zur Einstellung der Geräte wurde der Anpass-Vorschlag der Software Genie 5,0 mit den Syncro-Profilen »Moderat«, »Aktiv« und »Dynamisch« verwendet. Die Profile entsprechen erweiterten Anpass-Algorithmen. Verstärkung, Frequenzgang, Ausgangsleistung, Regeltiefe und Ein- und Aus-Schwingzeiten der verschiedenen Automatiken werden damit für unterschiedliche Signale in Abhängigkeit von jeweils vorherrschenden Signal-/Stör-Abständen vom Gerät selbst gewählt. Es wurde bis auf den Rückkopplungs-Manager keine Feinanpassung vorgenommen. Damit entsprach die Einstellung dem »First Fit«.
Zum Vergleich wurden die bereits vorhandenen eigenen Hörsysteme herangezogen. Dies waren alles moderne HighEnd – ImOhr-Geräte, die nach Herstellerangaben angepasst waren. Alle Geräte wurden auf die im Datenblatt angegebenen Werte hin messtechnisch überprüft.
Zur Überprüfung der Sprachverständlichkeit wurde der Dantale-II Sprachtest im schalltoten Raum eingesetzt. (Dieser Test entspricht dem Oldenburger Satztest (OLSA) – ist aber in Dänisch).
Um das Testgerät mit bekannten Technologien zu vergleichen, wurde das Adapto-Hörsystem von Oticon einheitlich binaural eingesetzt. Dieses Gerät wurde gewählt, weil es in einer vorangegangenen Blind-Studie gegenüber digitalen und analogen Hörsystemen eine bessere Sprachverständlichkeit bei mehr Komfort geliefert hatte. Damit konnte es als Referenz-Gerät eingesetzt werden. Auch für die Adapto-Geräte wurde der jeweils patienten-bezogene First Fit eingesetzt.
Für die Verständlichkeits-Messungen wurde die Sprache mit einem Pegel von 70 dB SPL angeboten. Dazu wurde das Störgeräusch (Sprach-simuliertes Rauschen) so justiert, dass eine Verständlichkeit von 50 % erreicht wurde. Der daraus resultierende Signal-/Stör-Abstand wurde für 3 Mikrofon-Betriebsarten (Surround-, Split- und Voll-Fokus) ermittelt. Die jeweiligen Mikrofoneinstellungen wurden für die Messungen durch Software-Einstellungen fixiert. Normalerweise wählt das Syncro eigenständig und vollautomatisch die jeweiligen Mikrofon-Einstellungen selbst aus. Der Split-Fokus ist neuartig und NUR im Syncro verfügbar. Hier wird im Frequenzbereich bis 1’000 Hz das Mikrofon im Omni-Betrieb genutzt, im restlichen Frequenzbereich wird es als Richtmikrofon eingesetzt (dadurch klingt das Hörsystem natürlicher und das Richtmikrofon kann schon bei sehr geringen Pegeln genutzt werden). Da die Adapto-Geräte nicht im Split-Fokus arbeiten können, wurde hier zum Vergleich jeweils der Voll-Fokus-Betrieb genutzt.
Die Sprachsignale wurden aus einem Meter Abstand von einem Lautsprecher frontal (0 °) dargeboten. Ein unmoduliertes Breitband-Störgeräusch wurde aus 4 Lautsprechern von hinten im Halbkreis aus 1.5 Metern Entfernung dazugemischt. Die Störsignale waren durch eine Zeitverzögerung von 200 ms pro Lautsprecher unkorreliert.
Sensationelle Ergebnisse
2 Frageninventare (HAPQ – Hearing Aid Performance Questionary und ein Hörgeräte – Vergleichs-Fragebogen) wurden nach 6 Wochen am Ende des Tests eingesetzt. Damit wurde für diverse Alltagssituationen das jeweilige Siegergerät ermittelt.
Die Sprachverständlichkeit wurde in Abhängigkeit des Signal-/Stör-Abstands sowohl für die Referenz-Geräte Adapto wie auch für die Test-Geräte Syncro ermittelt.
Dabei lieferte das Syncro-Gerät unter allen Testbedingungen signifikant bessere Ergebnisse als das Referenz-Gerät. In jeder Mikrofon-Charakteristik wurden bis zu 2 dB Signal-/Stör-Abstands – Verbesserungen gemessen. Dabei entspricht 1 dB Verbesserung des Signal-/Stör-Abstandes (SNR) ca. 10 % Verbesserung der Sprachverständlichkeit.
Besonders wichtig ist, dass schon der Split-Fokus, der ja eine Richtcharakteristik auch in relativ ruhiger Umgebung ermöglicht, eine deutliche Verbesserung der Sprachverständlichkeit ermöglicht. Bisherige adaptive Richtmikrofone schalten sich erst ab Eingangspegeln von ca. 75 bis 80 dB SPL ein, der Split-Fokus kann ab ca. 55 dB SPL genutzt werde. (Im realen Betrieb arbeitet das Gerät vollautomatisch und entscheidet eigenständig, wann die Surround-, Split- oder Voll-Fokus-Charakteristik gewählt wird).
Um zu überprüfen, ob der Hörgewinn in jedem Profil möglich ist, wurden 3 Untergruppen mit den Profilen »Moderat«, »Aktiv« und »Dynamisch« gebildet. Die Resultate zeigen immer die gleiche Tendenz, eine signifikante Verbesserung mit den Testgeräten.
In den absoluten SNR-Werten ist das Profil »Dynamisch« am effektivsten, trotzdem können die Werte nicht ohne weiteres verglichen werden, da die Probandengruppen unterschiedlich waren. (»Dynamisch« wird für junge, geistig aktive Menschen vorgeschlagen, die hauptsächlich in unruhigen Umgebungen hören; »Moderat« ist für Ältere – mit langsamen Reaktionszeiten – die in ruhiger Umgebung hören.)
Um die unterschiedlichen Geräte auch subjektiv zu bewerten, wurde der HAPQ-Fragebogen eingesetzt. Die Geräte sollten hinsichtlich Sprachverstehen, Komfort und über alles bewertet werden. Auch in dieser subjektiven Einschätzung wurden die Syncro-Geräte in allen 3 Profilen signifikant besser eingeschätzt als die eigenen Geräte. Daraus wird deutlich, dass der Gewinn im Sprachverstehen nicht zu Lasten des Komforts geht, im Gegenteil, auch der Komfort wird mit den Testgeräten deutlich verbessert. Interessanterweise bewertet die Gruppe mit dem »Dynamisch«-Profil alle Situationen mit beiden Geräten niedriger als die anderen Profil-Gruppen. Dies deutet darauf hin, dass die jüngeren Hörgeräte-Träger insgesamt höhere Ansprüche an ihre Geräte stellen.
Um genauer zu untersuchen, aus welchen Gründen die Syncros als die besseren Geräte eingestuft wurden, sind Fragen zur Differenzierung der Hörsysteme gestellt worden.
Hier gab es signifikant bessere Bewertungen der Syncro-Geräte sowohl in schwierigen Situationen (Sprache im Auto/Bus; in einer Gruppe; auf der Straße und am Telefon), sowie bei Lärm (Verkehrslärm). Die Resultate zeigen, dass die Künstliche Intelligenz tatsächlich die richtigen Entscheidungen fällt, um die Geräte jeweils situationsbezogen zu optimieren. In den akustisch schwierigsten Situationen wird der Vorteil der Künstlichen Intelligenz besonders deutlich.
Diskussion – Noch Fragen?
Die Studie zeigt eindeutig den signifikanten Vorteil, den Syncro gegenüber den eigenen HighEnd-, und auch den Adapto-Geräten hat. Besonders wichtig ist hierbei, dass gerade in den schwierigsten Situationen die Künstliche Intelligenz die richtigen Entscheidungen zum Nutzen des Hörers fällt. Dabei wird der jeweils bestmögliche Signal-/Stör-Abstand im Gerät errechnet und die dafür notwendigen Einstellungen gewählt.
Geradezu überwältigend ist die Tatsache, dass im Durchschnitt noch bei -9 dB SNR die 50 %-Marke für die Verständlichkeit erreicht wird. Da der Oldenburger Satztest (also auch der Dantale-II) zufallsgesteuert aus einem Wortinventar sinnlose Sätze mit jeweils 5 Wörtern formt, ist die Verständlichkeit geringer als bei einem sinnvollem Satz, der in einem thematischen Bezug zu einem Gespräch steht. Auch wenn ein Sprachtest nicht direkt mit dem echten Leben verglichen werden kann, so darf grob davon ausgegangen werden, dass bei 50 % Verständlichkeit im Test die Verständlichkeit bei einer realen Unterhaltung höher ist. Damit wäre für die 37 Testpersonen im Durchschnitt noch ein Verstehen bei -9 dB Signal-/Stör-Abstand möglich. Die Gruppe mit dem Profil »Dynamisch« erreicht sogar den Wert von -9.5 dB SNR!
Besonders hervorzuheben ist dabei, dass die hohe Sprachverständlichkeit nicht mit Einbußen im Komfort oder der Klangqualität erkauft werden muss.
Durch die aufwändige Störgeräusch-Unterdrückung bei gleichzeitiger Sprachsignal-Anhebung kann mit einer sehr geringen Verstärkung für Sprache gearbeitet werden.
Nach althergebrachten Verstärkungsregeln würde für einen Hörverlust ca. der halbe Wert in dB als notwendige Verstärkung kalkuliert werden, bei den Syncro-Geräten wird mit wesentlich niedrigeren Werten gearbeitet. So wird für einen Breitband-Hörverlust von 70 dB HL nach DSL-I/O eine Verstärkung für Sprache (Pegel bei 65 dB SPL) mit Werten von über 40 dB Insertion Gain berechnet. Im Syncro-Profil »Aktiv« wird lediglich eine Verstärkung von ca. 17 dB Insertion Gain für Sprache vorgeschlagen.
Die Effektivität der Richtmikrofon-Technologie ist beeindruckend. Von verschiedenen Hörgeräte-Herstellern wurde immer wieder die Behauptung aufgestellt, dass offene Versorgung den Vorteil von Richtmikrofonen zunichte machen würde. Die Messwerte zeigen eindeutig, dass die Syncro-Mikrofontechnik auch mit großen Belüftungs-Bohrungen funktioniert. Der Grund liegt darin, dass Oticon diese Mikrofone extra für offene Anpassungen entwickelt hat.
Des Weiteren wird auch der Nutzen des Split-Fokus deutlich. Hier wird fast die Wirkung des Voll-Fokus erreicht, es bleibt aber der angenehme Klang des Omni-Modus (kein Verlust der Tiefton-Übertragung). Da die Mikrofon-Charakteristik vom Gerät durch die Künstliche Intelligenz eigenständig gewählt wird, gleichzeitig aber nicht der Nachteil älterer Richtmikrofone (Eigenrauschen, Verlust der Tiefen) in Kauf genommen werden muss, können die Syncro-Geräte fast ständig im Split- oder Voll-Fokus arbeiten.
Quasi nebenbei ist mit dieser Studie auch die Qualität des »First Fit« der Profile aus der Genie-Software gemessen worden. Da die Syncro-Geräte ohne Feinanpassung getestet wurden, ist zu erwarten, dass der sehr große Nutzen bei sorgfältiger Nachbetreuung noch weiter steigen könnte.
Zusammenfassend kann also gesagt werden, dass die Syncro-Geräte im Vergleich zu anderen HighEnd-Geräten einen deutlichen Vorteil bieten. Dies wird hauptsächlich durch die Künstliche Intelligenz erreicht, die für alle Hörsituationen einen bestmöglichen Signal-/Stör-Abstand in den Geräten errechnet und einstellt. Damit steigt der Hörgewinn – zusammen mit dem Hörkomfort.
Autor: Dipl.-Ing. Horst Warncke