VOLLTEXTSUCHE
Pressearchiv
NeueNachricht
Pressemitteilung

Feinschliff für natürliche Spracherkennung

(PM) , 18.09.2007 - Systeme mit freiem Dialog setzen sich immer stärker durch

Von Gunnar Sohn

Berlin/Bonn - Technologien für die Spracherkennung zählen zu den aufstrebenden Branchen weltweit. Nach einer Datamonitor-Studie werden die Umsätze mit entsprechenden Techniken im laufenden Jahr um 22 Prozent auf 2,3 Milliarden Dollar klettern. In Deutschland werde die Marke von 100 Millionen Dollar übertroffen. Nach Ansicht von Marktexperten wird sich die Automatisierung mit natürlicher Spracherkennung in fast allen Wirtschaftsbranchen etablieren. Qualitätskriterien sollen diese Entwicklung befördern.

Für das Berliner Unternehmen SemanticEdge www.semanticedge.de, dreimaliger Voice Award-Gewinner www.voice-award.de, müssen sich diese Kriterien an vier Größen messen lassen, die nicht nur isoliert die Sprachapplikation betrachten, sondern auch die Erwartungen des Kunden und die Ziele des Unternehmens mit einbeziehen. Dazu zählen die Erwartungen des Kunden in Bezug auf ein Unternehmen und dessen Kundenserviceprozesse, die Anforderungen des Kunden an das Voice User Interface (VUI) als Schnittstelle zwischen Mensch und Maschine, die Zielsetzungen des Unternehmens bezüglich des Kunden und schließlich die Anforderungen des Unternehmens an das VUI als IT System. „Mit Spracherkennern, die ein viel größeres Vokabular und auch mehrere Informationen in einem Satz erkennen lassen, sind die Möglichkeiten im Dialogdesign in den vergangenen Jahren stark gewachsen. Damit einher geht aber auch eine deutliche größere Herausforderungen an das Dialogmanagement sowie die Entwicklung und Administration natürlich-sprachlicher Dialoge. Aufgrund der Vielfalt der Dialogvarianten ist die Entwicklung von freieren, eventbasierten Dialogen, bei denen mehrere Stichworte oder ganze Sätze in einem Schritt erkannt werden sollen und der Dialog fallspezifisch auf das Verstandene eingeht, sehr komplex. Neben der Erstellung der Dialoge ist auch der Feinschliff der Applikation sehr aufwendig“, erklärt SemanticEdge-Geschäftsführer Lupo Pape. Gleichzeitig aber seien die Anforderungen der Anwender in der Regel nicht so individuell, dass nicht ein signifikanter Teil der Dialoge auf der Basis vorgefertigter und im Livebetrieb feingeschliffener Applikationsmodule abgebildet werden könne, um dann um individuelle Erweiterungen und Änderungen ergänzt zu werden.

„Wie beim Enterprise Resource Planning lieg auch bei der Sprachautomatisierung die Zukunft bei modularen Applikationen und komplett konfigurierbaren Branchenlösungen, die man schnell an die Vorgaben der Anwender anpassen kann mit einem immer höheren und robusteren Niveau der Dialogintelligenz . Eine neue Generation hoch modularer und damit vielschichtig konfigurierbarer Sprachapplikationen bieten zusätzlich auch als Hosted-Solution die Möglichkeit eines kostengünstigen Einstiegs für Anwender in komplexe, natürlich-sprachliche Multi-Service-Portale auf der Basis einer pro Call-Abrechnung.

Neben dem Bereitstellen reiner Hosting-Kapazitäten zeichnet sich daher ein neuer Trend dahingehend ab, dass auch Applikationen nicht gekauft, sondern entsprechend der Nutzung bezahlt werden“, so die Markterfahrung von Pape. Insgesamt sei es bemerkenswert, in wie vielen unterschiedlichen Branchen sich der Trend zur Sprachautomatisierung durchsetzt. „Das belegen die Referenzprojekte unseres Unternehmens. So wurde bei der Sparda-Bank Hamburg das alte IVR-System durch ein natürlich-sprachliches Dialogsystem ersetzt mit deutlich erweitertem Servicespektrum. Die voll automatisierten Services umfassen die externen und internen Überweisungen, Kontostands- und Umsatzabfragen, Ansagen der Bonuspunkte und des Freistellungsauftrags, Kreditkartensperre, Bestellung von Formularen, Änderung der Geheimzahl, Vermittlung an einen namentlich bekannten Mitarbeiter oder an eine Abteilung, Ansage von Bankleitzahlen sowie Filial- und Geldautomatenstandorte“, erläutert Pape.

Das Sprachportal habe sich hier zur zentralen Anlaufstelle für sämtliche Anrufe etabliert: „Es nimmt einen Großteil der in die Bank eingehenden Anrufe entgegen mit einem Automatisierungsgrad von rund 75 Prozent. Es setzt sich damit deutlich von den reinen Telefonbanking-Systemen der Konkurrenz ab, die nicht als Unternehmensportal, sondern als reine Telefonbanking-Anwendung geschaltet sind. Anstelle starrer Menüs à la ‚sagen Sie Kontostand, wenn Sie…’ gibt das System dem Anrufer die Initiative mit ‚Wie kann ich Ihnen helfen?’. Der Anrufer kann dann in ganzen Sätzen gleich den gewünschten Service auswählen. Das System passt den Dialog dynamisch an die Äußerungen des Kunden und das im System hinterlegte Domainwissen an wie verfügbare Konten, Kontostände, Überziehungskredite oder Überweisungslimits. Die Applikation besteht zu 100 Prozent aus Sprachsynthese und ist damit das erste Sprachportal im deutschen Sprachraum, das ausschließlich auf Text-to-Speech (TTS) setzt“, so Pape. SemanticEdge verfüge damit über einen enormen Vorsprung beim Einsatz von Sprachsynthese: „Aus unser langjährigen Erfahrung wissen wir, wie man Ansagen mit Sprachsynthese am besten aufbauen muss und wie sie verfeinert werden können“, sagt Pape.

Bei den Services für Filialen und Geldautomaten erlaube das Sprachportal die Erkennung sämtlicher Ortsnamen in Norddeutschland und sämtlicher Straßennamen in Hamburg in einem einzigen Dialogschritt. Das mache die Nutzung für die Kunden sehr angenehm und einfach. Als erstes System weltweit erlaube es eine komplett automatisierte externe Überweisung inklusive Aufnahme des Empfängernamens und des freien Verwendungszwecks ohne Nachbearbeitung. „Der Verwendungszweck kann dabei bis zu 54 Stellen alphanumerisch sein. Der Automationsgrad liegt bei über 80 Prozent. Bei der Vermittlung an einen Mitarbeiter der Bank ist das Lotus-Notes-System eingebunden, um die Anwesenheit zu überprüfen. So kann online geprüft werden, ob eine Vermittlung an den Mitarbeiter Sinn macht. Es können auch sofort alternative Ansprechpartner vorgeschlagen werden. In einer Pilotphase wurden Kunden in die Bewertung und Optimierung des Sprachportals eingeschaltet. Sie haben sich dabei deutlich für die Einführung des Sprachportals entschieden. Ein eingeführtes Qualitätsmanagement der Sparda-Bank Hamburg überwacht ständig alle Beschwerden, die über sämtliche Kanäle (Callcenter, E-Mail, Post, Filiale) erfasst werden. Die Beschwerderate liegt bei unter 5 Promille und damit auf der gleichen Höhe wie für die Kontaktstellen Filiale oder Internet“, erläutert Pape.

In einer Pilotphase wurden Kunden in die Bewertung und Optimierung des Sprachportals eingeschaltet. Die Kunden haben sich dabei deutlich für die Einführung des Sprachportals entschieden. Ein eingeführtes Qualitätsmanagement der Sparda-Bank Hamburg überwacht ständig alle Beschwerden, die über sämtliche Kanäle (Call Center, E-Mail, Post, Filiale) erfasst werden. Die Beschwerderate liegt bei unter 5 Promille und damit auf der gleichen Höhe wie für die Kontaktstellen Filiale oder Internet.

„Interessante Einsatzgebiete gibt es auch für die Logistikbranche. Herausragend ist hier die Paketdienst Info von DHL. Die Frage, ob die bestellten Schuhe noch pünktlich zum Wochenende oder der neue MP3-Player früh genug für die Urlaubsreise geliefert werden, können mit diesem Dienst in kürzester Zeit geklärt werden. Der Anrufer gibt lediglich eine Sendungsnummer ein. Das System schickt das Ergebnis der Abfrage zudem auf Wunsch auch per Fax oder SMS an den Nutzer. Der kann sich aber auch zu einem menschlichen Agenten durchstellen lassen“, so Pape.

Bis zu 60 verschiedene Lieferzustände könne die Sendungsauskunft mitteilen. Der erwartete Automatisierungsgrad von 20 Prozent sei mittlerweile weit übertroffen worden und liege bei 57 Prozent. „Auf der Basis unterschiedlicher Informationen aus dem Backend-System werden mit Hilfe einer intelligenten Sprachgenerierungskomponente des NLU Dialogmanagers zur Laufzeit grammatikalisch korrekte Sätze und Zusammenfassungen aus den Backend-Daten generiert. Ein Parser verbunden mit umfangreicher Businesslogik überprüft dabei in Freitexten vorliegende Informationen auf relevante Inhalte. Dabei werden auch Orts-, Straßen- und Eigennamen sauber ausgesprochen. Der Dialog erlaubt Rückfragen zu einzelnen Informationen. Nach der Aufnahme der Sendungsnummer werden die Anrufe an Servicemitarbeiter weitergeleitet. Mithilfe einer komplexen CTI-Lösung erhalten die Mitarbeiter mit dem Anruf auch gleich die Statusinformationen auf Ihren Bildschirm. Nach der Ansage können die Informationen auch via SMS oder Fax versandt werden. Nach der Einführung des Systems wurde die Kundenakzeptanz durch eine umfangreiche Kundenbefragung überprüft. 500 Anrufer wurden einen Tag nach der Nutzung zu 25 Fragen interviewt. Die Kundenbefragung ergab eines der besten Ergebnisse, die im Kundenservicebereich konzernweit je durchgeführt worden sind. Auf der Basis dieser Ergebnisse wurde der weitere Ausbau der Sprachportale als eine strategisch bedeutende Technologie für die DHL entschieden“, führt Pape aus.

Sprachportale spielen nach seiner Prognose auch bei der mobilen Kommunikation eine entscheidende Rolle: Jedes noch so einfache Telefon erlaube den Zugriff auf Telefonbücher und Kalender, die auf einem Server hinterlegt sind. Der Anruf auf einer Servicenummer und die anschließende Weiterverteilung der Anrufe in IP-Netze spare Kosten und der Nutzer habe eine nahtlose Schnittstelle zu allen Kommunikationsdiensten. „Die klassische Festnetzinfrastruktur entfällt. Weitere Sprachportale wie Taxiruf, HRS-Hotelbuchung oder Bahnauskunft kann man ohne großen Aufwand integrieren und zu einem virtuellen Sekretariat ausbauen. Das Ganze ist keine Zukunftsmusik mehr. Wir haben das bei DaimerChrysler realisiert. Als persönliche Kommunikationszentrale kennt der Personal Assistant alle Geschäftspartner, Kollegen ebenso wie Hotels, Restaurants und Fahrplanauskünfte für die Reiseplanung. Er sorgt dafür, dass diese jederzeit und von jedem Ort der Welt ganz schnell und mit wenigen Worten erreicht werden können. Er wählt dabei jeweils die günstigste Telefonverbindung. Wenn ein Anruf nicht zustande kommt, versendet er eine SMS. Zudem liest das System während der Fahrt E-Mails vor oder sucht den nächsten Zug für die Weiterfahrt mit der Bahn“, skizziert Pape die Vorteile des Dienstes.

Vielversprechend sei auch der Einsatz von Sprachagenten als Stadtführer. So setze der Münchner Verkehrs- und Tarifverbund (MVV) auf eine sprachgesteuerte Fahrplanauskunft. „Unter der Telefonnummer 089 - 41 42 43 gibt es Informationen zu allen 4.500 MVV-Haltestellen, 2.500 Sehenswürdigkeiten und 450.000 Adressen in München. Auf Wunsch werden die Ergebnisse auch als Fax oder SMS mitgeteilt“, so Pape.

Nach MVV-Angaben können über den sprechenden Fahrplan ungefähr 40 Prozent aller Anrufe abschließend behandelt werden. Mit einer einfachen „Weiter"-Eingabe kann der Anrufer sich aber auch ins Call Center durchstellen lassen, um komplexere Fragen zu klären. Der Härtetest war die Fußball-Weltmeisterschaft im vergangenen Jahr. „Die Vorteile des neuen Systems sind natürlich die Entlastung unserer Call Center-Mitarbeiter von Routineanfragen und die ständige Erreichbarkeit“, sagt Susanne Strasser, Bereichsleiterin Marketing des MVV. Das Sprachportal sei täglich rund um die Uhr erreichbar. Darüber hinaus sei auch eine Abnahme der Kunden-Beschwerden zu verzeichnen. „An Werktagen mit durchschnittlichem Verkehrsaufkommen“, so MVV-Projektleiter Bernhard Segl, „werden rund 1000 Anfragen über die sprachgesteuerte Auskunft abgewickelt.“ Aber auch bei Großveranstaltungen wie dem Papstbesuch oder dem Oktoberfest gebe es keine Probleme, da genügend Kapazitätsreserven zur Verfügung stehen. Seit dem Frühjahr ist der Dialog auch in englischer Sprache möglich. Dazu starte man die Unterhaltung einfach mit der Eingabe „Englisch“.

Sechs Wochen hat es nur gedauert, bis das im Rahmen der Initiative „Neue Mobilitätsdienste“ der Regierung von Oberbayern geförderte Sprachportal in München zum Einsatz kam. Rund 300.000 Euro wurden investiert, die laufenden Personalkosten bleiben stabil und überschaubar – ein Argument, das mit einer Outsourcing-Variante an einen externen Call Center-Dienstleister nicht gegriffen hätte: „Durch 24-stündige Erreichbarkeit erzielt der MVV eine Akzeptanzsteigerung der telefonischen Auskunft und verbessert dadurch auch sein Image“, resümiert Pape. Auch hier sei die Möglichkeit eines freien Dialogs und die natürlich-sprachliche Erkennung des Start- und Zielortes wichtig: „Das erhöht die Nutzerfreundlichkeit. Außerdem weist die sprachgesteuerte Fahrplanauskunft deutlich höhere Automationsgrade auf als andere im Einsatz befindliche Lösungen und macht sich relativ schnell bezahlt“, weiß Pape. Für mobilitätseingeschränkte Nutzer sei die Fahrplanauskunft leicht zu handhaben. Rollstuhlfahrer beispielsweise könnten ihre Einschränkung angeben und bekämen die entsprechenden Empfehlungen. Der Dialog werde vom Benutzer aktiv gesteuert. „Das System reagiert flexibel auf die Äußerungen des Anrufers und ist in der Lage, mehrere Informationen gleichzeitig zu verarbeiten, zu bestätigen oder zu korrigieren“, so Pape.
DRUCKEN| VERSENDEN | RSS-FEED |
SOCIAL WEB
PRESSEFACH
NeueNachricht
Ettighofferstr. 26a
53123 Bonn
zum Pressefach
Anzeige
PRESSEARCHIV
Anzeige
BUSINESS-SERVICES
© novo per motio KG