Speech Technology Excellence Speech Technology Excellence

Technologie – Flexibilität durch Modularisierung

Die Dialogplattform SPEX KIT zeichnet sich durch eine offene Architektur aus, die sowohl eine flexible als auch effiziente Erstellung von Dialogen ermöglicht.

Der Dialogmanager

Den Kern des SPEX KIT bildet der Dialogmanager. Er unterstützt natürliche und interaktive Kommunikationsprinzipien. Eine Reihe von Funktionen schaffen für Anwender einfach zu nutzende und komfortabel zu bedienende Dialoganwendungen:

  • gemischt-initiative Dialogführung
  • Möglichkeit zur Unterbrechung (Barge-in)
  • flexibler Wechsel zwischen Teildialogen und Kontexten
  • direkte und indirekte Korrekturmöglichkeiten
  • explizite und implizite Bestätigungen
  • Benutzer angepasste Eingabeaufforderungen

[Δ]

Modulanbindung

Die hohe Modularisierung der Dialogplattform SPEX KIT bringt eine offene Architektur mit sich. Die Komponenten zur Sprachverarbeitung – Spracherkennung, Sprachverstehen, Sprachsynthese, Prerecorded Speech und Textgenerierung – sind in einem speziellen Framework angesiedelt. Dies ermöglicht die freie und vom Hersteller unabhängige Einbindung der Module, ohne Veränderungen am Dialog vornehmen zu müssen.

Grafik - Komponentnenanbindung an den Dialogmanager

Komponentenanbindung an den Dialogmanager

[Δ]

 

Darüber hinaus stellt die Plattform Schnittstellen für vielfältige Anbindungen zur Verfügung. Dies umfasst Datenbanksysteme, grafische Komponenten und die direkte Ansteuerung von Systemen und Geräten. Dialogfluss und prozedurale Anteile sind strikt getrennt.

Grafik - Kommunikation zwischen Dialogmanager und Applikationen

Kommunikation zwischen Dialogmanager und Applikation

[Δ]

Skriptsprache SDML

Der Dialogmanager wird über die XML–basierte Skriptsprache SDML (Smart Dialog Modeling Language) konfiguriert. SDML ist eine schlanke und einfach zu handhabende Skriptsprache, die gleichzeitig überaus mächtig ist. Dadurch können Dialogsysteme effizient und kostengünstig entwickelt werden. Hier ist ein Beispiel für die Eingabe einer Telefonnummer:

<Subdialog Name="S_Dialing">
  <Step Name="s_dial_number_main">
    <SpeechOutput>
      <PlayList Prompts="p_request_number"/>
      <PlayList Prompts="p_sorry p_request_number_shortHelp"/>
      <PlayList Prompts="p_sorry p_request_number_longHelp"/>
    </SpeechOutput>
    <SpeechInput Subgrammars="digit_entry"/>
    <ActionSequence Condition="digits=ANY">
      <Action String="store lastBlock"/>
      <Action String="request number"/>
    </ActionSequence>
    <Transition Condition="digits=ANY" Target="s_dial_number_continue"/>
    <Transition Condition="command=back" Target="S_VoicePortal"/>
    <Transition Condition="command=help" Target="s_dial_number_help"/>
  </Step>
</Subdialog>

SDML - Beispiel einer telefonischen Nummerneingabe

[Δ]

Systemmerkmale

  • Betriebssysteme: Windows 9x / ME / NT / 2000 / XP
  • Audio I/O: Soundcard, CAPI / ISDN, Barge-in
  • Spracherkennung: Temic Starrec, IBM ViaVoice
  • Grammatik: Java Speech Grammar Format (JSGF)
  • Sprachsynthese: Loquendo TTS, ELAN TTS Engine, ELAN SpeechCube, SVOX
  • Datenbankanbindung: ODBC
  • Weitere Schnittstellen: DLL, TCP/IP, Windows Messaging

[Δ]

Dialogplattform

> Dialogmanager

> Modulanbindung

> Skriptsprache SDML

> Systemmerkmale


Whitepaper (pdf)

Acrobat Reader herunterladen