DE102007042582A1 - Dialogue structure i.e. infotainment system substructure, developing method for artificial language system in vehicle for communication with passenger, involves graphically plotting defined communication rules and connection between rules - Google Patents
Dialogue structure i.e. infotainment system substructure, developing method for artificial language system in vehicle for communication with passenger, involves graphically plotting defined communication rules and connection between rules Download PDFInfo
- Publication number
- DE102007042582A1 DE102007042582A1 DE102007042582A DE102007042582A DE102007042582A1 DE 102007042582 A1 DE102007042582 A1 DE 102007042582A1 DE 102007042582 A DE102007042582 A DE 102007042582A DE 102007042582 A DE102007042582 A DE 102007042582A DE 102007042582 A1 DE102007042582 A1 DE 102007042582A1
- Authority
- DE
- Germany
- Prior art keywords
- communication
- input
- rules
- person
- graphically
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3626—Details of the output of route guidance instructions
- G01C21/3629—Guidance using speech or audio output, e.g. text-to-speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Abstract
Description
Die Erfindung betrifft ein Verfahren zum Entwickeln einer Dialogstruktur für ein künstliches Sprachsystem, welches zur Kommunikation mit einer natürlichen Person mittels natürlicher Sprache ausgebildet ist.The The invention relates to a method for developing a dialog structure for a artificial language system, which to communicate with a natural person by means of natural Language is trained.
Kommunikationssysteme, bei denen eine Kommunikation zwischen einem künstlichen Sprachsystem und einer natürlichen Person mittels natürlicher Sprache möglich ist, sind bekannt. Diesbezüglich sind auch bereits Systeme zur Verwendung in Fahrzeugen bekannt, bei denen ein Fahrzeuginsasse eine Eingabe an ein künstliches Sprachsystem durch gesprochene Befehle durchführen kann. Es sind auch Systeme bekannt, bei denen ein künstliches Sprachsystem eine Ausgabe an eine natürliche Person als Information mittels natürlicher Sprache durchführen kann.Communication systems where a communication between an artificial language system and a natural one Person by means of natural Language possible is known. In this regard, are already known systems for use in vehicles, where a vehicle occupant an input to an artificial Voice system can perform spoken commands. They are also systems known in which an artificial Speech system an issue to a natural person as information by means of natural Perform language can.
Da die diesen Kommunikationssystemen zugrunde liegenden Dialogstrukturen äußerst komplex und aufwändig sind, erfordert die Entwicklung einen erheblichen Zeitaufwand.There The dialogue structures underlying these communication systems are extremely complex and complex costly development takes a considerable amount of time.
Natürlichsprachliche Dialoge in der Datenverarbeitung umfassen die Verarbeitung einer textuellen oder sprachlichen Eingabe in prosaischer Form. Auf Basis dieser Eingabe wird meist auf der Grundlage einzelner Fallunterscheidungen, welche in die Tausende gehen können, eine passende Antwort ausgegeben. Die diesbezüglich erforderliche Dialogstruktur wird manuell als Quellcode erstellt und kann in maschinenlesbarer Form abgelegt werden. Die manuelle Erstellung ist zum einen äußerst aufwändig und gerade bei sehr komplexen Strukturen unübersichtlich und schwer nachvollziehbar. Darüber hinaus ist eine Änderung der Dialogstruktur nur mit erheblichem Aufwand möglich und in diesem Zusammenhang auch sehr fehleranfällig, da der Überblick für einen Entwickler quasi nicht mehr vollständig gewährleistet werden kann.Natural language Dialogues in data processing include the processing of a Textual or linguistic input in prosaic form. Based this input is usually based on individual case distinctions, which can go into the thousands, issued a suitable answer. The required dialogue structure is manually created as source code and can be machine-readable Form are filed. The manual creation is extremely time-consuming and especially with very complex structures confusing and difficult to understand. Furthermore is a change the dialogue structure only with considerable effort possible and in this context also very error prone, because the overview for one Developers can not be fully guaranteed anymore.
Es ist Aufgabe der vorliegenden Erfindung, ein Verfahren zu schaffen, bei dem die Entwicklung einer derartigen Dialogstruktur für ein Kommunikationssystem, insbesondere bei sehr komplexen Dialogstrukturen, schneller und übersichtlicher erfolgen kann.It It is an object of the present invention to provide a method in which the development of such a dialogue structure for a communication system, especially with very complex dialogue structures, faster and clearer can be done.
Diese Aufgabe wird durch ein Verfahren, welches die Merkmale nach Anspruch 1 aufweist, gelöst.These The object is achieved by a method which has the features according to claim 1, solved.
Bei einem erfindungsgemäßen Verfahren zum Entwickeln einer Dialogstruktur für ein künstliches Sprachsystem, welches zur Kommunikation mit einer natürlichen Person mittels natürlicher Sprache ausgebildet ist, wird der Dialogstruktur ein Modell zugrunde gelegt, durch welches definierte Kommunikationsregeln und Verbindungen zwischen den Kommunikationsregeln graphisch dargestellt werden. Durch diese Ausgestaltung des Entwicklungsverfahrens kann zu jedem Zeitpunkt auch bei sehr komplexen Dialogstrukturen der vollumfängliche Überblick gewährleistet werden und somit auch die Gesamtkonstruktion der Dialogstruktur jederzeit umfassend nachvollzogen werden. Insbesondere im Hinblick auf Änderungen oder Integration von weiteren Kommunikationsregeln kann die Erstellung dadurch wesentlich aufwandsärmer erfolgen. Nicht zuletzt ist die Entwicklung einer grundlegenden Dialogstruktur oder die Entwicklung einer Änderung für eine derartige Dialogstruktur dadurch wesentlich fehlerunanfälliger. Die gesamte Komplexität der Struktur kann besser überblickt werden.at a method according to the invention for Develop a dialog structure for an artificial language system, which to communicate with a natural one Person by means of natural Language is formed, the dialogue structure is based on a model defined by which defined communication rules and connections be graphically represented between the communication rules. By This design of the development process can at any time Even in the case of very complex dialogue structures, the full overview is guaranteed and thus also the overall construction of the dialogue structure comprehensively comprehended at any time. Especially with regard to on changes or integration of other communication rules can be the creation thus significantly less expensive respectively. Last but not least, the evolution of a fundamental Dialogue structure or the development of a change for such a dialogue structure thus much less error-prone. The entire complexity the structure can be better surveyed become.
Vorzugsweise werden eine einer Kommunikationsregel zugeordnete Eingabe der Person und eine der Eingabe zugeordnete Ausgabe des Sprachsystems graphisch dargestellt. Zumindest eine, insbesondere jede Kommunikationsregel der Dialogstruktur, wird somit auch zunächst für sich betrachtet und auch in Verbindung mit anderen Kommunikationsregeln wesentlich einfacher nachvollziehbar präsentiert. Aufwandsarm kann unverzüglich erkannt werden, welche Struktur hinter einer Kommunikationsregel gegeben ist und welcher Zusammenhang zwischen einer Eingabe und einer zugeordneten Ausgabe gegeben ist. Gerade dadurch lassen sich wesentliche Verbesserungen in sehr komplexen Eingabe-Ausgabe-Zuordnungen erreichen, wodurch auch die Flexibilität des Sprachsystems wesentlich verbessert werden kann. Nicht zuletzt kann dadurch auch die „Intelligenz" des Sprachsystems im Hinblick auf ein wesentlich erweitertes Erkennen von unterschiedlichsten Eingaben und der daraus resultierenden wesentlich erweiterten Möglichkeit von Ausgaben, erreicht werden.Preferably become an input of the person assigned to a communication rule and an output of the speech system associated with the input, graphically shown. At least one, in particular every communication rule The dialogue structure is therefore considered first and foremost much easier in conjunction with other communication rules comprehensible presented. Effortless can immediately be recognized, which structure behind a communication rule is given and what relationship between an input and an associated output is given. This is what makes essentials possible Achieve improvements in very complex input-output mappings, which also gives flexibility of the speech system can be significantly improved. Not least This can also be the "intelligence" of the language system with regard to a significantly expanded recognition of the most diverse Inputs and the resulting significantly expanded possibility of expenses, to be achieved.
Vorzugsweise werden gesamte Kommunikationsabläufe zwischen der natürlichen Person und dem künstlichen Sprachsystem mit einer Mehrzahl von Eingaben der Person und einer Mehrzahl von Ausgaben des Sprachsystems graphisch dargestellt.Preferably become entire communication processes between the natural Person and the artificial one Language system with a plurality of inputs of the person and a Plurality of outputs of the speech system plotted.
Nutzungsschritte in verschiedenen Stadien der Kommunikation können somit bei der Entwicklung einer Dialogstruktur wesentlich einfacher und nachvollziehbarer eingebunden und verknüpft werden. Auch hier trägt die graphische Darstellbarkeit und auch die graphische Darstellung der Verknüpfungen zum besseren Verständnis komplexester Dialogstrukturen bei.Terms steps In various stages of communication can thus be in the development a dialogue structure much easier and more comprehensible integrated and linked become. Also carries here Graphic representability and also graphical representation the links for better understanding at the most complex dialogue structures.
Vorzugsweise werden graphisch dargestellte Kommunikationsregeln und/oder graphisch dargestellte Verbindungen zu einer neuen und/oder einer erweiterten Dialogstruktur graphisch dargestellt versetzt und diese Dialogstruktur kann dann wiederum graphisch dargestellt werden. Es ist somit eine einfache Entwicklerfunktion dahingehend realisiert, dass quasi durch ein einfaches „copy-paste" (Kopieren und an anderer Stelle wieder Einfügen) realisiert ist. Auch dadurch kann der Entwicklungsprozess wesentlich beschleunigt werden und dennoch die Fehlererzeugung deutlich reduziert werden.Preferably, graphically represented communication rules and / or graphically displayed connections to a new and / or an expanded dialogue structure are graphically displayed and this dialogue structure can turn graphically displayed. Thus, a simple developer function is realized in such a way that, as it were, it is realized by a simple "copy-paste" (copying and inserting again elsewhere), which also significantly speeds up the development process and nevertheless significantly reduces error generation.
Es kann somit automatisch mit einem derartigen Kopieren und Verschieben von einem Teil der Dialogstruktur bei einem Einfügen an einer anderen Stelle der Dialogstruktur die dann gewünschte Verknüpfung mit anderen Teilen der Dialogstruktur, beispielsweise Kommunikationsregeln, automatisch erzeugt werden. Bevorzugt ist somit dann nicht mehr vorgesehen, dass zusätzlich zu dem Verschieben eines Teils der Dialogstruktur auch dann noch ein sehr aufwändiges Umprogrammieren des Quellcodes der Dialogstruktur erforderlich ist. Selbständig werden quasi durch das Verfahren die nach dem Verschieben eines bestimmten Teils der Dialogstruktur auf der graphischen Darstellung möglichen und/oder gewünschten Verknüpfungen erzeugt. Selbstverständlich kann in diesem Zusammenhang vorgesehen sein, dass darüber hinaus auch der Entwickler manuell in den Quellcode weitere Verknüpfungen einfügen kann oder diesbezüglich auch automatisch erstellte Verknüpfungen nach dem Kopieren und wieder Einfügen des Teils der Dialogstruktur löschen kann.It can thus automatically with such a copy and move from a part of the dialog structure when pasting at another place the dialogue structure then desired shortcut with other parts of the dialogue structure, such as communication rules, automatically generated. Preference is then no longer provided, then that in addition to move part of the dialog structure even then a very elaborate Reprogramming the source code of the dialog structure is required. Independent are quasi by the process after moving a certain part of the dialogue structure on the graph potential and / or desired connections generated. Of course may be provided in this context that beyond also the developer manually in the source code more shortcuts insert can or in this regard also automatically created shortcuts after copying and pasting the part of the dialog structure Clear can.
Vorzugsweise wird eine Kommunikationsregel durch eine Gruppe von Eingaben der Person und durch eine Gruppe von Ausgaben des Sprachsystems gebildet. Die Zusammenhänge in einer einzigen Kommunikationsregel können dadurch relativ komplex werden, wodurch jedoch die Kommunikationsmöglichkeiten zwischen der Person und dem Sprachsystem wesentlich erweitert werden können. Gerade bei einer derartigen Ausgestaltung einer Kommunikationsregel ist es besonders vorteilhaft während des Entwicklungsstadiums der Dialogstruktur diese Zusammenhänge graphisch darstellen zu können.Preferably becomes a communication rule through a group of inputs of Person and formed by a group of issues of the language system. Contexts in a single communication rule can thereby be relatively complex which, however, reduces the possibilities of communication between the person and the language system can be significantly expanded. Especially at Such an embodiment of a communication rule is especially beneficial during the developmental stage of the dialogue structure these relationships graphically to be able to represent.
Vorzugsweise wird das Modell mit Formulierungen und/oder Alternativen für Eingaben und Ausgaben ausgebildet, wobei deren Bearbeitung wiederum graphisch dargestellt werden kann.Preferably becomes the model with formulations and / or alternatives for inputs and expenditures, the processing of which in turn being graphic can be represented.
Vorzugsweise wird ein allgemeines Verzeichnis mit Formulierungen und/oder Alternativen für eine Eingabe und eine Ausgabe bei der Entwicklung für die Dialogstruktur erzeugt, wobei auch dieses allgemeine Verzeichnis mit seinen Inhalten graphisch dargestellt werden kann.Preferably becomes a general directory with formulations and / or alternatives for input and generates an output in the development for the dialogue structure, whereby also this general directory with its contents graphically can be represented.
Insbesondere werden mehrere Kommunikationsregeln zu einem Szenario zusammengefasst, welches graphisch angezeigt wird. Auch hier kann durch die Verknüpfung der Kommunikationsregeln eine äußerst komplexe Struktur in einem Szenario entstehen, wobei auch diesbezüglich durch die graphische Darstellung die Übersichtlichkeit beibehalten werden kann und grundsätzlich auch mögliche komplexe Zusammenhänge gegebenenfalls erst erkannt werden und dadurch auch die Nutzungsmöglichkeit des Kommunikationssystems wesentlich verbessert werden kann.Especially Several communication rules are combined into one scenario, which is displayed graphically. Again, by linking the Communication rules a very complex Structure arise in a scenario, and in this regard by the graphic representation the clarity can be maintained and in principle also possible complex relationships if necessary, be recognized first and thereby also the possibility of using the Communication system can be significantly improved.
Vorzugsweise wird einem Szenario ein definierter Startpunkt und/oder ein definierter Endpunkt in der graphischen Darstellung der Dialogstruktur zugeteilt. Dadurch können präzise ein oder mehrere Abläufe erkannt werden und insbesondere auch nachvollzogen werden, wie sie von einem festgelegten Startpunkt bis zu einem möglichen festgelegten Endpunkt gelangen können.Preferably a defined starting point and / or a defined Endpoint assigned in the graphical representation of the dialogue structure. Thereby can precise one or more processes be recognized and understood in particular, as they from a fixed starting point to a possible fixed end point can reach.
Vorzugsweise wird die Zuordnung dynamisch durchgeführt. Dadurch kann die Flexibilität nochmals erhöht werden.Preferably the assignment is performed dynamically. This allows the flexibility again elevated become.
Vorzugsweise wird die Zuordnung zu einem Szenario durch dynamische Einfügung einer Variablen und/oder durch dynamische Einfügung eines Platz halters und/oder durch dynamische Einfügung einer weiteren Funktion in die Antwort des Sprachsystems definiert. Die Nutzungsmöglichkeit der entwickelten Dialogstruktur kann dadurch nochmals wesentlich erweitert werden. Die Antworten des künstlichen Sprachsystems können somit aus verschiedensten Informationsteilen zusammengesetzt werden, welche nicht nur einerseits statisch vorgegeben werden, sondern andererseits situationsabhängig in vielfältiger Weise ergänzt werden können.Preferably is the assignment to a scenario by dynamic insertion of a Variables and / or by dynamic insertion of a place holder and / or through dynamic insertion of a further function defined in the response of the language system. The usage possibilities The developed dialogue structure can thus once more significantly be extended. The answers of the artificial language system can thus be composed of various information pieces, which not only statically given on the one hand, but on the other hand depending on the situation in more diverse Way complemented can be.
Vorzugsweise wird die vor einer Eingabe der Person durch das Sprachsystem geäußerte Antwort für das Verstehen der Eingabe herangezogen. Auch dadurch kann einerseits die Fehleranfälligkeit reduziert werden und die Kommunikation verbessert werden. Die Ausgabe unpassender oder unrichtiger Antworten kann dadurch deutlich reduziert oder ganz verhindert werden.Preferably becomes the answer to the input of the person through the language system for understanding the input used. This can also on the one hand, the error rate be reduced and the communication improved. The edition Inappropriate or incorrect answers can be significantly reduced or completely prevented.
Vorzugsweise wird innerhalb der Antworten des Sprachsystems ein Absprung in den Kontext eines anderen Szenarios definiert, wobei diese Absprungmöglichkeit ebenfalls wieder graphisch angezeigt wird. An beliebigen Stellen kann somit ein Eingabe-Ausgabe-Dialog beendet werden und zu einem davon völlig unterschiedlichen anderen Szenario im Hinblick auf eine davon unterschiedliche thematische Kommunikation zwischen der Person und dem Sprachsystem ermöglicht werden.Preferably is within the answers of the language system a bounce in the Context of another scenario defined, with this Absprungmöglichkeit also graphically displayed again. Anywhere Thus, an input-output dialog can be terminated and one of them completely different different scenario with regard to one of them different thematic communication between the person and the language system allows become.
Vorzugsweise wird die Dialogstruktur als Grundlage für ein Infotainmentsystem in einem Fahrzeug zur Kommunikation mit einem Fahrzeuginsassen entwickelt. Gerade im Fahrzeug steigt der Bedarf an Informationsübermittlung für einen Fahrzeuginsassen, insbesondere einen Fahrer, immer weiter an. Gerade da ist es somit besonders vorteilhaft, eine sehr umfassende und dennoch sehr präzise Dialogstruktur zu ermöglichen, durch welche eine hohe Verständlichkeit der Eingaben des Fahrzeuginsassen an das Sprachsystem einerseits gewährleistet wird und darüber hinaus eine präzise und leicht verständliche Antwort für den Fahrzeuginsassen ausgegeben werden kann. Da die Informationskomplexität im Fahrzeug immer mehr zunimmt und auch ein Infotainmentsystem im Fahrzeug immer komplexer wird, welches neben beispielsweise einer Rundfunkfunktionalität, einer CD-, einer DVD-, einer MP3-, einer Navigationsfunktionalität und dergleichen auch weitere Systeme, insbesondere Fahrerassistenzsysteme und Bordsysteme, umfasst, welche Informationen erzeugen, die an den Fahrzeuginsassen ausgegeben werden können, kann durch das erfindungsgemäße Verfahren ein Dialog im Fahrzeug wesentlich verbessert werden.Preferably, the dialogue structure is developed as the basis for an infotainment system in a vehicle for communication with a vehicle occupant. Especially in the vehicle, the need for information transmission for a Fahrzeugin increases sat, in particular a driver, on and on. Especially there, it is thus particularly advantageous to enable a very comprehensive and yet very precise dialogue structure, by which a high level of intelligibility of the inputs of the vehicle occupant is guaranteed to the voice system on the one hand and beyond a precise and easy-to-understand answer for the vehicle occupants can be issued. As the complexity of information in the vehicle increases more and more and an infotainment system in the vehicle is becoming increasingly complex, which in addition to, for example, a broadcasting functionality, CD, DVD, MP3, navigation functionality and the like also other systems, especially driver assistance systems and on-board systems includes , which generate information that can be output to the vehicle occupant, a dialogue in the vehicle can be significantly improved by the inventive method.
Ein Ausführungsbeispiel der Erfindung wird nachfolgend anhand schematischer Zeichnungen näher erläutert. Es zeigen:One embodiment The invention is explained in more detail below with reference to schematic drawings. It demonstrate:
In den Figuren werden gleiche oder funktionsgleiche Elemente mit den gleichen Bezugszeichen versehen.In The figures are the same or functionally identical elements with the provided the same reference numerals.
In
Zur
Entwicklung der Dialogstruktur
Die
beispielhaft graphisch dargestellte Dialogstruktur
Die
Eingabealternativen
Darüber hinaus
ist dem ersten Strukturteil
Der
erste Strukturteil
Das
dritte Strukturteil
Der
dritte Strukturteil
Der
zweite Strukturteil
Des
Weiteren umfasst das zweite Strukturteil
Beispielhaft
ist wiederum gezeigt, dass das Szenario
Der
zweite Strukturteil
Die
der Dialogstruktur
In
einfacher und aufwandsarmer Weise ist es möglich, die komplexe Struktur
darzustellen und einzelne Strukturteile
Natürlichsprachliche
Dialoge in der Datenverarbeitung umfassen die Verarbeitung einer
textuellen oder sprachlichen Eingabe in prosaischer Form. Auf Basis
dieser Eingabe wird meist auf der Grundlage einzelner Fallunterscheidungen,
welche in die Tausende gehen können,
eine passende Antwort ausgegeben. Die Antwort kann dabei ebenfalls
in textueller, sprachlicher oder bildlicher Form prosaischen Inhalts
erfolgen. Die Kommunikationsregeln können miteinander in Verbindung
gesetzt werden, um Gesprächsabläufe zu konzipieren.
Zur übersichtlicheren und
verbesserten Generierung solcher Dialoge werden diese und auch die
damit einhergehenden Verbindungen und Verknüpfungen der Dialogstruktur
Die graphische Modellierung beinhaltet die Bearbeitung einzelner Formulierungen sowie mehrerer Alternativen für die Eingabe als auch für die Ausgabe. Gruppen von Eingabe- und Anwortalternativen können zusammengesetzt werden, um eine Kommunikationsregel zu bilden. Die einzelnen Formulierungen können jeweils aus einem allgemeinen Verzeichnis für Eingaben als auch für Antworten gewählt werden. Mehrere Regeln, welche einen definierten Start- und Endpunkt haben können, können zu einem Szenario zusammengesetzt werden. Alle Szenarien stehen vorzugsweise damit im Zusammenhang. Abhängig vom erstellten Szenario können Eingabe- und Antwortalternativen mehrfach existieren, wobei sie durch die Zuordnung zu einem Szenario unterschieden werden können. Die Zuordnung zu einem Szenario kann auch dynamisch in die Antwort in Form einer Variablen aufgenommen werden. Ebenso kann diesbezüglich ein Platzhalter oder eine weitere Funktion dynamisch in die Antwort eingebunden werden. Ebenso kann die zuvor geäußerte Antwort des künstlichen Sprachsystems als Voraussetzung für das Verstehen einer nachfolgenden Eingabe herangezogen werden.The graphical modeling involves the processing of individual formulations as well as several alternatives for the input as well the edition. Groups of input and response alternatives can be put together to form a communication rule. The individual formulations can in each case from a general directory for inputs as well as for answers chosen become. Several rules that define a defined start and end point can have, can be assembled into a scenario. All scenarios are available preferably related thereto. Depending on the scenario created can Input and response alternatives exist multiple times, by the assignment to a scenario can be distinguished. The Assignment to a scenario can also be dynamic in the response Form of a variable. Similarly, in this regard Placeholder or another function dynamically in the response be involved. Likewise, the previously expressed answer of the artificial Language system as a prerequisite for understanding a subsequent Input be used.
Innerhalb der Antworten kann auch ein expliziter Absprung in den Kontext eines anderen Szenarios enthalten sein. Auch lassen sich die bereits zu einem Szenario zusammengestellten Kommunikationsregeln kopieren, indem das gesamte Szenario umbenannt und in einen anderen Zusammenhang eingebunden wird.Within The answers can also be an explicit jump into the context of a be included in other scenarios. Also, the already can be copying communication rules compiled in a scenario, by renaming the whole scenario and putting it into a different context becomes.
Bei
dem in
In
Zum Erzeugen der Sprachgrammatik für das künstliche Sprachsystem werden der Sprachgrammatik einzelne Worte und/oder Wortkombinationen zugrunde gelegt. Der Kommunikation wird ein Satz von Kommunikationsregeln mit jeweils einer Eingabe einer Person und einer korrespondierenden Ausgabe des Sprachsystems zugeordnet, und zumindest eine Eingabe der Person in das Sprachsystem wird einem der Sprachgrammatik zugrunde gelegten Wort und/oder einer Wortkombination zugeordnet.To the Generating the speech grammar for the artificial one Language system are the speech grammar single words and / or Based on word combinations. The communication becomes a sentence of Communication rules with one input each of a person and associated with a corresponding output of the speech system, and at least one input of the person in the language system becomes one of Speech grammar underlying word and / or a word combination assigned.
Gemäß der Darstellung
in
Die
Zuordnung einer Eingabe zu einem Wort und/oder einer Wortkombination
wird durch eine automatische Konvertierung durchgeführt und
dadurch die Sprachgrammatik definiert. Diesbezüglich wird die automatische
Konvertierung durch ein entsprechendes Konvertierungsverfahren durchgeführt, wie dies
in
Bei
der erzeugten Sprachgrammatik
Bei der automatischen Konvertierung werden einzelne Alternativen einer Eingabe analysiert und abhängig davon eine zu priorisierende Konvertierung und somit eine Zuordnung einer Alternative zu einem Wort und/oder einer Wortkombination durchgeführt. Die automatische Konvertierung kann insbesondere abhängig von einem Platzhalter und/oder einer Variablen und/oder zumindest einer Funktion in einer Alternative einer Eingabe durchgeführt werden. Ein Platzhalter kann diesbezüglich beispielsweise ein Füllwort wie „äh" oder dergleichen sein.at The automatic conversion will become one single alternatives Input analyzed and dependent of which a prioritized conversion and thus an assignment an alternative to a word and / or a word combination. The automatic conversion may depend in particular on a placeholder and / or a variable and / or at least one function in an alternative an input performed become. A wildcard in this regard may be, for example, a noise word such as "er" or the like.
Ein Variable kann insbesondere durch einen Wert eines Betriebsparameters eines Geräts oder eines Systems oder durch einen sonstigen Ergebniswert definiert werden. Insbesondere können hier beispielsweise technische Geräte in einem Fahrzeug, wie Motor, Klimaanlage, Fahrerassistenzsysteme und dergleichen genannt werden.One In particular, variable can be defined by a value of an operating parameter of a device or a system or other result value become. In particular, you can here for example technical devices in a vehicle, such as engine, Air conditioning, driver assistance systems and the like may be mentioned.
Eine Funktion wird insbesondere durch eine Hilfefunktion und/oder eine Funktion zur Änderung eines Profils einer Kommunikationsregel oder einer Verknüpfung von Regeln zueinander definiert.A Function is in particular by a help function and / or a Function to change a Profile of a communication rule or a link from Rules defined to each other.
Die
bereits erwähnten
Kommunikationsregeln eines natürlichsprachlichen
Kommunikationssystems bestehen aus einem Eingabeteil und einem Antwortteil.
Der Eingabeteil kann dabei durch den Benutzer in textueller, sprachlicher
oder sonstiger Form geäußert werden.
Eine sprachliche Äußerung kann
mit Hilfe einer Spracherkennung das akustische Signal erkennen und
in maschinenlesbare Form konvertieren. Bekannte Wörter oder
Wortkombinationen, so genannte Phrasen, werden als Sprachgrammatik bezeichnet
und vor der Laufzeit der Spracherkennung erstellt und bereitgestellt.
Da die einzelnen Phrasen der Sprachgrammatik inhaltlich den möglichen
Benutzereingaben innerhalb des Regelwerks
In
Ist das künstliche Sprachsystem derart ausgebildet, dass es abhängig von einem Erkennen einer Eingabe der natürlichen Person eine Antwort ausgeben kann, so ist hier insbesondere vorgesehen, dass das Sprachsystem neben einer akustischen und/oder textuellen Eingabe der Person zumindest eine weitere davon unterschiedliche Information als Eingabe erkennen kann.is the artificial one Language system designed such that it depends on a recognition of a Entering the natural Person can give an answer, so here is provided in particular, that the language system in addition to an acoustic and / or textual Entering the person at least one more different Can recognize information as input.
Als weitere Information bezüglich einer Eingabe kann in diesem Zusammenhang eine Geste der Person und/oder eines Bedienelements durch die Person und/oder eine von dem Sprachsystem unterschiedlichen technischen Gerät generierte Information verstanden werden.When further information regarding An input can in this context be a gesture of the person and / or an operating element by the person and / or one of the language system generated different technical device Information to be understood.
Das
Kommunikationssystem
Darüber hinaus
sind technische Geräte
vorgesehen, welche Informationen erzeugen können, die das Sprachsystem
als Eingabe erkennen und verwerten kann. In diesem Zusammenhang
können
ein optischer Sensor
Vorzugsweise
ist vorgesehen, dass die durch die akustische Eingabe und/oder die
textliche Eingabe erzeugten Signale direkt an das künstliche Sprachsystem
Der
grundlegende Mechanismus einer Kommunikation zwischen einem künstlichen
Sprachsystem
Vorzugsweise
ist vorgesehen, dass bei einer derartig multifunktionalen Möglichkeit
einer Erkennung unterschiedlichster Informationen durch das Sprachsystem
Es
ist bei dem Kommunikationssystem
Vorzugsweise werden die Bewegung des Avatars und/oder die Gestaltung des Avatars und/oder die visuell dargestellte Umgebung des Avatars von den als Antwort durch das Sprachsystem auszugebenden Informationen gesteuert, wobei insbesondere eine Synchronisierung, vorzugsweise eine automatische Synchronisierung, zwischen der Bewegung des Avatars und/oder der Gestaltung des Avatars und/oder der visuell dargestellten Umgebung des Avatars mit den als Antwort ausgegebenen Informationen durchgeführt wird.Preferably be the movement of the avatar and / or the design of the avatar and / or the visually presented environment of the avatar of the in response controlled by the language system information, wherein in particular a synchronization, preferably an automatic Synchronization, between the movement of the avatar and / or the Design of the avatar and / or the visual environment of the Avatars with the information output in response.
Beim
Einsatz des Kommunikationssystems
Die
Visualisierung und Steuerung eines virtuellen Wesens erfordert die
Abstimmung mit den Inhalten, die durch dieses Wesen vermittelt werden
sollen. Aus diesem Grund ist es wichtig, dass das Aussehen und die
Bewegung sowie das virtuelle Umfeld des virtuellen Wesens durch
den auszugebenden Inhalt gesteuert werden. Dies kann insbesondere
dann erfolgen, wenn die Antwortalternativen des Sprachsystems
Vorzugsweise
wird eine Bewegung des Avatars oder eines Körperteils des Avatars mit einer
Abfolge von durch das Sprachsystem
Vorzugsweise
wird die Verknüpfung
abhängig
von einer von dem Sprachsystem
Neben einer einfachen Lippenbewegung kann diesbezüglich auch die Bewegung jeglicher anderer Körperteile des Avatars auf die situationsbezogen erforderliche Ausgabe synchronisiert werden.Next a simple lip movement in this regard, the movement of any other body parts the avatar synchronizes to the situation-specific output required become.
Auch dann, wenn keine explizite Sprachausgabe erfolgen soll, sondern lediglich eine visuelle Darstellung von Handlungen oder Abläufen, kann auch diesbezüglich eine exakte Synchronisierung erfolgen. So kann in diesem Zusammenhang beispielsweise auch eine Wartungs- oder Instandsetzungsanleitung an einen Fahrzeugnutzer visuell ausgegeben werden, indem beispielsweise auf einem Bildschirm ein akustisch nicht hinterlegter Text angezeigt wird, welcher durch die Bewegungen und Handlungen des visuell dargestellten Avatars demonstriert wird. Auch diesbezüglich kann die korrekte Bewegung und Handlung des Avatars zeitgenau auf den spezifisch gezeigten Text synchronisiert werden. In diesem Zusammenhang können beispielsweise Einstellungen von Systemen im Fahrzeug, wie beispielsweise Radio, CD-Spieler und dergleichen, oder auch selbstdurchzuführende Wartungsarbeiten, wie Kontrolle des Ölstands, Kontrolle der Scheibenwaschflüssigkeit und dergleichen erläutert werden.Also then, if no explicit speech should be made, but just a visual representation of actions or procedures, too in this regard an exact synchronization takes place. So in this context For example, a maintenance or repair manual to be visually output to a vehicle user, for example On a screen, an acoustically unmarked text is displayed becomes, which through the movements and actions of the visually represented Avatars is demonstrated. Also in this regard, the correct movement and action of the avatar timely to the specific shown Text to be synchronized. In this context, for example Settings of systems in the vehicle, such as radio, CD player and the like, or self-service, like checking the oil level, Check the windscreen washer fluid and the like explained become.
In diesem Zusammenhang kann dann auch die Synchronisierung des auf der Anzeigeeinheit dargestellten Umfelds des Avatars entsprechend angepasst werden und beispielsweise bei einer Erläuterung zur Füllstandskontrolle des Motoröls im Hintergrund des Avatars der Motorraum des spezifischen Fahrzeugtyps dargestellt, insbesondere relativ detailgetreu dargestellt, werden. Weitere Beispiele sind die Erläuterung der Durchführung eines Reifenwechsels oder eines Fremdstarts etc.. Dadurch kann für einen Nutzer bei relativ komplexen Abläufen oder Handlungen oder Einstellungen der rein textlichen und/oder akustischen Mitteilung auch die Darstellung in bewegten Bildern unterstützend ermöglicht werden, was sehr hilfreich sein kann.In this connection can then sync on the environment of the avatar displayed corresponding to the display unit be adapted and for example in an explanation for level control of the engine oil in the background of the avatar the engine compartment of the specific vehicle type represented, in particular relatively detailed represent, be. Further examples are the explanation the implementation a tire change or a third-party etc. etc. This allows for a user in relatively complex processes or acts or attitudes of purely textual and / or acoustic Communication also allows the presentation in moving images supporting what can be very helpful.
In
Durch
diese Struktur wird die Ausgabe von Informationen natürlicher
Sprache mittels eines künstlichen
Sprachsystems
Vorzugsweise
wird ein Wert eines Zustandsparameters durch einen Platzhalter in
einer definierten in dem Sprachsystem
Während der Verarbeitung von Ereignissen des Bordsystems, beispielsweise eines Bussystems, in einem Fahrzeug, die der multimodalen Eingabe des natürlich sprachlichen Sprachsystems zuzurechnen ist, kann der Zugriff auf Informationen aus den Bordinformationssystemen auch während der Generierung der Antwortalternative eine Rolle spielen. So können in Antworten aktuelle Werte und Stati des Fahrzeugs oder von Teilkomponenten davon eingebunden werden, um Informationen akustisch auszugeben. Dies kann beispielsweise die Ansage der aktuellen Geschwindigkeit oder der Motortemperatur sein.During the processing of events of the on-board system, for example a bus system, in a vehicle which is attributable to the multimodal input of the natural language system, the access to information from the on-board information systems may also play a role during the generation of the answer alternative. In this way, current values and statuses of the vehicle or subcomponents thereof can be integrated in responses in order to output information acoustically. This can be, for example, the announcement of the current speed or the engine temperature be.
Diese Eigenschaft kann insbesondere dann zum Tragen kommen, wenn ein physisches Anzeigeinstrument im Fahrzeug für die Ausgabe eines entsprechenden Werts vorgesehen ist.These Property can come into play especially if a physical Indicator in the vehicle for the output of a corresponding value is provided.
Wird
bei der Verarbeitung einer derartigen Antwort ein entsprechender
Platzhalter, welcher vorab definiert und hinterlegt wird, erkannt,
wird der zu diesem Platzhalter gehörige Wert aus dem Bordinformationssystem
ermittelt und eingebunden. Dies ist in
Der
Zugriff wird somit in Form eines Platzhalters in die Formulierung
einer Antwort integriert. Die Einbindung des Werts des Platzhalters
kann sowohl innerhalb eines Antworttextes der Fall sein, kann aber
auch bereits bei der Auswahl einer Antwort erfolgen, wenn die Ausgabe
einer Antwort mit einer spezifischen Bedingung verknüpft ist.
Die Identifikation des Platzhalters mit dem Zugriff auf das Bordinformationssystem
Die
Schnittstellenkomponente
Die
Schnittstellenkomponente
Durch die erläuterte Vorgehensweise kann ermöglicht werden, dass in statische Komponenten einer Antwort dynamische Teile eingefügt werden können, die darüber hinaus dynamisch angefragt werden können.By the explained Approach can be made be that in static components of a response dynamic parts added can be the above can be dynamically requested.
Claims (15)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102007042582A DE102007042582A1 (en) | 2007-09-07 | 2007-09-07 | Dialogue structure i.e. infotainment system substructure, developing method for artificial language system in vehicle for communication with passenger, involves graphically plotting defined communication rules and connection between rules |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102007042582A DE102007042582A1 (en) | 2007-09-07 | 2007-09-07 | Dialogue structure i.e. infotainment system substructure, developing method for artificial language system in vehicle for communication with passenger, involves graphically plotting defined communication rules and connection between rules |
Publications (1)
Publication Number | Publication Date |
---|---|
DE102007042582A1 true DE102007042582A1 (en) | 2009-03-12 |
Family
ID=40339974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE102007042582A Withdrawn DE102007042582A1 (en) | 2007-09-07 | 2007-09-07 | Dialogue structure i.e. infotainment system substructure, developing method for artificial language system in vehicle for communication with passenger, involves graphically plotting defined communication rules and connection between rules |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE102007042582A1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11505209B2 (en) | 2017-11-09 | 2022-11-22 | Continental Automotive Gmbh | System for automated driving with assistance for a driver in performing a non-driving activity |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5168548A (en) * | 1990-05-17 | 1992-12-01 | Kurzweil Applied Intelligence, Inc. | Integrated voice controlled report generating and communicating system |
US20020010585A1 (en) * | 2000-06-08 | 2002-01-24 | Interactive Speech Technologies | System for the voice control of a page stored on a server and downloadable for viewing on a client device |
-
2007
- 2007-09-07 DE DE102007042582A patent/DE102007042582A1/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5168548A (en) * | 1990-05-17 | 1992-12-01 | Kurzweil Applied Intelligence, Inc. | Integrated voice controlled report generating and communicating system |
US20020010585A1 (en) * | 2000-06-08 | 2002-01-24 | Interactive Speech Technologies | System for the voice control of a page stored on a server and downloadable for viewing on a client device |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11505209B2 (en) | 2017-11-09 | 2022-11-22 | Continental Automotive Gmbh | System for automated driving with assistance for a driver in performing a non-driving activity |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2200858B1 (en) | Vehicle system comprising an assistance functionality | |
EP1986889B1 (en) | Device and method for interactive information dispensing and/or assistance for the user of a motor vehicle | |
DE102006039126A1 (en) | Method for speech recognition and speech reproduction | |
EP3644148A1 (en) | Test terminal for tests of an infrastructure of a vehicle | |
WO2018069027A1 (en) | Multimodal dialog in a motor vehicle | |
DE102007037567A1 (en) | Method for multimodal operation of at least one device in a motor vehicle | |
DE102007042583B4 (en) | Method for communication between a natural person and an artificial speech system and communication system | |
EP2300258B1 (en) | Communication system and method for representing information in a communication | |
DE102017206876B4 (en) | Method of operating a voice control system in a motor vehicle and voice control system | |
EP1121684B1 (en) | Method and device for information and/or messages by means of speech | |
DE102009030263A1 (en) | Method for controlling menu-based operation and information system of vehicle, involves displaying menu and forming controlling element for controlling menu | |
DE102010051833A1 (en) | Method for performing interaction of vehicle system with user in motor vehicle, involves satisfying logical state-specific transition condition of initial state, if evaluated user input coincides with predetermined user input | |
DE102007042582A1 (en) | Dialogue structure i.e. infotainment system substructure, developing method for artificial language system in vehicle for communication with passenger, involves graphically plotting defined communication rules and connection between rules | |
EP1944664B1 (en) | Troubleshooting method for an automation controller | |
EP3115886B1 (en) | Method for operating a voice controlled system and voice controlled system | |
DE102007042580A1 (en) | Person i.e. passenger, and artificial language system communication enabling method for vehicle, involves recognizing acoustic and/or textual input of person by language system and different information as input by system | |
DE102017211447B4 (en) | Method for selecting a list entry from a selection list of an operating device by means of voice control and operating device | |
DE102008025532B4 (en) | A communication system and method for performing communication between a user and a communication device | |
DE102007042579A1 (en) | Method for producing language grammar for artificial language system to communicate with natural person, involves arranging input of person and corresponding output of language system to communicate sentence | |
DE102007042581A1 (en) | Method for display of information in natural language, involves integrating value of state parameter deposited in language system with response structure, and searching assigned retainer in response of artificial language system | |
EP3576084B1 (en) | Efficient dialog design | |
DE102008045123B4 (en) | Assistance and information device in a motor vehicle and method for outputting information | |
DE102005010230B4 (en) | Method for outputting help information | |
DE102016004287A1 (en) | Method for speech recognition in a motor vehicle | |
EP1826687B1 (en) | Method and device for program supported handling of technical documentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OM8 | Search report available as to paragraph 43 lit. 1 sentence 1 patent law | ||
OP8 | Request for examination as to paragraph 44 patent law | ||
R016 | Response to examination communication | ||
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20140401 |