• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Spracheingabe und -erkennung

OP
rbest

rbest

Hacker
das hatte ich auch gefunden, aber aus diesem Grund nicht installiert. Vielleicht warte ich lieber noch ...
 

abgdf

Guru
Also, ich lege sehr viel Wert auf Spracherkennung und habe daher auch verschiedene Programme aus meiner Windows-Zeit, die aber glücklicherweise schon etwas her ist (das heißt, die Programme sind etwas älter ;) ).

CMU_Sphinx: Hab' ich mal probiert, leider völlig unbenutzbar. Auch in einschlägigen Foren (und sogar in einem Uni-Seminar, das sich damit befasste) gab es niemanden, der das für den normalen Einsatz hätte benutzbar machen können.

Simon listens: Also, da gibt es erstmal zwei Zusätze, die man dazubeschaffen muß, siehe hier. An dem wichtigsten Zusatz, der Engine, hält ausgerechnet Microsoft die Rechte, siehe hier, es ist also nicht wirklich freie Software. Obwohl nach Registrierung kostenlos erhältlich.
Tja, ich hab' mir also den Kram besorgt (simon, HTK, Hadi-Bomp).
HTK-Kompilieren ging halbwegs, außer die "Tools", die nicht.
"make test" klappte auch nicht so richtig. Könnte aber trotzdem laufen.
Ok, Simon erkennt dieses Hadi-Bomp-Vokabular.
Und nun? Verstehe nicht ganz, wie man nun HTK einbindet.
Das ist bei mir Stand der Dinge. Wäre gut, wenn mal deren Installations-Wiki aktualisiert würde. Oder wenn sie eine intuitivere Installations-Oberfläche im Programm hätten. Dazu gibt es auch einen Blog-Eintrag, in dem aber auch nicht erklärt wird, wie man's nun genau installiert. Aber es soll angeblich irgendwie gehen, siehe z.B. dieses Youtube-Video.

"Dragon on Wine" wäre eine Idee. Ich konnte z.B. mein "Dragon NatSpeak. 7 Deutsch" mit wine (aus OpenSuSE 12.1) zum Laufen bringen. Es hatte auch die schon unter Windows bemerkenswerte, hohe Erkennungsrate und lief auch schnell. Leider verlor es in der praktischen Anwendung immer den Diktierfokus zum DragonPad. War am Ende also doch so nicht einsetzbar. :(
Version 10 hat in der Wine-Datenbank ja ganz gute Werte, diese Version hab' ich aber nicht.

Im Jahr 2000 war mal "IBM Viavoice für Linux" Teil des "Mandrake Linux PowerPack deluxe 7.2, Deutsch". Ich gebe zu, das ist ziemlich exotisch und heute wohl nur noch schwer zu beschaffen. Der alte ClosedSource-Code läuft nicht mehr auf OpenSuSE 12.1 direkt. Aber ich konnte mit Virtualbox ein SuSE 8.1 aufsetzen. Die AC'97-Audio-Emulation davon bot auch Audio-In (was bei der SB16-Emulation leider nicht der Fall war und erst zu ein paar Fehlversuchen geführt hat). SuSE 8.1 erkennt die virtuelle AC'97-Karte auch. Na ja, dann hat dieses alte "IBM Viavoice für Linux" immer noch eigene Installationsschwierigkeiten, man muß z.B. das mitgelieferte Java einsetzen. Nachdem auch die gelöst waren, habe ich jetzt also tatsächlich das alte ViaVoice in einer Virtualbox.
Ok, diese Spracherkennungs-Engine ist halt 12 Jahre alt, trotzdem ist es immer noch nicht schlecht.

Was auch geht, ist mit Virtualbox (und der genannten AC'97-Audio-Emulation) z.B. ein Windows 2000-System aufzusetzen. Damit kann man mit einiger Wahrscheinlichkeit die Windows-Spracherkennungsprogramme (die unter Win2000 laufen) verwenden. Ich hab' eins probiert (PowerDictate Professional (sehr altes Dragon mit diskretem Diktieren)), geht. Aber wer will schon Windows ...

Das scheint so der Stand der Dinge zu sein. Es ist nicht optimal, bisher kein wirklich freies Programm in Sicht (obwohl Simon Potential hat. Außerdem gab es 2004 auch mal diese Meldung über IBM, hab' davon aber bisher nichts weiter gehört). Trotzdem habe ich Spracherkennung unter Linux! :)
 
OP
rbest

rbest

Hacker
eigentlich schade, aber das wäre mir doch zu viel aufwand. Dann benutze ich liebe mein smartphone. Geht auch Ganz Gut wie man sieht.
 
Oben