Sprachsteuerungen und mehr oder weniger intelligente digitale Assistenten warten heute überall: in Autos, im Netz und auf Smartphones sowieso oder auch in der Officesoftware. Manche hören rund um die Uhr zu, andere lassen sich mit einem Klick aktivieren. Mit Künstlicher Intelligenz über große Sprachmodelle (Large Language Models oder LLMs) bis hin zu kontinuierlicher Verbesserung und Individualisierung durch Maschinelles Lernen (ML) wollen die Systeme mit den fortschrittlichsten Innovationen alles besser, einfacher und schneller machen. Wozu sollten Sie Ihren nächsten Text dann noch tippen, wenn Sie ihn viel leichter einsprechen oder diktieren könnten? Das würde wohl vieles in der täglichen Büroarbeit, im Service oder bei anderem Kontakt mit Kunden verändern. Doch ist die Technik dafür wirklich schon weit genug? Schauen wir kurz in die Praxis und den Alltag der Büroarbeit 2025:
Daten und Informationen müssen gespeichert und weitergeleitet werden
Das ist eine der Grundlagen des traditionellen Offices wie in der Zukunft der Büroarbeit. Zuerst Schreibwerkzeuge, dann Schreibmaschinen und später Computertastaturen hielten oder halten alles fest. Jedes dieser Mittel kann mit etwas Übung in enormer Geschwindigkeit große Informationsmengen zu Papier bringen oder in Dateien schreiben. Ein paar Beispiele:
- In normaler Handschrift (sogenannter Langschrift) schreiben die meisten etwa 40 bis 50 Silben pro Minute. Zur Verdeutlichung: das Wort „Büroeinrichtung“ kommt auf fünf Silben.
- Um noch schneller mit der Hand schreiben zu können, entstanden Verkehrs- und Eilschriften bis hin zur Stenografie wie mit der Deutschen Einheitskurzschrift (DEK). So ließen sich bis an die 500 Silben in einer Minute erfassen.
Mit Stenografie oder Steno finden Sie einen der ersten Ansätze zur Effizienzsteigerung in der Büroarbeit. Jetzt musste keiner mehr selbst zum Stift greifen, um langsam und mühsam Anweisungen, Inhalte oder Korrespondenz auf ein Papier zu bringen. Nun wurde einfach nach einer Sekretärin gerufen, die der Stenografie mächtig war und leicht mit einem durchschnittlichen Sprecher mithalten konnte, der rund 250 Silben pro Minute von sich gibt.
Steno gehörte schnell zur Grundausbildung von Büroassistenzen wie bald das Maschinenschreiben mit dem Zehn-Finger-System. Wer von Ihnen hat das noch gelernt? Wenn Sie darin richtig gut sind, schaffen Sie in der Minute etwa so viele Silben wie Steno-Profis: knapp 500. Gemessen in einzelnen Anschlägen erreichen Sie mit Werten Richtung 7000 Rekordnähe.
Schreiben oder Tippen vs. Spracheingabe bei der Büroarbeit: Wer gewinnt?
Außer für Anmerkungen in Dokumenten oder für kleine Notizen spielt die Handschrift im modernen Office keine Rolle mehr. Die Niederschrift von Diktaten auf Steno-Blöcken sehen Sie heute höchstens noch in Wiederholungen alter Filme und Serien. Dieser Tage wird nur noch getippt oder gesprochen.
Beim Tippen hat das Zehn-Finger-System mit wissenschaftlicher Bestätigung schon lange seinen Goldstandard zum Festhalten von Informationen verloren, stellte vor rund zehn Jahren die finnische Aalto University fest. Mit flinken Fingergelenken und ein bisschen Übung tippen Sie auch mit (viel) weniger Fingern genauso schnell wie Zehn-Finger-Könner(innen).
Damit liegt die Latte beim Tempo sehr hoch für jede Spracherkennung. Zudem muss sie bei der Texterfassung neben Geschwindigkeit noch weitere anspruchsvolle Fertigkeiten zeigen. Bei einer korrekten Rechtschreibung beginnen diese gerade erst. Intelligente Spracherkennung muss daneben jede Sprechpause richtig interpretieren können. Kommt hier ein Satzzeichen hin? Und wenn ja, welches? Oder überlegen die Sprechenden gerade nur ein paar Sekunden für die nächsten Worte?
Hinzu kommen akustische oder technische Aspekte. Selbst mit einem Headset kann schlecht ausgereifte Mikrofontechnik zusätzlich Bruchstücke aus der Unterhaltung von Kolleginnen und Kollegen in der Nähe oder die Nachrichten aus dem Schreibtischradio auffangen und zusammen mit Ihrem Diktat frei von vielen Satzzeichen zu einem wirren Kauderwelsch auf dem Bildschirm vermengen.
Probieren Sie es einmal aus! Na, wie läuft es? Wir sind gespannt auf Ihre Kommentare! 😊
Ohne den Spaß verderben oder spoilern zu wollen … Aber:
Voice setzt sich (noch lange) nicht durch
Die MUUUH! Voice Studie 2025 hat es schon in größeren Dimensionen untersucht. Ja, eine Mehrheit sieht viel Potenzial in Sprachsteuerung oder Spracherkennung oder allgemein Voice. Doch in der Praxis schlägt die Mehrheit bei den derzeitigen Ergebnissen einer Nutzung genauso die Hände über dem Kopf zusammen.
Ein Effizienz- oder Zeitvorteil ist kaum erkennbar. Eher sinkt die Effizienz und Bearbeitungszeiten steigen. Selbst die fortschrittlichste generative KI bleibt gerade (noch) weit hinter menschlichen Qualitäten zurück. Lokale KI-Lösungen sind Mangelware und daneben gibt es viele Datenschutzbedenken. Alle führenden KIs kommen aktuell aus den USA oder vermehrt auch aus China. In puncto Datenschutz haben diese längst nicht die europäischen oder deutschen Standards adaptiert wie zum Beispiel die weltweit führenden DMS unseres Partners DocuWare. Zuletzt hat es Voice bisher nicht geschafft, in der Arbeitskultur anzukommen. Für viele erscheint es schlicht ungewohnt bis unangenehm, ohne konkreten Gesprächspartner im Raum oder am Telefon quasi mit sich selbst zu sprechen.
Am Ende sollte man Voice, Spracherkennung oder -steuerung deswegen aber nicht gleich in der Praxis oder in Gedanken ausmustern. Die Technologie hat Zukunft, doch sie muss noch ordentlich reifen. In der Digitalisierung kann das ganz schnell passieren. Bleiben Sie dran mit dem Blog der HAIN® GmbH!