Digitales Übungsmaterial für das systematische (silbenbasierte) Lesenlernen unter Nutzung von Spracherkennungalgorithmen

Prof. Dr. Daniel D. Hromada & Prof. Dr. Christa Röber

das Ende

info@fibel.digital

lesen.digital fibel.digital

@DigiEduBerlin

Spracherkennung

wir nutzen keine Cloud, sondern setzen nur unsere eigenen Spracherkennungssysteme oder Open-Source-Systeme ein, die auf billigen, klasseninternen Computern (Raspberry pi 4, NVIDIA Jetson) laufen können

zur Zeit benutzen wird den akustischen Model "DeepSpeech" der auf der Corpus Common Voice der deutschen Sprache traniert wurde *

wir benutzen unsere "hausgekochte" language models (palope.scorer, silben.scorer u.s.w.)

https://github.com/hromi/lesen-mikroserver

* Verbündete gesucht

* nachdem wir genug Audiotexte von deutsch-Unterricht Leher*innen und Kindern gesammelt haben werden haben wir vor, die Alphabet des akustischen Modells um schwa-Vokalen zu erreichen und das ganze mithilfe von sogennanten "Transfer Learning" Algorithmen neu zu trainieren.

https://fibel.digital

Web-Komponente des Projekts "Digital Primer" (c.f. 10.3917/enf2.193.0345, 10.35745/eiet2021v01.01.0005)

basiert auf der Datenbank struktur der Kastalia Knowledge Management System

wir können ziemlich schnell und problemlos von 5 Benutzern auf Tausende von Benutzern aufstocken

jeder Lehrer kann eigene Curricula bauen, was ihr bis jetzt gesehen habt ist nur ein Ausschnitt von "what is to come"

spielerisch jedoch didaktisch sinnvoll

Stimme (möglicherweise auch Akzent) wählen, Schriftart, Kapitalisierungsart, Wiedergabegeschwindigkeit u.s.w.

verschiedene Übungen (lesen, hören, paaren)

viele neue Übungen (z.B. "echo", "chor-lesen", "mitschreiben", "mach mit!") und Motivationsmechanismen (e.g. Fibelschnitzeljagd) werden kommen

Hauptprinzip: Fokus auf essentiel, keine Aufmerksamkeitüberlastung durch unnötige Animationsquatsch u.s.w.

Spracherkennung

wir nutzen keine Cloud, sondern setzen nur unsere eigenen Spracherkennungssysteme oder Open-Source-Systeme ein, die auf billigen, klasseninternen Computern (Raspberry pi 4, NVIDIA Jetson) laufen können

zur Zeit benutzen wird den akustischen Model "DeepSpeech" der auf der Corpus Common Voice der deutschen Sprache traniert wurde *

wir benutzen unsere "hausgekochte" language models (palope.scorer, silben.scorer u.s.w.)

https://github.com/hromi/lesen-mikroserver

* Verbündete gesucht

* nachdem wir genug Audiotexte von deutsch-Unterricht Leher*innen und Kindern gesammelt haben werden haben wir vor, die Alphabet des akustischen Modells um schwa-Vokalen zu erreichen und das ganze mithilfe von sogennanten "Transfer Learning" Algorithmen neu zu trainieren.

Audiotexten

Audiotext ist von mir Entwickelter Format der Audio-segmenten mit Buchstaben-sequenzen koppelt.

zu diesem Zeitpunkt enthält die Datenbank von fibel.digital 12165 Audiotextaufnahmen von 17 Stimmen

silbenbasierte Methode

Sequenzen

Interaktion zweier wichtiger kognitiver Prozesse: Wiederholung und Variation (c.f. Begriff der "variation sets" in Sprachentwicklungpsychologie)

Verstärkung der wichtigen neurolinguistischen Strukturen (c.f. Hebb-Gesetz)

Kinder lieben solche Sequenzen und sind die unanfechtbare Weltmeister in ihren Herstellung !

Link 1

https://fibel.digital/Curriculum::deutsche Sprache::Silben::Sequenzen

Farben

Farbe der Silbe darstellt Art ihrer Aussprache

dementsprechend gibt Silbenfarbe auch ein Indiz dazu, wie der Silbenkern (e.g. Vokal) auszusprechen ist

Silben mit langen Vokalen: blau; Silben mit kurzen Vokalen: rot; Reduktionssilben: gelb

auch genauere Bezeichnungen sind möglich (Konsonanten: schwarz; Rand nasale -> grün; plosive -> orange; frikative -> rot;) diese werden aber zu diesem Zeitpunkt im fibel.digital nicht implementiert

kanonische Farben-kodierung ist in der Fibel-reihe Zirkus Palope (Röber et al.) zu finden

Link 0

https://fibel.digital/Curriculum::deutsche Sprache::Silben

Theoretische Grundlagen

historisch-didaktische Grundlagen

fast alle bisyllabische Wörter (REFREF) teutschen Ursprungs wiesen trochäische Struktur auf

Trochäus: betonte Silbe wird von den unbetonten gefolgt (e.g. /liː/ + /bə/)

Beobachtung

Trochäische Wörter sind genau die Wörter mit denen der Leseunterricht anfängt

Z.b. zwischen 11 Wörter die auf ersten zwei Seiten des Tinto-erstlesebuch (Cornelsen Verlag) auftauchen sind 3 mono-syllabisch (in, der, Tim), 7 bi-syllabisch mit Trochäus (Schule, Name, Tinto, Lena, Fatma, Jonas, Tafel) und ein bi-syllabisches Wort nicht-deutscher Herkunft

linguistisch-semiotische Grundlagen

Vokalen sind Silben

ein Kon-sonant muss immer mit einem Vokal aktiviert werden (es ist unmöglich ein Kon-sonant an sich auszusprechen)

Buchstaben (Graphemen) und Phonemen sind zwei Gegenständarten unterschiedlicher Natur zwischen denen keine 1-1 Korrespondenz existiert

was die Kinder heutzutage lernen als phonetische Werte einer Konsonantbuchstabe sind lediglich "Buchstabenamen" die auch anders klingen konnten

Beispiel

Beispiel: es besteht immer ein bißchen Streit zwischen den Lehrer*innen die für Buchstabe M der Buchstabenamen /em/ benutzen, und denjenigen die der Buchstabenamen /mə/ bevorzügen

Rätsel: warum gibt es es im Fall von Buchstabe B keinen solchen Konflikt zwischen den Befürwortern von /bə/ und /eb/ ?

kognitive Grundlagen

Silben, nicht Phonemen, sind linguistische Universalien (c.f. Jackendoff: Foundations of Language)

Silben sind kognitive Bausteine der Sprache (c.f. Hromada: Prolegomena Paedagogica :: On syllables and chunking)

Phoneme ist ein wissenschaftliches Konstrukt das für Kinder schwer zugänglich ist (c.f. praktisch alle moderne Forschung im Bereich der Entwicklungspsycholinguistik)

Worum geht es ?

Es geht darum, die Kinder mit einem spezifischen digitalen Medium erfahren zu lassen, dass die Sprache strukturiert ist.

Es geht darum, Buchstaben zu betrachten als Hinweise auf den Ablauf der Artikulation beim Aussprechen von Wörtern.

Es geht um Bau der Silbe.

Es geht um Lesbarkeit...

...und Verstehen

Wer sind wir ?