Sprachmodell        zurück ]      [ Stichworte ]      [ Die Hyper-Bibliothek ]      [ Systemtheorie ]         [ Meine Bücher ]         [ Meine Blogs ]
 
bild

"Sprachmodell" ist ein ganz unsinniger Ausdruck, der im Umfeld der "künstlichen Intelligenz" verwendet wird, wobei völlig unklar bleibt, was mathematisches ModellSprache und mathematisches ModellModell heissen soll.
Ich beschreibe hier als kein Sprachmodell, sondern begriffslose Ideen, die mit dem Ausdruck irgendwie gemeint werden.

In einer unsinnigen Konvention soll "Sprachmodell" ein mathematisches Modell (sic) sein, das die Abfolge von Buchstaben oder Wörtern in natürlichsprachlichen Texten in Form eines stochastischen Prozesses modelliert.
Gemeint ist damit, dass die Buchstaben und die Wörter in einem Text Auftretenswahrscheinlichkeiten in Relation zu den bereits vorhandenen haben.
"Sprachmodelle" spielen eine zentrale Rolle in der maschinellen Übersetzung oder Spracherkennung.

Der Ausdruck "Sprachmodell" wurde insbesondere im Kontext von ChatGPT populär. ChatGPT ist - neben Coplilot, ... - die populärste Variante von GPTs, die auf sogenannten LLMs beruhen, was für "grosse Sprachmodelle" (large language modells) steht.


 

Anmerkung zur Sprache:
Ich kann in gewisser Hinsicht einen Sprecher modellieren. Das Modell erklärt dann, welche Wörter der Sprecher wann verwendet. Natürlich spricht ein Sprecher ein je bestimmte Sprache.


 
[wp]