Eine Vokabel hat genau eine geschriebene Form. Das ist die Schreibform, die im Transkript automatisch gesetzt werden soll, wenn eine der bis zu zehn hinterlegten gesprochenen Formen für diese Vokabel in der Audio- oder Videospur gesagt wird.
Ein kurzes Beispiel zum besseren Verständnis:
Geschriebene Form: gnocchi
Gesprochene Formen: nyohki; nokey; nochi; gnotschi