Skip to content

ToDo for Paper Submission

  • HTML Webpage | Output:
    • Input Language
    • Output Language
    • Summarizer (select model)
  • Speaker Recognition
    • dynamic speaker recognition for a session | keeping track of speakers
  • Ladinische Modelle (Speech Recognition)
    • VOSK
  • Ladinische Modelle
    • Argos-Translate
    • CTranslate2
  • Pinokio?
  • Use Cases:
    • Korrektur Systeme
    • Tool zum Datensaetze kreieren
    • Datenset von Audio clustern
    • Privacy Aware Notetaking
    • zusaetzliches Modell wo klassische schwaechen von VOSK Output korrigiert
  • Multispeaker -> VOSK -> Spacy -> GEC Model -> Argostranslate
    • Modell auf Fehler von VOSK trainieren