← Tilbage

Voice-to-Vault

Fra tale til tekst på sekunder

Hvad er det?

Voice-to-Vault lader mig optage en voice note på min iPhone og få den automatisk transskriberet og gemt i min Obsidian vault. Ingen manuel indsats - jeg taler, og teksten dukker op.

Flow

  1. iOS Shortcut optager lyd
  2. HTTP POST til server via Tailscale
  3. Flask endpoint modtager audio-fil
  4. OpenAI Whisper API transkriberer
  5. Markdown fil gemmes i Vault/Inbox/

Fra jeg stopper med at tale til noten ligger klar: under 10 sekunder.

Whisper Model

Bruger gpt-4o-mini-transcribe - hurtigere og billigere end standard Whisper. 88 sekunders audio transkriberes på under 5 sekunder. Koster ca. 0.02 kr per minut.

En custom prompt hjælper med domæne-specifikke ord: "Voice-to-Vault, homelab, server, Claude, AI, Obsidian."

Hvad sker der bagefter?

Transkriptionerne lander i inbox, hvor en AI-agent senere gennemgår dem. Den kategoriserer, finder forbindelser, og rydder op i talesproget. Se Personal Vault for hele systemet.

Tech Stack

Python Flask OpenAI Whisper iOS Shortcuts Tailscale systemd