🎵

ElevenLabs Speech-to-Text

Medium

Transcribe audio files using ElevenLabs Speech-to-Text (Scribe v2).

Install

Use in AI Agents

Claude Code

# Install Skill (downloads SKILL.md to .claude/skills/)
clawhub install elevenlabs-stt

# Then just tell Claude: "use ElevenLabs Speech-to-Text to help me..."

OpenAI Codex / Cursor / Windsurf

# Same install command — works with all SKILL.md-compatible AI coding tools
clawhub install elevenlabs-stt

OpenClaw Ecosystem

This Skill is compatible with the OpenClaw standard. After installation, a SKILL.md file is auto-generated, usable by any OpenClaw-compatible AI Agent (Claude Code, Cursor, Windsurf, etc.).

Environment & Dependencies

SKILL.md

Transcribe audio files using ElevenLabs' Scribe v2 model. Supports 90+ languages with speaker diarization.

Quick Start

# Basic transcription
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3

# With speaker diarization
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3 --diarize

# Specify language (improves accuracy)
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3 --lang en

# Full JSON output with timestamps
{baseDir}/scripts/transcribe.sh /path/to/audio.mp3 --json

Options

| Flag | Description | |------|-------------| | --diarize | Identify different speakers | | --lang CODE | ISO language code (e.g., en, pt, es) | | --json | Output full JSON with word timestamps | | --events | Tag audio events (laughter, music, etc.) |

Supported Formats

All major audio/video formats: mp3, m4a, wav, ogg, webm, mp4, etc.

API Key

Set ELEVENLABS_API_KEY environment variable, or configure in clawdbot.json:

{
  skills: {
    entries: {
      "elevenlabs-stt": {
        apiKey: "sk_..."
      }
    }
  }
}

Examples

# Transcribe a WhatsApp voice note
{baseDir}/scripts/transcribe.sh ~/Downloads/voice_note.ogg

# Meeting recording with multiple speakers
{baseDir}/scripts/transcribe.sh meeting.mp3 --diarize --lang en

# Get JSON for processing
{baseDir}/scripts/transcribe.sh podcast.mp3 --json > transcript.json

Also popular in Audio & Voice

View all

Transcribe audio files via OpenRouter using audio-capable models

clawhubAudio & Voice Medium

3.5

Transcribe audio files via OpenRouter using audio-capable models (Gemini, GPT-4o-audio, etc).

clawhub install openrouter-transcribe

Ai Podcast Creation

clawhubAudio & Voice Hard

3.5

Create AI-powered podcasts with text-to-speech, music, and audio editing. Tools: Kokoro TTS, DIA TTS, Chatterbox, AI music generation, media merger. Capabili...

5.3K

clawhub install ai-podcast-creation

audio-cog

clawhubAudio & Voice Medium

1.0

AI audio generation powered by CellCog. Text-to-speech, voice synthesis, voiceovers, podcast audio, narration, music generation, background music, sound design. Professional audio creation with AI.

clawhub install audio-cog

ElevenLabs Speech-to-Text

Install

Use in AI Agents

Claude Code

OpenAI Codex / Cursor / Windsurf

OpenClaw Ecosystem

Environment & Dependencies

SKILL.md

Quick Start

Options

Supported Formats

API Key

Examples

Code Example

Also popular in Audio & Voice

Transcribe audio files via OpenRouter using audio-capable models

Ai Podcast Creation

audio-cog

Audio Editor

ElevenLabs Speech-to-Text

Install

🤖Use in AI Agents

Claude Code

OpenAI Codex / Cursor / Windsurf

OpenClaw Ecosystem

Environment & Dependencies

SKILL.md

Quick Start

Options

Supported Formats

API Key

Examples

Code Example

Also popular in Audio & Voice

Transcribe audio files via OpenRouter using audio-capable models

Ai Podcast Creation

audio-cog

Audio Editor

Use in AI Agents