kyr0's picture
Initial commit
af2f86c verified
metadata
library_name: mlx
language:
  - en
  - es
  - fr
  - de
  - bg
  - hr
  - cs
  - da
  - nl
  - et
  - fi
  - el
  - hu
  - it
  - lv
  - lt
  - mt
  - pl
  - pt
  - ro
  - sk
  - sl
  - sv
  - ru
  - uk
tags:
  - mlx
  - automatic-speech-recognition
  - speech
  - audio
  - FastConformer
  - Conformer
  - Parakeet
license: cc-by-4.0
pipeline_tag: automatic-speech-recognition
base_model: mlx-community/parakeet-tdt-0.6b-v3

kyr0/aidana-parakeet-tdt-0.6b-8bit

Dynamic 8-bit quants (Quantized model with 13.432 bits per weight), 32 group size quantized model of parakeet-tdt-0.6b-v3 - this shall be a good balance between quality and speed on M4 processors. With only 778 MB of weights, this model keeps top performance. This has been specifically tested for German.

German example

gedicht.wav - 99% perfect result (one error: "lieb" vs. "liebt" in line 9):

1
00:00:00,000 --> 00:00:04,800
Die Nacht von dem heiligen Abend, da liegen die Kinder im Traum.

2
00:00:04,800 --> 00:00:09,360
Sie träumen von schönen Sachen und von dem Weihnachtsbaum.

3
00:00:09,360 --> 00:00:13,760
Und während sie schlafen und träumen, wird es am Himmel klar.

4
00:00:13,760 --> 00:00:18,080
Und durch den Himmel fliegen drei Englein wunderbar.

5
00:00:18,080 --> 00:00:20,720
Sie tragen ein holdes Kindlein.

6
00:00:20,720 --> 00:00:22,640
Das ist der Heilige Christ.

7
00:00:22,640 --> 00:00:26,640
Es ist so fromm und freundlich, wie keins auf Erden ist.

8
00:00:26,640 --> 00:00:35,040
Und während es über die Dächer still durch den Himmel fliegt, schaut es in jedes Bettlein, wo nur ein Kindlein liegt.

9
00:00:35,040 --> 00:00:42,400
Und freut sich über alle, die fromm und freundlich sind, denn solche lieb von Herzen, das himmlische Kind.

10
00:00:42,400 --> 00:00:50,320
Heute schlafen noch die Kinder und sehen es nur im Traum, doch morgen tanzen und springen sie um den Weihnachtsbaum.

Use with mlx

parakeet-mlx

pip install -U parakeet-mlx
parakeet-mlx gedicht.wav --model kyr0/aidana-parakeet-tdt-0.6b-8bit

mlx-audio

pip install -U mlx-audio
python -m mlx_audio.stt.generate --model kyr0/aidana-parakeet-tdt-0.6b-8bit --audio gedicht.wav --output gedicht.srt