语音转文字

基于深度学习的实时语音识别系统,支持多语言转写、说话人分离和标点恢复,适用于会议、访谈等场景的高精度文字转录。

Whisper PyTorch WebSocket FastAPI
加载中...

拖拽音频文件到此处

点击选择文件

支持 MP3、WAV、M4A、FLAC、OGG、WebM 格式,10MB 以内

点击开始录音