faster-whisper-serverは、FastAPIを利用して構築された、効率的な音声文字起こしサーバーです。このサーバーは、faster-whisperモデルを使用して音声ファイルをテキストに変換し、API経由でその結果を提供します。
Dockerを使用してfaster-whisper-serverをセットアップおよび実行するための手順は以下の通りです。
プロジェクトのルートディレクトリで、以下のコマンドを実行してDockerイメージをビルドします:
docker-compose up --build
サーバーが起動したら、以下のエンドポイントを使用して音声ファイルの文字起こしをリクエストできます:
GET /transcribe
このエンドポイントは、指定された音声ファイルの文字起こしを行います。
パラメーター:
- file_path (string): 文字起こしを行う音声ファイルへのパス。 レスポンス:
- transcription (string): 文字起こし結果。
import requests
def send_audio_to_api(file_path, url):
with open(file_path, 'rb') as f:
files = {'file': ('audio-test.wav', f, 'audio/wav')}
response = requests.post(url, files=files)
return response
api_url = "http://127.0.0.1:8000/transcribe"
wav_file_path = r"audio-test.wav"
response = send_audio_to_api(wav_file_path, api_url)
# レスポンスの確認
if response.status_code == 200:
print("Success:", response.json())
else:
print("Error:", response.text)
このプロジェクトはオープンソースであり、コントリビューションを歓迎します。バグの報告、機能の提案、プルリクエストなど、あなたの協力をお待ちしています。
このプロジェクトはApache License Version 2.0 の下で公開されています。