transcribe_from_file
Generate subtitles from local video or audio files using Faster Whisper transcription with options for language detection, translation, and accuracy controls.
Instructions
ローカルの動画/音声ファイルから字幕を生成します。
Args:
file_path: 動画/音声ファイルの絶対パス
device: 推論に使用するデバイス ("cuda" または "cpu")
model_size: Whisperモデルサイズ (デフォルト: "large-v3")
input_lang: 入力言語コード(省略時は自動検知)
output_lang: 翻訳先言語コード(省略時は翻訳なし)
initial_prompt: 専門用語や固有名詞のヒントを提供するプロンプト
condition_on_previous_text: 前のセグメントを参照して文脈維持 (デフォルト: False、ハルシネーション防止)
temperature: 温度パラメータ(0.0で最も決定的、デフォルト: 0.0)
no_speech_threshold: 無音判定の閾値 (デフォルト: 0.6)
compression_ratio_threshold: 繰り返し検出の閾値 (デフォルト: 2.4)
vad_filter: 音声区間検出フィルタを使用 (デフォルト: True、ハルシネーション防止)
Returns:
生成されたSRTファイルのパスと検出された言語情報
Input Schema
TableJSON Schema
| Name | Required | Description | Default |
|---|---|---|---|
| file_path | Yes | ||
| device | No | cuda | |
| model_size | No | large-v3 | |
| input_lang | No | ||
| output_lang | No | ||
| initial_prompt | No | ||
| condition_on_previous_text | No | ||
| temperature | No | ||
| no_speech_threshold | No | ||
| compression_ratio_threshold | No | ||
| vad_filter | No |