WhitePrint AudioEngine完全技術仕様書
5つのマイクロサービスで構成されるAI駆動オーディオマスタリングシステムの アーキテクチャ、API仕様、DSP信号処理チェーン、LLM統合ロジック、 デプロイ構成の完全な技術リファレンス。
SYSTEM ARCHITECTURE
4段階パイプライン: Analysis → Deliberation → DSP Mastering → Output。 全サービスはステートレスに設計され、Google Cloud Run上でスケーリングする。 ファイルは処理後即時削除され、永続ストレージには一切保存されない。
Concertmaster
オーケストレーター (The Conductor)
パイプライン全体を制御する唯一の外部公開サービス。URL解決 → Audition → Deliberation → Rendition-DSP のフローを統括。
Endpoints
POST/api/v1/jobs/masterマスタリングジョブ投入 (4ルート: full / analyze_only / deliberation_only / dsp_only)GET/healthヘルスチェックKey Features
Audition
スコアリーダー (分析)
BS.1770-4準拠のラウドネス解析、9次元エンベロープ抽出、BPM/Key推定、Vertex AIによるセクション検出を実行。
Endpoints
POST/api/v1/analyzeURLからオーディオ分析POST/api/v1/analyze/fileファイルパスから分析GET/healthヘルスチェックKey Features
Deliberation
TRIVIUM 3-Sage 合議エンジン
3つの独立AIエージェント (Grammatica/Logica/Rhetorica) が並列でDSPパラメータを提案し、加重中央値マージで最適値を決定。
Endpoints
POST/api/v1/deliberate3-Sage合議実行GET/healthヘルスチェックKey Features
Rendition-DSP
マスタリングエンジン
14段アナログモデリングDSPチェーンによるマスタリング処理。3パス収束ループ、LR8クロスオーバー4バンド圧縮、TPリミッター搭載。
Endpoints
POST/api/v1/masterURLからマスタリングPOST/api/v1/master/fileファイルパスからマスタリングGET/healthヘルスチェックKey Features
UI
フロントエンド
マスタリングダッシュボード、A/B比較プレーヤー、分析ビジュアライゼーション、ユーザー認証、課金管理を提供。
Endpoints
POST/api/masterConcertmasterへのプロキシPOST/api/uploadGCSへのファイルアップロードPOST/api/checkout決済 (NOWPayments)Key Features
14-STAGE DSP MASTERING CHAIN
Pure Python (NumPy/SciPy) 実装のアナログモデリングマスタリングチェーン。 3パス収束ループにより、ターゲットLUFSへの正確な到達を保証する。 セクション別自動化 (section_overrides) により、楽曲構造に応じた動的パラメータ適用が可能。
Input Gain
input_gain_dbDAW出力レベル正規化
Range: -12 ~ +12 dB4-Band Parametric EQ
eq_*_gain_dbLow Shelf (80Hz) / Low-Mid (300Hz) / High-Mid (3kHz) / High Shelf (10kHz)
Range: -6 ~ +6 dBM/S Matrix (Encode)
ステレオ→M/S変換
M/S Processing
ms_*_gain_dbMid低域ブースト / Side高域ブースト
Range: -6 ~ +6 dBTransformer Saturation
transformer_*ソフトクリッピング + 偶数次倍音
Range: 0.0 ~ 1.0Triode Tube Saturation
triode_*Koren真空管モデル: V_out = sign(x) × ln(1 + drive × |x + bias|)
Range: 0.0 ~ 1.0Tape Saturation
tape_*テープヒステリシスモデル: tanh(saturation × x)
Range: 0.0 ~ 1.0M/S Matrix (Decode)
M/S→ステレオ復元
Dynamic EQ
dyn_eq_enabledハーシュネス抑制 (3kHz帯検出)
Range: 0 or 14-Band Crossover Compression
comp_*LR8 (48dB/oct) 分離、バンド別圧縮: Sub/Bass/Mid/High
Range: variableStereo Enhancement
stereo_*低域モノ化 + 高域ワイド化 + 全帯域幅制御
Range: 0.0 ~ 2.0Parallel Compression
parallel_wetヘビー圧縮の Wet/Dry ブレンド
Range: 0.0 ~ 0.5True Peak Limiter v3
limiter_ceil_db4x オーバーサンプル + ルックアヘッド + 3パス収束
Range: -3.0 ~ -0.1 dBTPHP-TPDF Dither
24bit→16bit時のみ。高域整形三角確率密度関数ディザ
24 DSP PARAMETERS
Deliberationエンジンが決定し、Rendition-DSPに渡される全24パラメータの完全仕様。
| Parameter | Min | Max | Default | Unit |
|---|---|---|---|---|
input_gain_db | -12 | 12 | 0 | dB |
eq_low_shelf_gain_db | -6 | 6 | 0 | dB |
eq_low_mid_gain_db | -6 | 6 | 0 | dB |
eq_high_mid_gain_db | -6 | 6 | 0 | dB |
eq_high_shelf_gain_db | -6 | 6 | 0 | dB |
ms_side_high_gain_db | -6 | 6 | 0 | dB |
ms_mid_low_gain_db | -6 | 6 | 0 | dB |
comp_threshold_db | -40 | -6 | -18 | dB |
comp_ratio | 1 | 8 | 2.5 | :1 |
comp_attack_sec | 0.001 | 0.1 | 0.01 | sec |
comp_release_sec | 0.05 | 1 | 0.15 | sec |
limiter_ceil_db | -3 | -0.1 | -1 | dBTP |
transformer_saturation | 0 | 1 | 0 | — |
transformer_mix | 0 | 1 | 0 | — |
triode_drive | 0 | 1 | 0 | — |
triode_bias | 0 | 1 | 0 | — |
triode_mix | 0 | 1 | 0 | — |
tape_saturation | 0 | 1 | 0 | — |
tape_mix | 0 | 1 | 0 | — |
dyn_eq_enabled | 0 | 1 | 0 | bool |
stereo_low_mono | 0 | 1 | 0 | — |
stereo_high_wide | 0 | 2 | 1 | — |
stereo_width | 0 | 2 | 1 | — |
parallel_wet | 0 | 0.5 | 0 | — |
BS.1770-4 ANALYSIS METRICS
Auditionサービスが算出する全16メトリクスの仕様。
integrated_lufsBS.1770-4 統合ラウドネス
LUFStrue_peak_dbtp4x OS True Peak
dBTPlra_luLoudness Range
LUpsr_dbPeak-to-Short-term Ratio
dBcrest_dbクレストファクター
dBstereo_widthSide/Mid エネルギー比
stereo_correlationL/R クロスコリレーション
low_mono_correlation_below_120hz120Hz以下 位相相関
harshness_risk2-6kHz ピーク比率
mud_risk200-500Hz 平坦度指標
sub_ratio20-60Hz エネルギー比
bass_ratio60-250Hz エネルギー比
low_mid_ratio250-500Hz エネルギー比
mid_ratio500-2kHz エネルギー比
high_ratio2k-8kHz エネルギー比
air_ratio8k-20kHz エネルギー比
TRIVIUM 3-SAGE ARCHITECTURE
3つの独立AIエージェントが異なるプロバイダーで並列実行し、 加重中央値マージにより最適なDSPパラメータを決定する。
Grammatica
構造と形式に注目。EQ/コンプの適正値に重点。
Logica
論理的整合性に注目。動的一貫性と位相整合。
Rhetorica
表現力と感性。サチュレーション/ステレオ幅。
加重中央値マージ (Weighted Median Merge)
各Sageの提案値を confidence × valid_param_ratio で 重み付けし、24パラメータそれぞれについて加重中央値を算出。 セクションオーバーライドは全Sageの提案を統合し、時間軸上でマージ。
PIPELINE ROUTES
fullanalyze_onlydeliberation_onlydsp_onlyINFRASTRUCTURE
SECURITY
WhitePrint AudioEngine Technical Specification v1.0 — Last updated: 2026-04-15