About Us
私たちについて

声に革命を。Aivisアイビス Projectプロジェクト が切り拓く、感動の音声体験。

Aivis Project は、感情豊かな音声合成技術を誰もがかんたんに活用できる未来を目指す、
壮大な開発プロジェクトです。
機械的な響きに留まらない、まるで魂を宿したかのような音声が、あなたの想いや言葉に豊かな感情をのせて
世界へと響き渡る。Aivis Project が描く未来は、これまでにない感動と驚きに満ちています。

解説動画に聞き取りやすい良質な音声を添え、好きなキャラとボイスチャットで会話を楽しむ。
社内向けの研修動画やプレゼン資料に、説得力のあるナレーションを加えて伝達力を高める。
そうした多様な表現が、私たちのプロダクトを通じて数クリックで実現します。

AivisSpeech でのローカル音声合成から、音声合成モデルの制作・公開、高速なクラウド API まで。
Aivis Project は誰もが自由に、好きな声を共有できる未来を形にしていきます。
あなたのアイデアや想いを、感動的な声で世界に届けてみませんか?

Products
Aivis Project の製品

かんたんに感情豊かな合成音声を使える、無料の音声合成ソフトウェア。
動画のナレーションやボイスドラマなど、あらゆる用途にご活用いただけます。
Windows と Mac の両方に対応しています。 使い方 / よくある質問 / GitHub

♦ Features | 特長
  • 人間の声と区別できないほどに感情豊かで高音質&高品質な合成音声
  • 近年のデスクトップ PC や MacBook なら CPU だけでもサクサク使える
  • 個人/法人/商用を問わず、基本的にクレジット不要で自由に使える
  • AivisHub などで配布されている音声合成モデルや、AivisBuilder で自作した
    音声合成モデルをインストールすれば、好きなだけ話者を追加できる
  • 英単語や固有名詞混じりの文、日付なども読み間違わずに自然に読み上げ
  • 文ごとに話者スタイル・話速・テンポ・音量・前後無音・読み方・アクセント
    などを変更し、より自然な声になるよう細かく調整できる
  • 人名・社内用語・固有名詞も、辞書登録すれば手動修正なしで読み上げ可能
  • VOICEVOX 互換の直感的な UI と HTTP API インターフェイス
  • ゆっくりムービーメーカー4 (YMM4) からも使えるv4.34.2.0 以降
AivisSpeech のスクリーンショット

ユーザーとモデル職人をつなぐ、音声合成モデル共有プラットフォーム。
Aivis Project 公式で公開しているモデルや、ユーザーのみなさんが制作された多数のモデルを無料でダウンロードできます。
アカウント登録 頂ければ、音声合成モデルを AivisHub 上で広く公開できます。

♦ Features | 特長
  • 公式 or ユーザー制作の高品質なモデルを無料で試聴・ダウンロードできる
  • 多くのモデルのライセンスが ACML / ACML-NC / パブリックドメイン (CC0) で公開されており、利用条件の差異を気にせず安心して使える
  • カテゴリ・声質・タグから目的や好みに合った音声合成モデルを探せる
  • 好みの音声合成モデルを見つけたら、事前に PC 上で AivisSpeech を
    起動しておくだけで、1クリックでサクッとインストールして使える
  • AivisBuilder / AIVM Generator で生成した音声合成モデルを
    ACML / ACML-NC / CC0 または独自ライセンスで手軽に配布できる
  • Aivis Cloud API で使うための非公開でのモデルアップロードにも対応
AivisHub のスクリーンショット

AivisHub の音声合成モデルで、LLM 連携に最適なリアルタイム音声合成を。
対話 AI からナレーション制作まで。超低遅延・高品質なクラウド API が、
表情豊かな音声で様々なシーンに寄り添い、新しい体験と価値を生み出します。
📢 無料ベータ版を公開中です! API ドキュメント / リアルタイム音声合成デモ

♦ Features | 特長
  • 音声を最速 0.3 秒で生成でき、低遅延なリアルタイムストリーミングにも対応
  • 事前に非公開でアップロードしたプライベートモデルを高速 API で運用できる
  • 従量課金だけでなく、レート制限ありで定額で使える月額プランもご用意
  • SSML や多彩なパラメータで声の表現を細かく調整でき、高品質な音声を実現
  • 英単語や固有名詞混じりの文、日付なども読み間違わずに自然に読み上げ
  • 読み取得 API と組み合わせれば、指定した読み・アクセントで音声合成が可能
  • ユーザー辞書に単語の読み方・アクセント(AivisSpeech 互換)を登録すれば
    人名・地名・専門用語・社内用語など、特殊な読みも正確に読み上げできる
  • 自社サーバー運用が必要な法人様には、オンプレミス環境向けの音声合成 API
    サーバー製品 (Citoras) を月額制でご提供(詳細はお問い合わせください)
Aivis Cloud API のスクリーンショット

過去の動画やポッドキャストなど、お手元の既存の録音素材から
かんたん操作で高品質な音声合成モデルを制作できる無料ソフト(開発中)。

📢 AivisBuilder のリリースまでの間、まるなげボイス by Aivis Project にて、音声合成モデルの制作代行を承っております!
音声データをお預けいただくだけで、面倒な作業は全てお任せ。AivisSpeech で使える高品質な音声合成モデルを制作いたします。ぜひ一度ご相談ください!

♦ Features | 特長
  • お手元の既存の録音素材を活用すれば、感情豊かで高品質な音声合成モデルを
    新たに声の収録作業をすることなく、既存素材だけですばやく制作できる
  • 最先端の音源分離 AI を活用し、宅録などで雑音の多い録音素材でも
    全自動で雑音や BGM を除去し、クリアな音声へ自動変換
  • 独自開発した日本語向け音声アノテーション AI をフル活用し、音声から
    全自動で AI 学習に必要な高精度の書き起こし文・読み・アクセントを生成
  • 生成された音声データセットの誤りや学習に適さない音声を
    すばやく効率的に選別・編集するためのアノテーションツールを搭載
  • 完成した音声合成モデルを AivisSpeech にインストールすればすぐに使える
  • 2026年中の一般公開に向けて開発準備中! Coming soon...
AivisBuilder のスクリーンショット

AI音声合成モデル用オープンファイルフォーマット、
AIVM (Aivis Voice Model) の生成・編集ツール。

AivisSpeech や Aivis Cloud API で使える AI 音声合成モデルファイル
(AIVM / AIVMX) を、かんたんに生成・編集できます。

♦ Features | 特長
  • ブラウザ上の UI で手軽に AIVM / AIVMX ファイルを生成・編集できる
  • AivisSpeech などの対応ソフトウェアに生成した AIVM / AIVMX ファイル
    を追加すれば、AI音声合成モデルをかんたんに利用できる
  • 名前・説明・制作者・アイコン・ボイスサンプルなどのメタデータを設定可能
  • PC 上の AivisSpeech と連携して、ボタン1つでボイスサンプルを一括生成
  • 入力情報はサーバーに送信されず、ブラウザ上だけで生成・編集が完結
  • Style-Bert-VITS2 で制作した Safetensors 形式の音声合成モデルから、
    その場で AIVM / AIVMX ファイルに変換できる
    (大変お待たせしました!2026年1月末に ONNX 変換機能を公開済みです!)
AIVM Generator のスクリーンショット
Products
Aivis Project の製品
AivisSpeech のスクリーンショット

かんたんに感情豊かな合成音声を使える、無料の音声合成ソフトウェア。
動画のナレーションやボイスドラマなど、あらゆる用途にご活用いただけます。 Windows と Mac の両方に対応しています。 使い方 / よくある質問 / GitHub

♦ Features | 特長
  • 人間の声と区別できないほどに感情豊かで高音質&高品質な合成音声
  • 近年のデスクトップ PC や MacBook なら CPU だけでもサクサク使える
  • 個人/法人/商用を問わず、基本的にクレジット不要で自由に使える
  • AivisHub などで配布されている音声合成モデルや、AivisBuilder で自作した音声合成モデルをインストールすれば、好きなだけ話者を追加できる
  • 英単語や固有名詞混じりの文、日付なども読み間違わずに自然に読み上げ
  • 文ごとに話者スタイル・話速・テンポ・音量・前後無音・読み方・アクセントなどを変更し、より自然な声になるよう細かく調整できる
  • 人名・社内用語・固有名詞も、辞書登録すれば手動修正なしで読み上げ可能
  • VOICEVOX 互換の直感的な UI と HTTP API インターフェイス
  • ゆっくりムービーメーカー4 (YMM4) からも使えるv4.34.2.0 以降
AivisHub のスクリーンショット

ユーザーとモデル職人をつなぐ、音声合成モデル共有プラットフォーム。
Aivis Project 公式で公開しているモデルや、ユーザーのみなさんが制作された多数のモデルを無料でダウンロードできます。 アカウント登録 頂ければ、音声合成モデルを AivisHub 上で広く公開できます。

♦ Features | 特長
  • 公式 or ユーザー制作の高品質なモデルを無料で試聴・ダウンロードできる
  • 多くのモデルのライセンスが ACML / ACML-NC / パブリックドメイン (CC0) で公開されており、利用条件の差異を気にせず安心して使える
  • カテゴリ・声質・タグから目的や好みに合った音声合成モデルを探せる
  • 好みの音声合成モデルを見つけたら、事前に PC 上で AivisSpeech を起動しておくだけで、1クリックでサクッとインストールして使える
  • AivisBuilder / AIVM Generator で生成した音声合成モデルをACML / ACML-NC / CC0 または独自ライセンスで手軽に配布できる
  • Aivis Cloud API で使うための非公開でのモデルアップロードにも対応
Aivis Cloud API のスクリーンショット

AivisHub の音声合成モデルで、LLM 連携に最適なリアルタイム音声合成を。
対話 AI からナレーション制作まで。超低遅延・高品質なクラウド API が、表情豊かな音声で様々なシーンに寄り添い、新しい体験と価値を生み出します。
📢 無料ベータ版を公開中です! API ドキュメント / リアルタイム音声合成デモ

♦ Features | 特長
  • 音声を最速 0.3 秒で生成でき、低遅延なリアルタイムストリーミングにも対応
  • 事前に非公開でアップロードしたプライベートモデルを高速 API で運用できる
  • 従量課金だけでなく、レート制限ありで定額で使える月額プランもご用意
  • SSML や多彩なパラメータで声の表現を細かく調整でき、高品質な音声を実現
  • 英単語や固有名詞混じりの文、日付なども読み間違わずに自然に読み上げ
  • 読み取得 API と組み合わせれば、指定した読み・アクセントで音声合成が可能
  • ユーザー辞書に単語の読み方・アクセント(AivisSpeech 互換)を登録すれば人名・地名・専門用語・社内用語など、特殊な読みも正確に読み上げできる
  • 自社サーバー運用が必要な法人様には、オンプレミス環境向けの音声合成 API サーバー製品 (Citoras) を月額制でご提供(詳細はお問い合わせください)
AivisBuilder のスクリーンショット

過去の動画やポッドキャストなど、お手元の既存の録音素材からかんたん操作で高品質な音声合成モデルを制作できる無料ソフト(開発中)。
📢 AivisBuilder のリリースまでの間、まるなげボイス by Aivis Project にて、音声合成モデルの制作代行を承っております!
音声データをお預けいただくだけで、面倒な作業は全てお任せ。AivisSpeech で使える高品質な音声合成モデルを制作いたします。ぜひ一度ご相談ください!

♦ Features | 特長
  • お手元の既存の録音素材を活用すれば、感情豊かで高品質な音声合成モデルを新たに声の収録作業をすることなく、既存素材だけですばやく制作できる
  • 最先端の音源分離 AI を活用し、宅録などで雑音の多い録音素材でも全自動で雑音や BGM を除去し、クリアな音声へ自動変換
  • 独自開発した日本語向け音声アノテーション AI をフル活用し、音声から全自動で AI 学習に必要な高精度の書き起こし文・読み・アクセントを生成
  • 生成された音声データセットの誤りや学習に適さない音声をすばやく効率的に選別・編集するためのアノテーションツールを搭載
  • 完成した音声合成モデルを AivisSpeech にインストールすればすぐに使える
  • 2026年中の一般公開に向けて開発準備中! Coming soon...
AIVM Generator のスクリーンショット

AI音声合成モデル用オープンファイルフォーマット、AIVM (Aivis Voice Model) の生成・編集ツール。
AivisSpeech や Aivis Cloud API で使える AI 音声合成モデルファイル (AIVM / AIVMX) を、かんたんに生成・編集できます。

♦ Features | 特長
  • ブラウザ上の UI で手軽に AIVM / AIVMX ファイルを生成・編集できる
  • AivisSpeech などの対応ソフトウェアに生成した AIVM / AIVMX ファイルを追加すれば、AI音声合成モデルをかんたんに利用できる
  • 名前・説明・制作者・アイコン・ボイスサンプルなどのメタデータを設定可能
  • PC 上の AivisSpeech と連携して、ボタン1つでボイスサンプルを一括生成
  • 入力情報はサーバーに送信されず、ブラウザ上だけで生成・編集が完結
  • Style-Bert-VITS2 で制作した Safetensors 形式の音声合成モデルから、その場で AIVM / AIVMX ファイルに変換できる(大変お待たせしました!2026年1月末に ONNX 変換機能を公開済みです!)

AIVM (Aivis Voice Model) / AIVMX (Aivis Voice Model for ONNX) は、
学習済みモデル・ハイパーパラメータ・スタイルベクトル・話者メタデータ(名前・概要・ライセンス・
アイコン・ボイスサンプル など)を 1 つのファイルにギュッとまとめた、
AI 音声合成モデル用オープンファイルフォーマットです。

AivisSpeech / AivisSpeech Engine をはじめとした AIVM 仕様に対応するソフトウェアに AIVM / AIVMX ファイルを追加することで、AI 音声合成モデルをかんたんに利用できます。
AIVM Generator では、ブラウザ上の GUI で手軽に AIVM / AIVMX ファイルを生成・編集できます。

AivisSpeech などでの音声合成(推論)には AIVMX (.aivmx) 形式を、
モデルミックスや開発には AIVM (.aivm) 形式をご利用ください。

AIVM (.aivm): モデルミックスによる新しい声質の作成やファインチューニングが可能な形式です。

  • おもに NVIDIA GPU での利用に特化しています。(PyTorch + Safetensors モデル)
  • GPU で高速に音声合成を行うため、Aivis Cloud API の内部では AIVM ファイルを使用しています。
  • Citoras(オンプレミス版 Aivis Cloud API)は AIVM ファイルにのみ対応しています。

AIVMX (.aivmx): より多くの環境で音声合成を実行できる形式です。

  • CPU だけでも快適に音声合成を実行できます。(ONNX モデル)
  • Windows では AMD Radeon / Intel Arc GPU でも高速に動作します。
  • AivisSpeech はインストールサイズを削減するため、AIVMX ファイルにのみ対応しています。
Q. 音声合成とはなんですか?
A. 音声合成とは、機械学習などの最新のテクノロジーを活用し、人間の声を人工的に再現する技術です。
テキストを入力することで、それに対応する音声を生成できます。
Q. AivisSpeech は無料で利用できますか?クレジット表記は必要ですか?
A. AivisSpeech は、利用用途を束縛されない、自由な AI 音声合成ソフトウェアを目指しています。
(成果物で使った音声合成モデルのライセンス次第ではありますが)少なくともソフトウェア本体はクレジット表記不要で、個人・法人・商用・非商用を問わず、自由にお使いいただけます。
AivisHub などで公開されている ACML / ACML-NC / パブリックドメイン (CC0) ライセンスの音声合成モデルをお使いなら、クレジット表記の義務はありません。
…とはいえ、より多くの方に AivisSpeech のことを知っていただきたい気持ちもあります。
もしよければ、成果物のどこかに AivisSpeech のことをクレジットしていただけると嬉しいです。(クレジットの表記フォーマットはお任せします。)
Q. AivisSpeech の有料化予定はありますか?
A. 1.1.0 時点で実装されている AivisSpeech の基本機能は、今後も無料でご利用いただけます。
将来的に有料プランを導入する可能性はありますが、その場合でも追加機能のみが対象となります。
また、AivisSpeech / AivisSpeech Engine は LGPL-3.0 ライセンスのオープンソースソフトウェアです。
デベロッパーの方はぜひ GitHub から改善にご協力ください!
Q. AivisSpeech の動作環境を教えてください。
A. Windows・macOS 搭載の PC に対応しています。
AivisSpeech を起動するには、PC に 1.5GB 以上の空きメモリ (RAM) が必要です。
Windows: Windows 10 (22H2 以降)・Windows 11
macOS: macOS 13 Ventura 以降
⚠️ Intel CPU 搭載 Mac での動作は積極的に検証していません。
Intel CPU 搭載 Mac はすでに製造が終了しており、検証環境やビルド環境の用意自体が難しくなってきています。なるべく Apple Silicon 搭載 Mac での利用をおすすめいたします。
⚠️ Windows 10 では、バージョン 22H2 での動作確認のみ行っています。サポートが終了した Windows 10 の古いバージョンや LTSC (Long Term Servicing Channel) 版の Windows 10 では、AivisSpeech Engine がクラッシュし起動に失敗する事例が報告されています。
セキュリティ上の観点からも、Windows 10 環境の方は、最低限バージョン 22H2 まで更新してからの利用を強くおすすめいたします。
Q. AivisSpeech はオフラインの PC でも利用できますか?
A. AivisSpeech をはじめて起動するときのみ、モデルデータのダウンロードのため、インターネットアクセスが必要になります。2回目以降の起動では、PC がオフラインでもお使いいただけます。
Q. AivisSpeech のインストール時・起動時に「Windows によって PC が保護されました」「開発元が検証できないため開けません」「悪質なソフトウェアであるかどうかを Apple では確認できないため、このソフトウェアは開けません」と表示されます。
A. AivisSpeech は、いち早くユーザーのみなさんにお届けするため、現時点ではコード署名(プログラムの
正当性を証明する電子署名)を行えていない状況です。
そのため、インストーラーやソフトウェアの起動時に、上のような警告やエラーが表示されることがあります。
特に macOS Sequoia ではセキュリティが強化された 関係で、従来の手順では起動できなくなっています。
AivisSpeech は安全なソフトウェアですので、私どもを信頼していただけるようでしたら、以下の手順で起動を進めていただけますと幸いです。
Windows: 「詳細情報」→「実行」をクリック
Mac: 一度「キャンセル」or「OK」or「完了」をクリックしポップアップを閉じた後、「システム環境設定」→
「セキュリティとプライバシー」→「このまま開く」をクリック
※「ダウンロードしたアプリケーションの実行許可」は「AppStoreと確認済みの開発元からのアプリケーションを許可」または「すべてのアプリを許可」に設定されている必要があります。 将来的にはコード署名を適用し、起動時の警告やエラーが表示されないよう対応を進めてまいります。
macOS Sequoia での詳しい手順は こちら (外部リンク) の記事をご覧ください。
Q. AivisSpeech を初めて起動したのですが、ずっと「音声合成エンジン起動中...」と表示されます。
A. AivisSpeech は必要なモデルデータをダウンロードするため、初回起動の完了まで数分程度かかります。
これは初回のみの動作ですので、そのままお待ちいただければ自動的に起動が完了します。
起動に失敗してしまった場合は、一度ウインドウを閉じてから再度起動してみてください。多くの場合はこれで正常に起動できるようになります。
⚠️ インターネットに接続されていない場合や、企業内ネットワークや HTTPS プロキシ経由などの
特殊なインターネット環境では、モデルデータのダウンロードができずに起動に失敗することがあります。

その場合はインターネット接続を確認してから、もう一度起動をお試しください。
HTTPS プロキシや社内ファイアウォールを経由している場合もダウンロードに失敗することがあるようです。
可能であれば一旦それらを無効化してから再度お試しください。
通信可能なドメインがホワイトリスト方式で管理されている環境では、以下のドメインをホワイトリストに追加してください。
  • api.aivis-project.com
  • *.r2.cloudflarestorage.com
  • raw.githubusercontent.com
  • huggingface.co
  • hf.co
  • *.hf.co
  • *.xethub.hf.co
  • *.gcp.cdn.hf.co
Q. AivisSpeech を起動すると「音声合成エンジンの起動に失敗しました」というエラーが表示されます。
A. AivisSpeech を起動するには、PC に 1.5GB 以上の空きメモリ (RAM) が必要です。
PC の空きメモリが不足している環境では、音声合成エンジンの起動に失敗することがあります。
また、ウイルス対策ソフトが音声合成エンジン (run.exe) を不正なプログラムと誤って判断し、通常の保存場所
から隔離したことが原因の可能性もあります。
ウイルス対策ソフトの設定から、run.exe を許可リストに追加いただけますと幸いです。
このほか PC の再起動で直ることもありますので、一度お試しください。
⚠️ 企業内ネットワークや HTTPS プロキシ経由などの特殊なインターネット環境では、初回起動時に
デフォルトモデルのダウンロードに失敗し、起動できない場合があります。

その場合はまず、上記『Q. 初めて起動したのですが、ずっと「音声合成エンジン起動中...」と表示されます。』に記載の手順をお試しください。
それでも音声合成エンジンの起動に失敗する場合は、以下をお試しください。
 1. AivisHub から任意の AIVMX ファイルを直接ダウンロード (約250MB)
 2. ダウンロードした .aivmx ファイルを以下のフォルダに配置:
   Windows: C:\Users\(ユーザー名)\AppData\Roaming\AivisSpeech-Engine\Models
   Mac: /Users/(ユーザー名)/Library/Application Support/AivisSpeech-Engine/Models
 3. AivisSpeech を再起動
ここまで試しても音声合成エンジンの起動に失敗する場合は、お問い合わせフォーム からご連絡ください。
お問い合わせいただく前に、一度 PC や OS が対応環境かをご確認いただけますと幸いです。
Q. AivisSpeech で GPU モードに切り替えたのに音声生成が CPU モードよりも遅いです。
A. CPU 内蔵の GPU (iGPU) のみの PC でも GPU モードは使えますが、ほとんどの場合 CPU モードよりかなり遅くなってしまうため、おすすめできません。CPU 内蔵の GPU は独立した GPU (dGPU) に比べて性能が低く、AI 音声合成のような重い処理が苦手なためです。
一方で、最近の CPU は性能が大幅に向上しており、CPU だけでも十分高速に音声を生成できます。
そのため、dGPU 非搭載の PC では CPU モードの利用をおすすめします。
Q. AivisSpeech での音声生成時、Intel 第 12 世代以降の CPU でフル性能を発揮できない。
A. Intel の第 12 世代以降の CPU(Pコア・Eコアのハイブリッド構成)搭載 PC をお使いの場合、
Windows の電源設定によって音声生成の性能が大きく変わることがあります。これは、デフォルトの
「バランス」モードでは、音声生成タスクが省電力重視のEコアに割り当てられやすいためです。
以下の手順で設定を変更すると、PコアとEコアの両方を最大限活用し、音声生成をより高速に行えます。
 1. Windows 11 の設定を開く
 2. システム → 電源 と進む
 3.「電源モード」を「最適なパフォーマンス」に変更する
⚠️ コントロールパネル内「電源プラン」にも「高パフォーマンス」設定がありますが、設定内容が異なります。
Intel 第 12 世代以降の CPU では、Windows 11 の設定画面からの「電源モード」の変更をおすすめします。
Q. ゆっくりムービーメーカー4 (YMM4) で AivisSpeech の音声を使うには?
A. YMM4 v4.34.2.0 以降にて、正式に AivisSpeech に対応いただきました!
YMM4 の公式ヘルプページ から、AivisSpeech との連携方法を確認できます。

YMM4 の設定から上のとおり設定いただくと、AivisSpeech の話者を利用できるようになります。
💡「エンジンを直接起動」はオンがおすすめです。エディタの GUI を起動せずに音声合成を行えるため、PC の
メモリ消費を削減できます。エディタから登録したユーザー辞書は、この設定に関係なく常に反映されます。
💡「エンジンを直接起動」がオンの時に表示される「GPU を使用」は、独立 GPU (dGPU) を搭載していない
一般的な PC では「無効」に設定してください。有効にした場合、音声生成が著しく遅くなります。
Q. AivisSpeech のフィードバックや不具合を報告するには?
A. ご感想・ご要望は、ぜひ Twitter (X) にてハッシュタグ #AivisSpeech を付けてツイートしてください!
うまく動かない場合や不具合を見つけられた方は、以下のいずれかの方法でご連絡ください。
エラーメッセージや操作内容など、なるべく具体的な状況を記載いただけますと、より迅速な対応が可能です。
1. お問い合わせフォーム(推奨)
Aivis Project お問い合わせフォーム からご報告いただけます。
2. GitHub Issue
GitHub アカウントをお持ちの方は、GitHub の Issue からご報告いただけますと、早期の対応が可能です。
Q. Aivis Cloud API でのリアルタイム音声合成を試したいです。
A. 業界最速クラスの音声生成と低遅延ストリーミング再生をすぐに体感できる リアルタイム音声合成デモ をご用意しています!🚀 音声の生成と再生を同時並行で行い、生成された部分から順次再生を開始します。
高品質な音声生成と応答速度をぜひお試しください!
ソースコードはデモページの HTML にすべて含まれていますので、ぜひ実装の参考としてもご活用ください。
Q. Aivis Cloud API で自前で制作した音声合成モデルを使うには?
A. AivisHub にモデルファイルを非公開でアップロード いただくと、お手元のプライベートモデル資産を、音声を最速 0.3 秒で生成できる Aivis Cloud API 上でご活用いただけます!🎉
リアルタイム音声合成デモ でお試しされる際は、フォームに『アップロードした音声合成モデルの UUID』『アップロードしたのと同じアカウントで作成した API キー』を設定してください。
もちろん、AivisHub 上で公開されている音声合成モデル も Aivis Cloud API でご利用いただけます(各モデルのライセンス条件が適用されます)。
Q. Citoras とはなんですか? AivisSpeech Engine との違いは?
A. Citoras (Cloud-based Inference TTS On Realtime Accelerator Server) は、お手元のモデル資産をセキュアに活用し、リアルタイム音声合成を実現する、エンタープライズ向け音声合成 API サーバー製品です。
AivisSpeech Engine は一般的な PC 上で1人で使うことを想定して設計されており、多くのリクエストを高速に捌く必要のある API サーバー用途には最適化されていません。
AivisSpeech Engine は CPU のみでも高速に動作させるために ONNX Runtime ベースで開発されていますが、GPU サーバー上での生成速度やスケーラビリティには根本的なボトルネックがあります。
また、VOICEVOX ENGINE との API 互換性を保つトレードオフとして、技術的に新機能の追加や仕様変更が難しく、API 仕様自体が分かりにくいという課題もあります。
Aivis Cloud API の内部では、GPU サーバーで大量の音声合成リクエストを捌くため、フルスクラッチで新規開発した音声合成 API サーバー製品「Citoras」を活用しています!
音声の生成品質はそのまま、AivisSpeech Engine にはない、エンタープライズ向けに最適化された多彩な機能を備えています。
  • 🚀 圧倒的な処理速度 - NVIDIA RTX A4000 であれば最速 0.3 秒、30 秒の音声でも最速 0.8 秒以下で生成できます。
  • 🔄 低遅延なリアルタイムストリーミングに対応 - 音声生成が完了する前から再生を開始でき、リアルタイム AI チャットにおける体感遅延を大幅に削減できます。
  • 🎧 多様な音声フォーマットに対応 - WAV / FLAC / MP3 / AAC / Opus 形式に対応し、リアルタイムストリーミングから高音質まで幅広い用途に対応します。
  • 📋 既存システムとの高い親和性 - SSML のサブセットに対応しており、Google Cloud Speech / Amazon Polly などの従来型の音声合成エンジンからの移行コストを最小化できます。
  • 📚 高精度な内蔵辞書に加え、マルチテナント対応のユーザー辞書 API 機能を完備 - サーバー起動中も随時自動更新される内蔵辞書に加え、東京式アクセント・品詞・優先度まで詳細に調整したユーザー辞書を追加でき、さらに複数のユーザー辞書の使い分けが可能です。
  • ☁️ S3 互換ストレージへのモデル配置に対応 - S3 互換ストレージに配置された AIVM 形式 (.aivm) のモデルファイルを随時自動認識し、セキュアでスケーラブルなモデル管理を実現できます。
  • 💾 限られたハードウェアリソースを最大限に活用 - GPU VRAM・CPU RAM・SSD の3階層戦略と LRU 最適化により、VRAM 容量を超える大量の音声合成モデルを1台の GPU サーバーで運用できます。
  • 🐳 エンタープライズ向けの堅牢な運用基盤 - Docker でのデプロイを前提とした設計で、複数の API キーによるアクセス制御、サーバー負荷・統計情報の監視のための API を完備しています。
自社サーバー運用が必要な法人様には、この「Citoras」をオンプレミス環境向けの音声合成 API サーバー製品として、月額制にて提供しております。
ご興味のある法人様はぜひ お問い合わせフォーム よりご相談ください!🙏
Q. AivisHub に ACML / ACML-NC / CC0 以外のライセンスで音声合成モデルを公開したいです。
A. 2025/03/31 より、AivisHub にカスタムライセンスで音声合成モデルを公開できるようになりました!
AIVM Generator で設定した独自のライセンスを保持したまま、AivisHub にアップロードできます。
もちろん、従来通り ACML / ACML-NC / CC0 といった標準ライセンスも設定可能です。
また、非公開でアップロードする場合に限り「ライセンスを設定しない」も選択できます。
Q. AivisHub で音声合成モデルを有料で販売したいです。
A. Aivis Project では、感情豊かな音声合成技術を誰もが自由に使える未来を目指しています。
いまだに一般の方々の多くは、そもそも最新の音声合成技術がどれほど進歩し、どれほど素晴らしいものになっているのかを知る機会すらありません。そこで有料のモデルが主流になってしまうと、音声合成技術の可能性に触れる機会を、さらに狭めてしまう恐れがあると考えています。
このような考えから、今の所 AivisHub で音声合成モデルの有料販売の仕組みを提供する予定はありません。
Q. 以前作成した AIVM / AIVMX ファイル内のモデルデータや関連ファイルを差し替え(更新)したいです。
A. AIVM Generator を使うと、既存の AIVM メタデータ (UUID, 名前, アイコン, ボイスサンプルなど) を維持したまま、モデルデータを更新できます。
AIVM Generator を開き、「1. ファイル選択」で「既存の .aivm/.aivmx ファイルのメタデータを編集」タブを選択して、「モデルデータと関連ファイルを差し替える」にチェックを入れます。
モデルデータの差し替え後は、モデルのバージョンを上げることをおすすめします。現在のバージョンが v1.0.0 なら、v1.1.0 などに更新してください。SemVer 2.0 形式のバージョン表記 に対応しています。
バージョンを上げたモデルファイルを AivisHub に公開でアップロードすると、AivisSpeech のモデル管理画面で、旧バージョンのモデルを使っているユーザーに自動でアップデート通知と更新ボタンが表示されます。
Q. AivisSpeech で使える音声合成モデルを作る方法を教えてください。
A. より簡単に音声合成モデルを制作できるよう、専用に録音された音声データがなくてもわかりやすい UI で
かんたんに高品質な音声合成モデルを制作できる、AivisBuilder を鋭意開発中です。
しかしながら、他のプロダクトと同時並行で開発を進めている兼ね合いで、開発リソースがかなり不足している状況です。心苦しい限りですが、AivisBuilder のリリースまでもうしばらくお待ちいただけますと幸いです。
AivisBuilder がリリースされるまでの間は、AivisSpeech (AIVM / AIVMX 形式) で対応している
Style-Bert-VITS2 モデルアーキテクチャ内蔵のモデル学習機能をご活用ください。
また、音声合成モデル制作を弊社で代行する、まるなげボイス by Aivis Project を提供しております!🚀
音声データを弊社にお預けいただくだけで、面倒な作業は全てお任せ。AivisSpeech で使える高品質な
音声合成モデルをスピーディーに制作いたします。ぜひお気軽にご相談ください!
Q&A
よくある質問
Contact
お問い合わせ

Aivis Project にご興味をお持ちいただき、誠にありがとうございます!
製品やサービスに関するご質問やご相談、導入に関するお問い合わせなど、
どんなことでもお気軽にご連絡ください。

※ お問い合わせ内容によっては、ご返信までお時間をいただく場合がございます。
多数のお問い合わせをいただいていることから、内容によっては迅速な対応が難しい状況です。
ご理解のほどよろしくお願いいたします。