速 報2026.05.02 13:30
xAIが「Custom Voices」という新機能を発表しました。約1分の音声録音からユーザー自身の音声クローンを生成でき、2分以内に音声モデルが完成して、テキスト音声変換(Text-to-Speech)および音声エージェントAPIに組み込めます。
xAIは「Custom Voices」という新機能を発表しました。ユーザーは短い録音だけで自分の音声をクローン化できます。xAIコンソールを通じて約1分の自然な音声を録音するだけで十分です。xAIによれば、音声モデルは2分以内に準備でき、同社のテキスト音声変換(Text-to-Speech)および音声エージェントAPIに接続できます。
xAIコンソールには80種類以上の音声を搭載した新しい「Voice Library」も追加されました。
「Custom Voices」は、xAIが最近発表した「Grok Speech-to-Text」および「Grok Text-to-Speech」API、ならびに「Grok Voice Think Fast 1.0」音声エージェントモデルに基づいています。xAIは、このモデルがすでにStarlinkのカスタマーサポートおよび営業部門で利用されていると述べています。
