
ソフトバンクの子会社であるGen-AX株式会社は、コンタクトセンター向けの自律思考型AI音声応対ソリューション「X-Ghost」の提供を開始した。
Gen-AXは、生成AIを活用したSaaSプロダクトの開発や、企業のAIトランスフォーメーション(AX)支援を手掛ける企業で、国内のコールセンター業界が抱える労働力不足や高い離職率といった課題に直接取り組んでいる。
「X-Ghost」は今年7月に発表されていた製品で、今回正式に提供が開始されることになった。これにあわせてソフトバンクとGen-AXは11月10日、都内で記者説明会を開催した。
S2S技術と多層的安全設計で「人間らしい対話」を実現

「X-Ghost」は、企業のコールセンターやカスタマーサポートに導入され、AIが人間のオペレーターのように自律的に考えて応答することを目的としたサービスだ。
問い合わせ対応やよくある質問の解決、手続き案内、社内システムやAPIを介した情報取得などをAIが代行し、複雑な問い合わせは有人オペレーターにスムーズに引き継ぐ設計だ。これを導入することで、「顧客体験の向上」と「オペレーター負荷の軽減」を両立できることが期待できる。

X-Ghostの革新性の中心は、従来のボイスボットとは異なる「Speech-to-Speech(S2S)モデル」だ。従来のボイスボットは、音声認識→言語処理→音声合成(ユーザー音声をテキスト化し、応答内容を決定し、再度音声に変換する)という段階的なバケツリレー式の処理で応答を生成していたが、この過程で認識ミスの伝播やイントネーションの喪失、応答遅延が発生するなどの課題があった。
S2Sモデルでは、これらの処理をニューラルネットワーク内で一体化し、AIが音声を直接理解して応答を生成するため、自然で柔軟な会話が可能に。基盤には、OpenAIの「gpt-realtime」モデルが利用されている。記者説明会で披露されたデモでは、音声認識の一部に誤りがあっても会話が成立しており、従来技術との差が明確に示された。

顧客対応にAIを本格導入する上で、Gen-AXは、「生成AIの柔軟性」と「エンタープライズ」が求める高度な安全性を両立させるための多層的な設計を導入している。
- プロンプトシールド(ユーザー発話内容のチェック):メインのAIとは別のAIが、ユーザーの発話内容(音声認識でテキスト化されたもの)に、モデルから情報を引き出そうとする危険な意図がないかをチェックする。危険と判断した場合、AIが会話中であってもそれを遮断し、固定メッセージを流して通話を終了させるといったアクションを取ることが可能だ。これは、人間が発言を制御する「脳内プロンプトシールド」とおなじ振る舞いとなる。
- チェックリスト/メモリ/ファンクションコール: AIが応答内容を考える際、設定されたチェックリスト、メモリ(会話履歴)、社内データベース(API)を呼び出すファンクションコールを活用し、会話が逸脱しないように制御する。
- 出力チェック(ガードレール/ポリシー違反検知): 一般的なガードレールに加え、事前に定義された「言ってはいけない」ポリシーに違反しないかを検知。さらに、S2Sモデル特有の課題である、日本語の難しい単語や数字における読み誤り(発音間違い)が発生しやすい点に対し、Gen-AXは独自の仕組みでチェックし、再生成する機能を開発しており、現在特許登録手続きを進めている。
ターゲットは「コンタクトセンター市場」。三井住友カードとJALカードなどが先行事例

ターゲットは、国内で2024年度に2兆円規模に達すると予測されるコンタクトセンター市場だ。初期導入は数千席規模の大手金融機関や鉄道、運輸、メーカー、小売などのエンタープライズ企業を中心に想定する。
なぜコールセンター市場なのかというと、コールセンターは業務委託比率が高く、AI導入による効率化が収益改善(ROI)に直結しやすいためだ。また、企業の中で整理整頓されたデータが一箇所に集まっている「非常に良い領域」であり、ここで成果を出し、その後に範囲を広げていくのが最良のアプローチだとGen-AXは考えている。
エンタープライズのコールセンターは1,000種類以上の業務を抱えることもあり、AI導入には業務ヒアリングやエージェント構築に時間がかかる。そこで、Gen-AXは、業界知識や業務知識をテンプレート化し保有している。
例えば、パスワード再発行など、特定の企業の機密情報ではない「おおよそこういう手順で対応する」という業界標準的な業務知識をテンプレート化。これを利用することで、ゼロから業務分析やシナリオ作成を行わなくても迅速な導入が可能だ。また、テンプレートを活用するワークフロー編集ツール「X-Ghost Builder」も提供する。


先行導入の事例としては、三井住友カードとJALカードの2社が挙げられた。三井住友カードは、AIが質問の「本質」を捉え、社内データベース(API)を呼び出し、最新ステータス(料金未払いなど)を把握しながら課題解決に導く。同社は業務全体の7割の自動化を目指しており、Gen-AXの現実的な見通しでは、2年後で業務全体の約50%の自動化が目標とされている。
また、JALカードでは、顧客にIVR(自動応答)の深い階層をたどるストレスをかけず、簡単な応対はAIが解決し、複雑な質問は有人オペレーターにスムーズに引き継ぐ、といった仕組みを構築することを目指している。

Gen-AXは、今年12月に最初の特定顧客向けに最低限の機能を完成させ、2025年3月末までには、一般に利用できるプロダクトとしてX-Ghostを提供開始する予定だ。開発は2026年度以降も継続的に進められる。
また、広範なパートナーエコシステムを構築している。コンサルティングパートナーとしてJDSC、シグマクシスなどと連携し、PBXシステム(AvayaやGenesysなど)の既存ベンダーとも密に連携することで、インテグレーションの効率化を図っている。
将来的には、LINEの公式アカウントからのVoIP会話による問い合わせ対応や、Treasure DataのようなCDP(カスタマーデータプラットフォーム)と連携し、電話番号から顧客情報をパーソナライズ化することで、「人間が対応しても手間のかかるパーソナライズ化されたコミュニケーション」をAIが快適に提供できるようにすることを目指す。

まとめると、X-GhostはS2Sモデルと多層チェック機構によって実現した、リアルタイムで柔軟かつ安全な人間らしい対話を実現するAIオペレーターだ。
国内エンタープライズで成果を出しながら、将来的には公共公益性の高い領域など社会インフラ分野への実装や、セキュリティを確保したマルチテナントでのSaaS環境の準備を進めている。
そして、日本の高いクオリティと「おもてなし」の精神で磨き込んだコールセンター技術をAIが多言語で展開することで、国内の1兆円産業を一気に輸出産業に変えるという壮大な未来も描いている。
(画像:ソフトバンク/Gen-AX株式会社)



