NTTコミュニケーションズ株式会社のロゴ

    NTTコミュニケーションズ株式会社

    企業が保有する膨大なデータの活用を促進する「rokadoc」のパブリックベータ版を公開

    ~生成AIやRAGの精度を高めるデータ構造化技術~

    サービス
    2025年2月19日 13:45

     ドコモグループの法人事業ブランド「ドコモビジネス」を展開するNTTコミュニケーションズ株式会社(以下NTT Com)は、生成AI・RAG※1向けデータ構造化技術である「rokadoc」のパブリックベータ版を2月19日より公開します。「rokadoc」のパブリックベータ版※2では、ドキュメント構造化機能を試用できます。

     

    1.背景

     近年、生成AIと企業が保有する膨大なデータを組み合わせて活用する事例が増えています。一方で、企業が保有するデータの多くは非構造化データ(PDF、HTML、画像、各種文書など)のため、生成AIが正しく理解することができず、期待する検索・回答精度が得られないという課題があります。

     NTT Comは、こうした課題を解決し、企業における生成AI利用時のデータ活用を促進することをめざして、図表を含む非構造化データを高精度で構造化データ(タグ付けされたテキストデータ)へ変換する「rokadoc」を開発しました。「rokadoc」を利用することで、システムや製品のマニュアルをもとに質問に回答するチャットボットや、生成AIを用いた企業内ナレッジ検索時の回答精度向上への活用が期待できます。

     

    2.本技術の概要

     本技術は、非構造化データを生成AIに適した構造化データに変換します。

     ドキュメントのファイル形式はWord、PowerPoint、Excel、PDFに対応し、変換したテキストは任意の生成AI技術(AIエージェント※3やRAG)と併用可能です。

    <本技術のイメージ>

     

    3.本技術の特長

     本技術の特長は以下の通りです。

    (1)画像情報をテキスト形式に変換

     ドキュメントにはテキストのみならず多くの画像が含まれます。「rokadoc」は独自のレイアウト解析技術により、テキストや画像を高精度に区分けし、画像からは説明文(キャプション)を生成します。

    <画像から説明文を生成しているイメージ>

     

     

    (2)複雑な表構造にも対応

     業務で使われる表構造にはさまざまなパターンが存在します。たとえば、結合セルの有無や罫線の有無などによりバリエーションが多くあります。「rokadoc」はこれらの形式にも対応して、構造化されたテキストで表構造を出力します。


    <表のレイアウトを解析して構造化されたテキストを出力しているイメージ>

     

     

    (3)RAG併用可能

     RAGで期待する結果を得るためには、第一に最適なドキュメントを取得する必要があります。

     「rokadoc」をRAGの検索に適用することで、以下の図のように類似技術に比べて高い精度を確認しています。

    <他社製品の検索精度比較※4>

     

    4.公開開始日

     2025年2月19日

     

    5.ご利用方法・料金

     以下のURLからユーザー登録をお願いします。

     https://rokadoc.ntt.com/

     ユーザー登録後、無料でパブリックベータ版をご利用いただけます※6

     

    6.今後の展開

     今後、NTT Comは、「rokadoc」のパブリックベータ版を通じて、顧客課題やフィードバックを集めながら精度を高め、本格提供に向けた準備を進めていきます。

     また、自社開発の「rokadoc」に加えて、パートナー企業と連携し、データ加工技術やデータマネジメント基盤、コンサルティングサービスなども組み合わせた統合ソリューションを2025年度から提供開始し、企業における生成AIを用いたデータ活用を推進します。

         

                  

    NTTドコモ、NTT Com、NTTコムウェアは、ドコモグループの法人事業を統合し、法人事業ブランド「ドコモビジネス」を展開しています。私たちは社会・産業DXのマーケットリーダーとして「つなごう。驚きを。幸せを。」をスローガンに、人と人をつなぎ、コミュニティをつなぎ、さまざまなビジネスをつなぐことで、新たな価値を生み出し、豊かな社会の実現をめざします。

    https://www.ntt.com/business/lp/docomobusiness/db2024_sol.html




    ※1:RAG(Retrieval-Augmented Generation)とは、大規模言語モデルによるテキスト生成時に、外部情報を活用して推論の精度を高める技術のことです。

    ※2:パブリックベータ版とは、一般のユーザーに広く公開して誰でも試用可能とするバージョンです。

    ※3:AIエージェントとは、ユーザーの質問から目的を理解し、自律的に目的達成に向けタスクを分解し、実行するAIシステムのことです。

    ※4:今回の検索精度の比較では、ベクトル検索※5から得られた関連ドキュメントが期待通りである場合(関連度1位に正解が来た場合)に1.0となるように試算するNDCGスコアを利用しました。精度測定では、各製品・技術から出力されたテキストのみを使用しており、画像を用いたベクトル検索は用いない条件で評価を実施しました。

    ※5:ベクトル検索とは、ユーザーの質問とドキュメントの内容を数値化(埋め込みに)し、その「意味的な近さ」に基づいて関連性の高い結果を返す技術のことです。

    ※6:パブリックベータ版の利用については、ユーザーごとに利用回数を制限させていただく可能性があります。  

    シェア
    FacebookTwitterLine

    配信企業へのお問い合わせ

    取材依頼・商品に対するお問い合わせはこちら。
    プレスリリース配信企業に直接連絡できます。

    NTTコミュニケーションズ株式会社

    NTTコミュニケーションズ株式会社