プレスリリース
マクニカ、RAG実用化の壁「非構造化データ」の整備を自動化する Unstructured社と国内初の販売代理店契約を締結
~属人化解消と運用負荷軽減を実現し、企業独自のAI活用を支援~
株式会社マクニカ(本社:神奈川県横浜市、代表取締役社長:原 一将、以下マクニカ)は、Unstructured Technologies, Inc.(本社:カリフォルニア州、CEO:Brian Raymond、以下Unstructured(アンストラクチャード)社)と国内初となる販売代理店契約を締結し、非構造化データを LLM (大規模言語モデル)が扱いやすい形へ自動的に整備するプラットフォーム「Unstructured」を提供開始することを本日発表いたします。
■RAG普及と非構造化データ整備の課題
近年、LLMの普及により、生成AIを活用したナレッジ検索や業務効率化への期待が高まっており、社内文書を活用した RAG(検索拡張生成)の構築に取り組む企業が増えています。
一方、企業内に存在する営業資料、契約書、マニュアル、技術文書などの非構造化データは、ドキュメントの形式が多岐にわたるため、段落や見出し、表、画像といった構造をAIが正確に把握できないケースが多く見られます。その結果、RAGにおいて検索漏れや文脈の誤解釈が生じ、PoC では問題なく動作しても、本番環境では精度が安定しないといった課題が顕在化しています。
そのため、RAG構築においては、こうした非構造化データをAI活用に適した形へ整備することが不可欠です。しかしながら、一般的なデータ整備プロセスでは、設計担当者が文書ごとにチャンク設計や情報抽出ルールを設計・調整する必要があり、高い専門性を要するうえに属人化しやすいといった課題があります。さらに、文書量の増加や内容更新のたびに再調整が発生するため、運用フェーズにおける工数負荷は継続的に増大します。その結果、AIモデル自体の性能ではなく、データ整備及び運用の負荷がボトルネックとなり、生成AI活用の本格展開に至らない、あるいはプロジェクトが停滞してしまうケースも少なくありません。
■Unstructuredによる解決のアプローチ
Unstructuredは、非構造化データを LLM が扱いやすい形へ自動的に整備するプラットフォームです。一つの文書内に含まれる段落や見出し、表、画像などの構造を保持したまま JSON* へ変換することで、RAG の精度及び安定性の向上に寄与します。
これにより、従来は設計担当者が文書ごとに行っていた細かいチューニング作業や更新文書への再対応に伴う工数を大幅に削減し、属人化の解消と継続的な運用負荷の軽減を実現します。
【Point1】各種クラウドサービスとの連携コネクターを標準装備
各種クラウドサービスと標準コネクターで連携し、非構造化データを他ストレージへ移動・複製することなく、更新を含めた継続的な処理を可能にします。
【Point2】「RAG・生成AI活用」をゴールに据えた前処理設計
文書構造を考慮したパーティショニングや、意味を損なわないチャンク設計、後段のAI処理を見据えたメタデータ付与により、非構造化データをそのまま業務で活用できる状態へ変換します。
【Point3】ノーコードで始められる、迅速なPoC・導入
ノーコードのGUIを備えており、複雑な非構造化データ処理を、専門知識を持たないユーザーでも安定して実行できます。
【Point4】コンプライアンス及びセキュリティ基準への準拠
HIPAA、SOC 2 Type 2、GDPR、ISO 27001など、データ保護及び情報セキュリティ関連の法令、規制、業界標準に準拠しています。

マクニカは今後、企業が既に利用しているデータ基盤やコンテンツ管理基盤との連携設計から導入まで一貫して支援することで、日本企業における生成 AI の実用化を加速してまいります。
本発表にあたりUnstructured Technologies, Inc. CEO Brian Raymond氏は、次のように述べています。
「世界中の企業データの約80%は非構造化データであり、PDF、メール、プレゼンテーション、各種ドキュメントの中に埋もれたまま、AIシステムからは十分に活用できていません。これこそが、企業における生成AI導入を阻む最大のボトルネックであり、業界を問わず多くの組織から寄せられている共通の課題です。日本のエンタープライズ市場に対する深い知見と、最先端のAIソリューションへの強いコミットメントを持つマクニカは、Unstructuredを日本に展開する上で理想的なパートナーです。両社の協業により、日本企業が自社データの持つ真の価値を解き放ち、生成AIのPoC(概念実証)から本番環境での大規模展開へと移行できるよう支援していきます。」
*:JSON (JavaScript Object Notationの略)は、データを「項目名」と「値」の組み合わせで表現する、システム間で広く使われているデータ記述形式。
【製品の詳細はこちら】
URL:https://www.macnica.co.jp/business/dx/manufacturers/unstructured/
【製品に関するお問い合せ先はこちら】
株式会社マクニカ Unstructured製品担当
E-mail:unstructured-sales@macnica.co.jp
※本文中に記載の社名及び製品名は、株式会社マクニカ及び各社の商標または登録商標です。
※ニュースリリースに掲載されている情報(製品価格、仕様等を含む)は、発表日現在の情報です。その後予告なしに変更されることがありますので、あらかじめご承知ください。
Unstructured Technologies, Inc.について
社名 : Unstructured Technologies, Inc.
設立 :2022年 8 月 4 日
代表取締役 CEO:Brian Raymond
所在地 :901 H St Ste 120 Sacramento, CA 95814
事業内容 :LLM向けETLプラットフォームの開発および提供
URL :https://unstructured.io/
メディアコンタクト:stefanie@unstructured.io(Unstructured Stefanie Segar)
株式会社マクニカについて
マクニカは、半導体、サイバーセキュリティをコアとして、最新のテクノロジーをトータルに取り扱う、サービス・ソリューションカンパニーです。世界28か国/地域91拠点で事業を展開、50年以上の歴史の中で培った技術力とグローバルネットワークを活かし、AIやIoT、自動運転など最先端技術の発掘・提案・実装を手掛けています。
マクニカについて:www.macnica.co.jp