シリコンバレー2週間滞在型の社内プログラム「Tech Scouting」で実現した、構造化データ作成のための協業|Outerport×TOPPAN

TOPPANホールディングスは、2016年からCVC活動を開始し、これまで70社以上の国内外スタートアップに投資してきました。この流れを加速すべく、2022年には「TGVP(登記名:Toppan Global Ventures Partners Inc.)」を設立し、シリコンバレーを中心としたスタートアップへの出資を開始しています。

そのTGVPは2025年から、海外スタートアップとTOPPANの協業を生み出すべく、Tech Scouting Program(以下「Tech Scouting」)を開始しました。これは日本のTOPPANの事業部メンバーに2週間シリコンバレーに来てもらい、現地のスタートアップと直接面談しながら協業の可能性を探るプログラムです。

本記事では、実際にTech Scoutingを利用して出会ったシリコンバレーのスタートアップOuterport社と、TOPPANの「RAGデータ構造化サービス」の協業事例をお伝えします。

(左から)TOPPANグラフィックコミュニケーションズ浮嶋、TOPPAN 木村、Outerport 瀧川さん

非構造データを構造データにするAIエージェント

── 最初に、Outerportについて教えてください。

瀧川(Outerport):

近年のAI普及に伴って、AIエージェントを使って業務を改善しようとする企業が増えています。ただ、PDFや画像をはじめとする「非構造化データ」を、LLM(大規模言語モデル)を活用したChatGPTやGeminiといったサービスにそのままインプットしても、グラフがハルシネーションを起こしてしまうなど、上手くいかないケースは少なくありません。

Outerportはこうした問題を解決します。我々は、線グラフや棒グラフはもちろん、配線図や回路図が含まれる専門的な設計図面などの非構造化データを、AIが読み取れるようにHTMLやJSONデータに変換し、それを基にデータ基盤を構築する技術を開発しました。これを使って、高い精度で業務をこなせるAIエージェントを構築しています。

瀧川 永遠希 | TAKIKAWA Towaki

Outerport, CEO

新卒でNVIDIAに入社し、研究職としてコンピュータビジョンやシミュレーションのR&Dに従事。 CVPRやSIGGRAPHなど業界最先端の学会に論文が多数採択され、引用数は5000件を越える。起業し、世界的なアクセラレータープログラム「Y Combinator」に採択。現在は複雑な技術書類や図形・図面等を読み解くことのできるAIシステムの開発を行う。

── Outerportはどこか特定の業界を対象としているのでしょうか。

瀧川(Outerport):

最もフォーカスしているのは製造業とエンジニアリング会社(重工業やプラント建設など)です。設計図などの読み取りは難易度が高いうえ、設計図を軸としたインパクトの高い業務(新しい製品の開発や製造プロセスの最適化など)が多数あるからです。ただ、Outerportは様々な業界で使えるように開発を進めていますし、実際に様々な業界でご利用いただいています。

── Outerportは日米をはじめとして、グローバルでの利用を念頭にしていると思いますが、日本と海外で、企業が抱える課題は同じなのでしょうか。

瀧川(Outerport):

課題という意味では、基本的には世界共通です。ただ、アメリカのほうがSaaSの浸透が早く、既に一部の非構造データが当該SaaS上で構造化されています。そのため、SaaSとAIエージェントの統合が必要となり、アメリカではそれが課題になっていますね。今からデータ基盤を作るなら、むしろまだPDFで管理している日本の方が、早く対応できるかもしれません。

Tech Scoutingを利用してOuterportと接触

── 今回、Tech Scoutingを介してOuterportとの協業を開始したのが、木村さんたちですね。普段はどのようなサービスを運営しているのでしょうか。

木村(TOPPAN):

TOPPANは2024年から、「RAG(※)データ構造化サービス」を運営しています。

(※)RAG(検索拡張生成)とは、LLMが回答時に参照するPDFなどの社内の検索用データのこと

例えば、ある企業が、社内にあるPDFやワードといったドキュメント(非構造化データ)を構造化データにしたいとしましょう。瀧川さんが説明してくれたように、これを単にLLMに入れるだけでは上手くいかない場合が少なくありません。

我々のRAGデータ構造化サービスは、一旦我々が開発した自動変換ツールで非構造データを構造化し、さらに人の目でしっかりと校閲と修正を行う、というものです。これによって、最終的な構造データの信頼性を担保します。この「人手を介する」という点が、印刷会社ならではのプロセスですね。

木村 基仁哉 | KIMURA MOTOYA

TOPPAN株式会社 情報ソリューションBU セキュアDX事業部 事業戦略部 AIビジネス企画T

2016年にTOPPANホールディングス(旧凸版印刷)に入社。情報系の事業部にて4年間営業に従事。その後メガバンクのデジタルマーケティング部門への出向を経て、帰社後は営業企画や事業開発部門にて業界共通課題や新規テーマに関する新規事業開発を推進。

約3年前から生成AIを中心に活動をしており、RAGデータ構造化サービスを開発。

浮嶋(TGC):

RAGデータ構造化サービスの実際の運用は、TOPPANグラフィックコミュニケーションズ株式会社(TGC)が請け負っています。

同サービスの強みは、人手を入れることで、高品質な構造化データを作れる点です。ただそれは裏返せば、それだけ工数とコストがかかるということ。品質は高くなるものの、費用や納品期間は自動システムに劣ってしまいます。

特にネックなのは、図表の構造化です。「パワポ職人」という言葉があるように、日本の現場には、複雑なフローチャートやデザインを作り込んだパワーポイントやエクセル、ワードが多数存在します。それを機械のみで処理して構造化するのは難しく、人手で加工する必要があるのです。とはいえ、当然ながら、その工数は可能なら減らしていきたいと考えていました。

浮嶋 恭己 | UKISHIMA YOSHIKI
TOPPANグラフィックコミュニケーションズ株式会社 デザインセンター メディアコミュニケーション本部 クロスイノベーション部 3T
2024年にTOPPANグラフィックコミュニケーションズ株式会社に入社。入社以来、AI関連業務に従事。昨年度よりTOPPANエッジ株式会社(現TOPPAN株式会社)に常駐し、RAGデータ構造化サービスを共同開発。

木村(TOPPAN):

そんなときに話を聞いたのが、日本のTOPPANの事業部メンバーに、2週間シリコンバレーに来てもらい、現地のスタートアップと直接面談しながら協業の可能性を探るプログラム「Tech Scouting」でした。

木村(TOPPAN):

上記の課題を、シリコンバレーでスタートアップへの投資活動を行うTGVPのメンバーに伝えました。とはいえ、この時点で伝えていた課題は、もっと大雑把です。シリコンバレーの技術・レベル感がわからなかったので、まずは技術調査から始めました。

TGVPが実際に調査してくれた中で名前が出てきたのが、Outerportです。

瀧川(Outerport):

TGVPのメンバーから、「ドキュメント構造化のソリューションを探している」という内容の英語メールをいただいたんです。その後オンラインで面談して、TOPPANの皆さんがサンフランシスコに来るタイミングで、Outerportのシリコンバレーオフィスにお越しいただきました。

蛇足ですが、シリコンバレーには世界中から色んな方が視察に来るので、ここにいると全世界の方と会えるのは良いところですね。アメリカの中では日本との距離も近いので、関係を作りやすいと思います。

── TGVPはCVCなので、協業だけではなく出資も業務の一環です。Outerportとしては、資金調達ニーズもあったのでしょうか。

瀧川(Outerport):

当時は資金調達したばっかりだったので、直近のニーズはありませんでしたが、今後の資金調達に向けてコネクションは作っておきたいという状況でした。

PoCを経て、従来比1.6倍の作業スピードに

── 木村さんたちは、Outerportのどこに魅力を感じたのでしょうか。

木村(TOPPAN):

前提として、TOPPANのRAGデータ構造化サービスは、HTML形式で構造化データを作っています。そのためのノウハウも溜まっており、少々特徴的な構造化データを出力するのが特徴です。

ただ世の中の構造化サービスを見渡すと、HTML形式は少数派。我々はHTMLで作りたいのに、アウトプットの形式が異なっていたら、結局、後処理の工数が下がらないということは十分ありえる。また、先述した通り我々の構造化データはAIの可読性のために少し特徴的な作りをしているため、ツール側に何かしらの形で対応してもらうことは不可欠でした。

その点からOuterportの技術を聞いたところ、HTML形式で出力でき、我々の構造化データに合わせて構造化の仕様もチューニングできることが判明しました。図表の構造化精度にも自信があると言います。これならTOPPAN側の作業工数削減やサービスレベルの向上が見込めると感じました。

Outerportと並行して、もちろん他社の技術も確認しました。構造化ツールは次々に登場していますからね。ただ、精度高く図表を構造化してくれるツールはみつかりませんでしたし、我々との連携も難しそうでした。それでOuterportとの取り組みを進めることにしたんです。

浮嶋(TGC):

OuterportとのPoCが決まり、ひとまず最低限の対応をして図表の読み取りをしてみたら、今までよりはるかに高い精度でのアウトプットが出てきたので驚きました。

── PoCはスムーズに進んだのでしょうか。

木村(TOPPAN):

Outerportとは、約4ヵ月、PoCを実施しています。ちなみに、私はその間にシリコンバレーに行きました。

TOPPANとしては順調にPoCを進められたと感じています。両社の間に、解決すべき課題と目指すべき世界観の差がなかったのが良かったですね。

Outerportは、生成AIを世の中の様々な業務に適応させていくために、まずは非構造化データを構造化しなければいけないと考えています。我々も、人手を入れながらのアプローチではあるものの、考えていることは同じです。

瀧川(Outerport):

Outerportとしても、大きな困難は感じませんでした。木村さんが語ってくれたことに加え、わざわざサンフランシスコのスタートアップ企業と協業するくらいTOPPANの熱意が高かったことが大きかったと思います。パートナーに恵まれました。

浮嶋(TGC):

もちろん、何もかもが順調にいったわけではありません。でも何か課題が挙がると、Outerportは次のミーティングまでにサービスをアップデートしてくれているんです。シリコンバレー流のサービス開発の速さに驚きました。

瀧川(Outerport):

ちなみに、国・地域によってPoCの型は変わるんです。例えば日本でPoCと言えば数ヶ月の規模をイメージしますが、アメリカだと2週間のパイロットテストを指すことも少なくありません。Outerportは日本企業との取引にも慣れているので、そういう意味でも、あまり難しさはありませんでしたね。

── PoCの成果を教えてください。

木村(TOPPAN):

概算と対象の文書次第ではありますが、Outerportを利用することで、RAGデータ構造化サービスは従来比1.6倍の作業スピードを出すに至りました。それに伴いコストダウンも見込んでいます。

実際にどれだけ顧客に対する提供価値が変わるかはこれからさらに検証を重ねる必要がありますが、PoCとしては良い結果が得られました。現在はOuterportのツールを介して、どうしたらより効率的に構造化データを作れるか、議論しているところです。

瀧川(Outerport):

一旦システムで構造化した結果が、100%の精度ではなくても大丈夫なケースもあれば、100%でないと問題があるというパターンもあります。後者の100%の場合をTOPPANと検討できたのは、Outerportとしても今回のPoCには意義がありました。

特に、人による構造化データの修正を行うための機能を増やすことで、100%の構造化の工数を減らせたのは、面白い発見でした。サービス開発者としては、とにかく細部までこだわることがユーザーへのバリュー提供に繋がることがわかり嬉しかったです。いわゆる”Human in the Loop”ですね。この経験は他の開発の考え方にも強く影響しています。

浮嶋(TGC):

繰り返しになりますが、非構造データを構造化するといっても、Outerportは全自動で、TOPPANは人手を介するサービスです。正直にいうと最初は、本当にこの乖離を埋められるのか不安もありました。

ただOuterportは、両者を統合するための課題が出てくるたびに、人が修正しやすいようにツールをどんどん改修してくれたんです。だんだんと我々の作業メンバーの効率が上がっていく様は、見ていて一種の感動を覚えました。

Outerportを組み合わせたサービスの展開へ

── PoCまで終えてみて、協業相手としてのTOPPANの印象を教えてください。

瀧川(Outerport):

全体的に、ちょうどいいカジュアルさでした。シリコンバレーはちょっとカジュアルすぎるところもあるんです。それは見た目だけでなく、例えばユーザー側のニーズをしっかりと伝えてくれない事もあるという面にも表れていて、サービスプロバイダーはその点に注意しなければなりません。

一方で日本は、スーパーフォーマルな会社もありますよね。TOPPANの場合は、かしこまりすぎてもいないし、コミュニケーションもしやすく、仕事がしやすかったです。人と人とのコミュニケーションを支えてきた印刷業としてのルーツならではの特徴かもしれませんね。

── Tech Scoutingを行った感想を教えてください。

木村(TOPPAN):

私はちょうどOuterportとPoCに取り組んでいる最中にシリコンバレーに行ったので、Outerportの技術や今後の連携についての議論を重ねました。やはりオンラインだとなかなか伝わりきらない部分もあるので、そのあたりは対面で話をして、理解が膨らみました。やっぱり行って良かったと感じています。

── 逆に、何か課題は感じていますか?

木村(TOPPAN):

瀧川さんは、ずっとアメリカにいるんですよね。

瀧川(Outerport):

私はオレゴン州の出身です。大学時代はカナダのトロント周辺で過ごしましたが、卒業してからはサンフランシスコに住んでいます。今は日本と半々ぐらいの生活ですね。

余談ですが、オレゴン州は半導体製造が盛んで、トロントは深層学習が発展した場所なんです。サンフランシスコはOpenAIやAnthropicなどAIの応用技術の聖地なので、何かとAIと因縁深い人生を送ってきました。それらの場所から得た知見を日本に持って帰れるのは、個人的に嬉しく思っております。

木村(TOPPAN):

そんな経歴なので、瀧川さんは英語も日本語も堪能なんです。瀧川さんと話していたときがたまたま天気が悪い日で、雷のことを「雷鳴」と言っていたんですよね。そのときに日本語でのコミュニケーションが問題ないことを確信しました(笑)。

通常、海外企業と連携する際にはどうしても言語が問題となります。今回は瀧川さんが日本語も堪能だったのでその問題は発生しませんでした。表面的な会話ならまだしも、お互いの技術を深く理解していくためには、言語の壁はハードルのひとつになると思います。

── PoCが終わり、今後はどのような協業体制を築いていくのでしょうか。

浮嶋(TGC):

まずは今の話の延長線上として、RAGデータ構造化サービスにOuterportを連携したサービスパッケージを作るのが当面の目標です。また、現在は事務マニュアルの非構造化データ対応を念頭に置いていますが、製造業の図面などもOuterportと対応できるようにしていきたいですね。

木村(TOPPAN):

これはまだ構想段階ですが、いずれは、我々が作った構造化データを得意先でマネジメントするための構造化データ管理プラットフォームを開発できないかと考えています。その際、OuterportにAPI連携して、自動で構造化できる機能ができれば、利用者の利便性が高まるはずです。

瀧川(Outerport):

日本の工場の話を聞いたり、現場を実際に見ていると、まだまだ紙の図面や書類に頼っているところが少なくないことがわかります。データを構造化するどころか、そもそも書類をスキャンするところから始めなければなりません。印刷会社であるTOPPANとなら、そういった点へ対処するにも大きなシナジーが見込めるでしょう。

またOuterportとしては、TOPPANの素材系の研究開発、製造部門とも連携可能性があるのではないかと思っています。そういった意味でも、今後はより一層の協業を深めさせてください。よろしくお願いします。

木村(TOPPAN):

まずはOuterportとRAGデータ構造化サービスのサービスパッケージを形にしていきましょう。こちらこそよろしくお願いします。

(取材・執筆:pilot boat、撮影:ソネカワアキコ)