Snowflake Summit 2026参加レポート ブレイクアウトセッション編③ AI活用の土台となるデータガバナンス

  • 公開日:
  • 最終更新日:

2026年61日~4日にサンフランシスコで開催されたSnowflake社によるグローバルで最大のイベント「Snowflake Summit 2026」に参加しました。
データ基盤の構築やデータにまつわるPoCの担当者が、本イベント内のセッションで語られた「AI活用の土台となるデータガバナンス」についてレポートします!

*Snowflake Summit 2026ブレイクアウトセッションレポート第一弾:Snowflake Summit 2026ブレイクアウトセッション編①AIエージェント時代のエンジニアの働き方
*Snowflake Summit 2026ブレイクアウトセッションレポート第二弾:Snowflake Summit 2026参加レポート ブレイクアウトセッション編② AIエージェント時代のデータエンジニアリング

ブレイクアウトセッション編①では「エージェント時代のエンジニアの働き方」を、ブレイクアウトセッション編②では「データエンジニアリングの変化」を見てきました。
今回のテーマは、AIを業務に任せる前提となるデータガバナンスです。
AIエージェントが賢くなるほど、最後に問われるのは「そのエージェントに、正しく・安全にデータを触らせられるか」です。
実際、会場でもAI導入の最大の懸念として繰り返し挙がっていたのが、ガバナンスとセキュリティでした。

今回は、Snowflakeおよびパートナー企業Anomalo社が、AIに安心して任せるための統制をどう実現するかを語ったセッションから、特に印象的だった3つのポイントをご紹介します。

AI活用の土台となるデータガバナンス ポイントその①:データカタログで、エージェントに「信頼できる回答」を返させる

1つ目は、Snowflake社による、データガバナンス基盤Horizon Catalogの紹介でした。
Horizon CatalogSnowflakeのデータガバナンス基盤。データの発見・分類・保護・監査を一元的に行う

たとえばCFOが「欧州の大口顧客の解約リスクは?」とエージェントに尋ねる場面を考えます。
ここで信頼できる回答を返すのは、実は簡単ではありません。登壇者は、それを阻む3つの壁を挙げていました。

  • 可視性:エージェントはSnowflake内のデータは見えても、必要な全データには届かない
  • 意味理解:カラム名が略号だらけで意味を読み取れず、結合の意味やビジネスルールも明文化されていない
  • 信頼性:古いデータや機密情報が露出するリスクがあり、操作の監査もできない

Horizon Catalogは、データ資産とAIエージェントの間に立つ接続レイヤーとして、この3つの壁を解決できます。

可視性

Snowflakeの中だけでなく、社外のデータレイクやERPCRMといった業務システムまでカタログに取り込み、横断的に検索・参照できるようにします。
CoCoを使えば、Postgresのような外部データベースに対しても自然言語で問い合わせられるようになります。エージェントが届く範囲が、Snowflakeの外側まで広がります。

意味理解

複数のソースから集めたメタデータを補強し、人・ツール・AIエージェントが同じ意味の定義(Semantic View)を共有できるようにします。
この共通の意味・コンテキストを束ねる層がHorizon Contextで、メタデータからSemantic Viewを自動生成するSemantic View Autopilotも備えます。カラム名やリネージ*といったコンテキストが自動で渡るので、エージェントはデータの意味を取り違えにくくなります。
Semantic View:テーブルやカラムの意味、指標の定義、結合関係などをまとめ、人やAIが共通の意味で参照できるようにしたSnowflakeの機能
Horizon Context ::Horizon Catalog内で、業務上の定義・指標・関係を一元管理し、あらゆるツールやAIエージェントへ共通のコンテキストとして提供する層
Semantic View Autopilot:集めたメタデータをもとに、セマンティックビューを自動で生成・更新する機能
*リネージ:データがどこから来て、どこで加工され、どこで使われているかという来歴・依存関係


会場にて撮影した写真

信頼性

信頼性の面では、150種類を超える判定ルールで、PIIPCIを自動で検出してタグ付けし、1つのポリシーを数千テーブルへまとめて適用できます。しかもこの保護は、BIの出力だけでなくエージェントの出力にも効きます。
さらにAI Guardrailsとして、プロンプトインジェクショへの防御に加え、モデルの回答がユーザーに届く前に、その人の権限で機微データを見てよいかを判定する仕組みも紹介されていました。
特に印象的だったのは、Intent-Driven Governanceです。「このデータに個人情報保護のルールを適用して」と自然言語で意図を伝えるだけで、人が読んでわかる文章で設定内容が示され、レビュー・承認するとSQLのポリシーが自動で適用される。設定がずれれば検知して管理者に通知します。SnowflakeSQLの知識がなくても統制をかけられる点が新鮮でした。なお、Intent-Driven Governanceは執筆時点ではプライベートプレビューとして提供されています。
*PII:Personally Identifiable Information、個人を特定できる情報
*PCI:Payment Card Industry、クレジットカード関連の情報
*プロンプトインジェクションAIへの入力に不正な指示を紛れ込ませ、意図しない動作や情報漏えいを引き起こす攻撃

AI活用の土台となるデータガバナンス ポイントその②:組織を越えてデータを安全に持ち寄る

2つ目は、Snowflake社による、Data Clean Rooms(DCR)*の紹介でした。
組織をまたいだ安全なデータ連携を、架空企業のシナリオで実演していました。題材は、スノースポーツ用ゴーグルの新製品ローンチです。
あるメーカーが、自社の過去購入者と、あるWebメディアの読者がどれだけ重なるかを知りたい。けれど、互いの顧客リストをそのまま相手に渡すわけにはいきません。
*Data Clean Rooms(DCR):複数の組織が、互いの生データを共有せずに、合意した分析だけを安全に実行できる環境

ここでDCRが効きます。2者以上が、生データを見せ合うことなく、測定や分析といった操作だけを安全に実行できる仕組みです。
運用者でさえ中身を覗けないオペレーターアイソレーション*が、この安全性を支えています。
実際のデモでは、両社のオーディエンスの重なりが87.5%と算出され、互いの顧客データは一切渡さないまま、必要な答えだけが得られていました。
*オペレーターアイソレーション:基盤の運用者を含め、許可されていない者がデータの中身にアクセスできないよう分離する仕組み


会場にて撮影した写真

運用面も実務的でした。コラボレーションにはオーナー、データ提供者、分析実行者といった役割があり、分析テンプレートは参加者全員の承認が揃って初めて実行できます。
誰かが勝手に踏み込んだ分析を実行できないよう、承認フローで担保しています。さらに、データの登録もYAMLSQLを手で書かず、Snowflakeのアシスタント「CoCo」に「このテーブルを登録して」と自然言語で依頼するだけ。
たとえばハッシュ化したメールアドレスは、両社のデータで同じ人を突き合わせる照合キーとしてだけ使い、メールの値そのものは相手に見せない。そうした列ごとの細かな制御も、自然言語の指示で設定できていました。
「プライバシーもガバナンスも、両方守る」。データを持ち寄るほど不安になるはずの場面で、安全と統制を前提として組み込んでいる点が、ガバナンスの考え方そのものだと感じました。
CoCoSnowflakeの生成AIアシスタント。自然言語での操作やコード生成に対応する

AI活用の土台となるデータガバナンス ポイントその③:データの変化を「先回り」で捉える

3つ目は、データ品質監視のAnomalo社による、自律型のデータ監視エージェントの紹介でした。Snowflake Venturesも出資するパートナーです。
AnomaloAIでデータ品質を自動監視し、異常の検知と原因分析を行うデータ品質管理ツール及びそのベンダー。Snowflake Venturesが出資

データ基盤の運用現場では、データの変化になかなか気づけません。ダッシュボードを更新するか、誰かの質問を受けて調べたときに、初めて差分に気づく。こうした後追い(リアクティブ)の監視に、手作業で追われている方は多いはずです。
紹介されていたエージェントは、この順番を逆にします。
ダッシュボードの更新も手動の調査もいらず、新しい値の出現、分布のシフト、ドリフト*といった変化を24時間365日バックグラウンドで検知し、要約と根拠を添えたレポートを自動で返す。何かが壊れてから動くのではなく、先回りで変化を捉えます。
*ドリフト:データの傾向や分布が時間とともに少しずつ変化し、過去の前提が崩れていく現象


会場にて撮影した写真

仕組みも理にかなっていました。まず統計モデルで変化を抽出して優先度を付け、それをAIに渡して解釈させる。汎用のLLMだけでは変化の意味を捉えにくいため、統計とAIで役割を分けているわけです。
さらに感心したのが検証エージェントの存在です。レポートが「平均が10%変化した」と言えば、別のエージェントが同じ指標を独立に計算し直し、本当に正しいかをダブルチェックする。
この検証がないと、最高性能のモデルでもハルシネーション*が残り続ける、と強調されていました。
壊れた値や異常値といった質の悪いデータを、下流のAIエージェントに渡さない。エージェントは渡されたデータを正しい前提として自信ありげに答えてしまうので、その手前で食い止める。これもまた、AIに任せる前提を整えるガバナンスの一部です。
*ハルシネーション:AIが事実に基づかない、もっともらしい誤った内容を出力してしまうこと

まとめ

3つのセッションに共通していたのは、ガバナンスを「AIの足かせ」ではなく「AIに任せるための前提」として捉えていたことでした。意味と保護を整えて信頼できる回答の土台をつくる、組織を越えるデータを安全に持ち寄る、データの変化を先回りで捉える。いずれも、エージェントが力を発揮する手前で、人が土台を用意する話です。
私たちが関わるのは、たいていデータ基盤やPoCの実装フェーズです。AIや非エンジニアが触れる範囲が広がるほど、その受け皿となるコンテキスト・ポリシー・検証を設計するエンジニアの役割は、むしろ重くなります。動くAIを、安心して任せられるAIにできるかどうか。その分かれ目はガバナンスの設計にある、と感じたSummitでした。

3回にわたってお届けしたSnowflake Summit 2026のブレイクアウトセッションレポートは、今回で締めくくりです。
最後までお読みいただき、ありがとうございました。

 本記事は、202664日時点の情報をもとに作成しています。製品・サービスに関する詳しいお問い合わせは、弊社Webサイトからお問い合わせください。
https://data-management.dentsusoken.com/snowflake/inquiry/

本サイトのブログ記事に加え、Snowflakeを中心としたデータエンジニアリング関連の技術的な情報を掲載したテックブログもWeb公開しております。
是非、こちらのテックブログもご覧ください。
https://zenn.dev/p/datatechblog