行政データにおける機械可読性に関するルールをコード化する取組み

令和8年(2026年)3月31日に開催された、各府省庁DX推進連絡会議(第4回)・デジタル社会推進会議幹事会(第21回)合同会議において、「行政データにおける機械可読性に関するルール」が決定されました。

デジタル庁は、データと根拠に基づく政策形成(EBPM:Evidence-Based Policy Making)や政策効果の可視化に取組む立場として、独自のチェックシステムの開発やAIツール等による機械可読性の改善を目指し、「機械可読性に関するルール(内閣官房)(PDF形式) 」の正確な解釈を可能にする「データファイル(CSVとJSON形式)」を提供しています。本ルールやファイルは、行政内部のみならず、民間企業等においてもデータの機械可読性を向上させる取り組みに活用いただけます。

目次

1. 行政データにおける機械可読性に関するルール

取組みの背景

AI・デジタル技術の進展により、データは経済成長と社会課題解決の基盤的資源となっており、行政データの質の向上は国全体の重要な課題です。従来、行政が公表するデータの中には、紙へ印刷して人が見ることを前提としたフォーマット(セル結合や空行の挿入等)が採用されることもありますが、これらはデータ分析ソフトやAIにとっては処理しにくい構造となっています。

一般に、機械可読性の確保されていないデータを利用する際には、利用者側でデータクレンジングを行う必要があります。データ提供者側で適切なクレンジングを行うことは、転記ミスの削減、BIツールによる可視化、AI活用、EBPMの推進をはじめとした社会全体のコスト縮減に寄与します。特に行政が公開するデータは利用者(他の行政機関・民間事業者・研究者等)も多いことから、データクレンジングの負担軽減効果は他のデータよりも社会全体に広く及ぶものと考えられます。

3つのデータ品質のレベル

行政データにおける機械可読性に関するルール(内閣官房)(PDF形式) 」では、各府省の担当者が段階的に取り組めるよう、機械可読性の品質を3段階で整理しています。レベル1を「最低限、機械が読み取ることが可能となる基本ルール」と位置付け、レベル2・3ではより高度な機械可読性の確保に向けた技術的道筋を示しています。

具体的なルール例

各レベルでは下記のような具体的なルールが設けられています。

レベル1「閲覧・転記可能」レベル2「集計・分析可能」レベル3「連携・自動化可能」
説明行と列で区分けされた表形式で、文字や数値がコンピュータで認識可能な形式で保存されており、人が意図した通りに機械が読み取れる状態。列単位でルールが一貫しており、行をサンプル・列を変数として扱える統計データ形式。データ型(定量・定性)が明確で、欠損値の扱いが統一されている状態。標準化されたコード体系とメタデータ(単位、定義、更新履歴等)が整備され、時系列または他の統計調査と横断的に比較可能な状態。
ルール例「ファイル形式はExcelかCSVとする」「1シートに複数の表を掲載しない」「データが分断されていないようにする」「データ本体と無関係な情報は含まない」「1セル1データとする」「数値データは数値属性とする」「データ内での項目名等の省略をしない」「各列が一意に識別可能な項目名を記載」「選択肢回答を標準化する」「回答のコード表は別添とする」「データの単位を記載する」「時間軸の表記は標準化する」「データの定義や更新履歴を記載する」「データは縦持ち形式とする」

2. 機械可読性ルールのコード化

ルール適用の手順

機械可読なデータの作成に当たっては、以下のような手順でルールに対する適合性を確認する必要があります。

  • 1. 照合:ルールと照合し、適合状況を整理する
  • 2. 指摘:目標とするレベルに応じ、修正が必要な項目を列挙する
  • 3. 修正:ファイルを手作業又は機械的な処理により修正する

ルールのコード化

ルール適用手順のような定型作業の繰り返しには、AIをはじめ、機械によって自動化することが有効です。その際、独自のチェックツールやAIツール等に本ルールを参照させるためには、人間向けに作成したPDFの文書よりも、機械が読みやすい形式でルールを記述することが有用です。そのため、ルール自体を機械可読性の高いコード形式で公開します。

ルールのコード化の説明画像。ルールのみが存在する場合は目視で照合と修正が必要だが、ルールのコード化がされていると、AIツール等を利用して機械的なチェックが可能となる。という内容が示されている。

3. ルール一覧とコードをダウンロードする

行政データにおける機械可読性に関するルールのコード版

ルールの構造を機械が直接読み取って解釈できるように整理したコードです。独自のチェックシステム、AIツール等に読み込ませる場合の「設定ファイル」として機能します。参考として、設定ファイルを元にルール判定を行う機能のサンプル実装も作成し、掲載しています。

4. お問合せ先

ご質問やアイディアは、ご意見・ご要望よりお寄せください。