本文へ移動

「日本の法令に関する多肢選択式QAデータセット」を公共データ利用規約を適用させて試験公開しました

デジタル庁は、「日本の法令に関する多肢選択式QAデータセット」を公共データ利用規約(PDL)※を適用させて、AI担当とオープンデータ・GIF担当によって試験的に公開しました。
日本の法令に関する多肢選択式QAデータセット(GitHub)
※ 公共データ利用規約(Public Data License(PDL)):国や地方公共団体がコンテンツをオープンデータとして公開する際に使用する利用規約(ライセンス)で、クリエイティブ・コモンズのCC BY4.0と互換性がある。

データセットについて

AIを業務で安心して使うためには、そのAIがどれくらい賢く、正しい答えを出せるのかを事前に確認することが不可欠です。このデータセットは、特に企業の法務部門で実際に起こりうる課題を想定して作成しており、AIが法務部門の実務でどこまで通用するのかを測ることを目標としております。このデータセットには問題文と回答のほか、実務で参照する可能性のある法令の抜粋も含まれております。

公共データ利用規約(PDL)について

今回のデータセットの公開に際して公共データ利用規約(PDL)を採用していますが、GitHubにおいて「公共データ利用規約」をライセンスとして公開するのは初となります(デジタル庁調べ)。
GitHubでの公開により、技術者やデータサイエンティストが容易にアクセスでき、アプリケーション開発や研究、さらにはAI・機械学習への活用も促進されます。今後、他のデータポータル等においても、データセット公開時のライセンスとして、公共データ利用規約(PDL)の適用を推進してまいります。

期待される効果について

今回のデータセット公開により、各行政機関でAI導入を検討する際の判断材料となり、具体的な議論のきっかけになることを目指しています。
また、公共データ利用規約(PDL)の適用によってオープンデータが推進され、民間企業による新たなサービス創出、AIモデルの開発、市民による地域課題の可視化、学術研究の発展など、多様な二次利用によって、データを起点とした社会課題解決やイノベーション創出に貢献し、行政の透明性向上とともに、データ駆動型社会の実現を目指します。

関連情報

シェアする: