データポリシーで対象とするデータとは…?

「研究」データってどこまでを指すのだろう、データポリシーで対象とすべきデータの定義や範囲って、結局なんなんだろう、と思って調べています。とりあえずなメモです。でも…うーん…知りたいことが調べられていないなーと思っています。もやもやもや……。

「国際的動向を踏まえたオープンサイエンスに関する検討会」報告書(2015/3/30)
2.オープンサイエンス推進の基本的考え方 (3)公的研究資金の定義及び研究データの範囲
公開の対象となる研究データには、メタデータ、数値データ、テキストレコード、イメージ、ビジュアルデータなど多様なデータが含まれる。

国立研究開発法人国立環境研究所データの公開に関する基本方針(データポリシー)(2017/4/1)
2.公開するデータの範囲
国立環境研究所が研究活動を通じて取得・作成したデータのうち、研究成果として公開したデータの他、公益性や社会的ニーズが高く、公開することが適当であると判断したデータを公開対象とする。個人情報保護の観点や、産業技術情報の保護その他の観点から、国立環境研究所が公開は適当でないと判断するデータについては、公開の対象外とする。
https://www.nies.go.jp/kihon/kitei/kt_datapolicy.pdf

宇宙科学研究所のデータポリシー(2018/3/14)
3. 本ポリシーが対象とするデータの定義
本ポリシーにおいて、「データ」とは、広い意味で科学的な価値を持つ情報であり、特定の物理的な媒体に依存せずに、汎用的・長期的に利用できるものを指します。汎用的な利用を想定していない個人的なメモや写真などの情報、研究グループの非公式のレポートや会議録、長期的利用を想定していない一時的な情報、物理的な実体としてのサンプルなどは、このポリシーの対象となるデータには含まれません。

以下に、ここで扱うデータの代表的な例と、簡単な説明を述べます:

  • 源泉データ: 衛星テレメトリなど、定まったフォーマットで判読されることが必要で、データ処理の源泉となるもの。これから適切なデータ処理を行うことによって、観測データや工学データなどを生成することができる。
  • 観測データ: 衛星、探査機、大気球、観測ロケットなどによって、天体や宇宙現象など、制御できない対象の物理的状態を測定した数値データ。多くの宇宙現象は顕著な時間変動を示すので、同じデータを再現できないことがある。
  • 工学データ: 衛星、探査機、装置の軌道、姿勢、温度など、データを取得する側の物理的状態を記述した数値データ。
  • 実験データ: 観測者が、対象に何らかの意図的な操作を加えることによって測定した数値データ。多くの場合、実験を繰り返すことにより、同じデータを再現することができる。
  • シミュレーションデータ:観測データ・工学データ・実験データなどを模擬するために、計算機によって生成されたデータ。計算を繰り返すことにより、同じデータを再現することができる。
  • 探査機で得られた小惑星サンプルや微少重力実験で得られたサンプルの分析結果を定量化した数値データや、探査機が測定した天体の形状を再現した数値データなど。分析・再現精度が向上することによって、改訂されることがある。
  • 汎用的・⻑期的な利用を意図して作成された、デジタル化された書類、写真、画像、映像など。

また、各データを記述するためのデータ(メタデータ)や、データを利用するために必要なツール、ソフトウェア、アルゴリズム、説明文書等も、対応するデータに準じて扱います。
http://www.isas.jaxa.jp/researchers/data-policy/

統合イノベーション戦略(2018/6/15)
第2章知の源泉 (2)オープンサイエンスのためのデータ基盤の整備 注
研究成果(論文等)の根拠となるものを含む。
https://www8.cao.go.jp/cstp/tougosenryaku/index.html

国立研究開発法人物質・材料研究機構研究データポリシー(2019/8/1)
2.対象とする研究データ
(1)データの形式
電磁的方式(電子的方式、磁気的方式、光学的方式その他人の知覚によっては認識することができない方式をいう。)で記録されたもの。
(2)データの種類
イ 機構の職員等が職務上得た研究成果物等のうち、論文、データベース、ソフトウエア等として一般に公表されたもの
ロ 機構の職員等が職務上得た研究成果物等で一般に公表されていないもの(論文等の公表データの元となったバックデータ等を含む。)のうち、機構が組織として収集・保管し、利活用を図るべきものとして選定したもの
ハ 機構外の者が作成した研究データであって、機構が構築する材料データプラットフォーム(以下「材料 DPF」という。)等を通じた利活用を図るため、機構が提供を受けたもの
https://www.nims.go.jp/nims/disclosure/hdfqf10000001742-att/NIMS_research_data_policy_20180801.pdf

EPSRC policy framework on research data
Scope and benefits
研究データは研究結果を検証するために必要であると科学界で一般に受け入れられている、記録された、事実資料として定義される。
https://epsrc.ukri.org/about/standards/researchdata/scope/

University of Oxford Research data management and open data policy
Research data glossary
研究データ及び記録は(それらが存在する形式や媒体に関わらず)研究プロジェクトの所見、発見または成果を、支持または検証するために必要な記録された媒体として定義される。
http://researchdata.ox.ac.uk/wp-content/uploads/sites/126/2014/01/Policy_on_the_Management_of_Research_Data_and_Records.pdf

DOE Policy for Digital Research Data Management: Glossary
Digital Research Data
デジタルデータという語はデジタル形式で保存された様々な情報である実験、観測、シミュレーションデータ、コード、ソフトウェア、及びアルゴリズムテキスト、数値情報、画像、動画、音声、そして関連するメタデータを含む。また、生データ、処理データ、分析データ、公開データ、アーカイブデータなど様々な形式の異なる情報を含む。

このポリシーはデジタル研究データに焦点を当てる。これは電子的に保存されて電子的にアクセスできる研究データのことである。研究データは「2 CFR 215 (OMB Circular A-110) 」に続く「2 CFR 200.315 (e)」で定義されており、その定義は下記のとおり。

研究データは研究結果を検証するために必要であると科学界で一般に受け入れられている、記録された事実資料として定義されるが、以下のいずれにも該当しない。予備的分析、科学論文の草稿、将来の研究計画、査読、または同僚とのコミュニケーション。この「記録された」資料は有体物(例えば実験サンプル)を除く。
研究データは同様に以下を含まない。

(A)営業秘密、商業情報、講評されるまで研究者によって秘匿される必要がある資料、または法律で保護ざれている同様の情報
(B)個人情報、医療情報、及び調査研究で特定の人物を識別するために使用する情報のように、開示が個人のプライバシーを明らかに不当な個人のプライバシーの侵害をなす同様の情報

https://www.energy.gov/datamanagement/doe-policy-digital-research-data-management-glossary