オカレンスデータ

Introduction

通常、ある種が特定の場所で、特定の日に発生したという証拠を提示する資料。これらのデータセットは、種の歴史的または現在の分布のマッピングに貢献するため、ほとんどのチェックリストデータを拡張するものです。データは細かい地図作成に必要な座標と座標精度を含んでいるのが理想的ですが、このようなデータセットには一般的な地域情報(国の識別子に限定されることもある)しかないことがほとんどです。またこれらのデータセットには同じ種の複数の個体が別々に記録されていることが多々あり、自然史コレクションの標本データベース、市民科学の観察、種の地図帳プロジェクトのデータなどが例に挙げられます。もし十分な情報が元のデータセットに存在するのであれば(あるいはデータセット内のすべてのオカレンスに一貫して当てはめられるのであれば)、これらのデータセットは サンプリングイベントデータ として提示することが推奨されています。これらのデータセットには、リソースメタデータに含まれるのと同じ基本的な記述情報が含まれます。

データをオカレンスデータに変換する方法

flow od

最終的には、ダーウィンコア(DwC)の用語名を列名として使用したテーブル構造にデータを変換する必要があります。

すべての必須DwCフィールド推奨DwCフィールドを含むExcelテンプレートにデータを入れてみてください。

または、データが対応データベースに保存されている場合は、DwCの列名を使ってSQLテーブル(ビュー)を書くことができます。必須DwCフィールドをすべて含み、推奨DwCフィールドをできるだけ多く追加するように注意してください。

さらなるガイダンスとして、サンプルデータセットを見ることもできます。

DwCカラムを追加してテーブルを拡張することもできますが、利用できるのはリストにあるDwC用語のみです。

テンプレート

Excelテンプレート Excelテンプレート(サンプルデータ含)

それを入力し、IPTにアップロードしてください。できるだけ多くのDwC用語を追加してみてください。

DwCの推奨フィールド

サンプルデータセット

よくある質問

Q. 種が存在しないことを示すにはどうすればいいですか?

A. occurrenceStatus="absent"に設定してください。さらに、individualCountorganismQuantityは0としてください。

Q. センシティブな種のオカレンスデータを一般化するにはどうすればいいですか?

A. センシティブな種のデータをどのように一般化するか(例えば、データの解像度を制限するなど)は、種のセンシティブさのカテゴリーによります。逆効果のリスクが低い場合、センシティブな種データを制限なしに公表することは依然として適切です。センシティブな種のオカレンスデータを保護することは、公開者の責任であることに留意してください。ガイドとしては、このベストプラクティスガイドを参照してください。また、Science誌の最近の論文を参照することもできます。この論文では、センシティブな種のデータを公開することによるリスクを評価するために使用できる簡略化した評価スキームを紹介しています。

データを一般化する際は分析に必要なデータの価値を下げないようにし、ダーウィンコア用語 informationWithheld を使用して、元の記録がなぜ、どのように変更されたかをユーザーに知らせる必要があります。

ベストプラクティスガイドに示されているように、一般化されるセンシティブな種のチェックリストも公表する必要があります。またそれぞれの種に対し、以下の事項を説明する必要があります。

  • リスト掲載の根拠

  • センシティブな種の地理的範囲

  • センシティブのカテゴリー

  • センシティブかどうか見直しを行う日付

これにより、他のデータ管理者に、これらの種が特定の地域で潜在的にセンシティブであるとみなされ、分析結果などを公表する際にセンシティブな状態を考慮する必要があることを伝えることができます。

地点の位置を一般化するための便利な計算式

次の式は、緯度・経度の点を5000m単位で隠蔽します。注:pointXとpointYは「長さ(m)」で指定し、TRUNCは小数点以下を切り捨てて整数にします。

pointX = TRUNC(pointX / 5000) * 5000
pointY = TRUNC(pointY / 5000) * 5000