Lista de verificación de la calidad de los datos
Use esta lista de comprobación para ayudar a revisar los conjuntos de datos sobre biodiversidad. Tenga en cuenta que es especialmente adecuada para verificar los conjuntos de datos de registros biológicos y eventos de muestreo.
El listado de verificación ayudará a asegurar que los datos estén completos, es decir, que contengan respuestas válidas a las siguientes preguntas:
-
data-quality-checklist#quién-participó-en-el-evento[¿Quién participó en el evento?]
-
data-quality-checklist#cuándo-tuvo-lugar-el-evento[¿Cuándo tuvo lugar el evento?]
-
<<¿Por qué tuvo lugar el evento?>>
Algunos ejemplos de eventos son la observación de una especie, la colecta de un espécimen físico o un evento de muestreo biológico.
Adicionalmente, el listado de verificación asegura que los Metadatos del conjunto de datos contienen también respuestas a las cinco preguntas para facilitar la reutilización de los datos.
Instrucciones
Si el conjunto de datos ha sido registrado con GBIF, comience revisando la página de "Estadísticas" del conjunto de datos. Aquí encontrará las incidencias que GBIF descubrió al interpretar el conjunto de datos:
A continuación, lea los metadatos del conjunto de datos para lograr un mejor conocimiento de los datos.
Después, cargue los datos en OpenRefine. Esto permitirá la navegación por secciones para obtener una visión de los datos a grandes rasgos.
Existen varias vías para responder a las anteriores preguntas. Cada "comprobación" se relaciona con uno o más campos Darwin Core. Por ello, intente realizar tantas comprobaciones como sea posible basadas en los campos Darwin Core incluidos en el conjunto de datos.
Elabore una lista con todos los fallos y repórtelos al publicador de datos, haciendo referencia a cada comprobación mediante su 'Check-ID'. Esto hará que compartir comentarios sea un proceso detallado y que requiera menos tiempo.
Controles de calidad
¿Qué ha pasado?
¿Qué tipo de acontecimiento fue?
Check-ID | Campos | Requisitos |
---|---|---|
what 1 |
|
El evento de observaciones de especies identificado de forma individual por |
what 2 |
|
El evento de preservación de un espécimen identificado de forma individual por |
what 3 |
|
El resultado físico de un evento de muestreo identificado de forma individual por |
what 4 |
|
El evento de muestreo concreto identificado de manera única por |
Si fue un evento relacionado con registros biológicos de especies ¿cuántas especies había?
Check-ID | Campos | Requisitos |
---|---|---|
what 5 |
|
La abundancia de especies debe completarse utilizando |
Si fue un evento relacionado con registros biológicos de especies ¿qué especies había?
Check-ID | Campos | Requisitos |
---|---|---|
what 6 |
|
El nombre científico completo con información sobre el autor y la fecha, si se conocen, debe ser incluidos en |
what 7 |
|
El identificador para el taxón asignado al sujeto. Si el taxón se define de acuerdo a fuentes bien conocidas, se recomienda llenar el |
Caso 1: observación de especies con una cámara trampa
Campo | Valor | Limitaciones |
---|---|---|
|
"HAMAARAG:T0_L_049:6199" |
Debe ser un GUID o lo más cercano posible a un identificador único y global. Identificadores de números enteros no son validos. |
|
"MachineObservation" |
Debe coincidir con el Vocabulario de tipos Darwin Core |
|
1 |
Debe ser un número entero, 0 o superior |
|
1 |
Debe estar emparejado con |
|
"individuals" |
Debe coincidir con el Vocabulario GBIF de tipos cuantitativos |
|
"present" |
Debe coincidir con el Vocabulario GBIF sobre el Estado de los Registros |
|
"Canis aureus Linnaeus, 1758" |
Debe ser el nombre científico completo, con información sobre el autor y la fecha si se conoce. |
|
"species" |
Debe coincidir con el Vocabulario GBIF de clasificación de taxón |
|
"Animalia" |
Debe ser el nombre científico completo del reino en el que está clasificado el taxón. |
|
"Chordata" |
Debe ser el nombre científico completo del filo o división en el que está clasificado el taxón. |
|
"Mammalia" |
Debe ser el nombre científico completo de la clase en la que está clasificado el taxón. |
|
"Carnivora" |
Debe ser el nombre científico completo del orden en el que está clasificado el taxón. |
|
"Canidae" |
Debe ser el nombre científico completo de la familia en la que está clasificado el taxón. |
|
"Canis Linnaeus, 1758" |
Debe ser el nombre científico completo del género en el que está clasificado el taxón. |
|
Debe ser un GUID o un identificador relacionado con la fuente. |
|
|
"GBIF Backbone Taxonomy, May 2016" |
Debe ser una referencia que incluya fecha |
|
"http://www.gbif.org/dataset/d7dddbf4-2cf0-4f39-9b2a-bb099caae36c" |
Debe ser un GUID o un identificador para la fuente |
¿Quién participó en el evento?
Check-ID | Campos | Requisitos |
---|---|---|
who 1 |
|
Los nombres completos de cada persona que participó en el evento (p. ej., colectando, observando, etc.) deberían ser introducidos en |
who 2 |
|
Un nombre o acrónimo de la institución que participó en el evento puede ser incluido en |
who 3 |
|
Los nombres completos de cada persona, grupo u organización responsable de asignar el taxón al sujeto en cuestión deberían se introducidos en |
Caso 1: dos personas diferentes colectando e identificando un espécimen
Campo | Valor | Limitaciones |
---|---|---|
|
"Ole Karsholt" |
Debe ser el nombre de una o más personas |
|
"ZMUC" |
Debe ser un acrónimo o nombre de una institución |
|
"ZMUC" |
Debe ser un acrónimo o nombre de una institución |
|
"Jan Pedersen" |
Debe ser el nombre de una o más personas, grupo u organizaciones |
¿Cuándo tuvo lugar el evento?
Check-ID | Campos | Requisitos |
---|---|---|
when 1 |
|
La fecha, fecha-hora, rango de fecha o rango de fecha-hora durante la cual ocurrió el evento debería ser documentado en |
when 2 |
|
Si hay que convertir el valor original en ISO 8601 |
when 3 |
|
Aunque parezca repetitivo, se recomienda intentar documentar el |
when 4 |
|
Aunque parezca repetitivo, se recomienda intentar documentar de la manera más completa posible el |
when 5 |
|
Si no se puede llenar el campo |
Caso 1: fecha única
Campo | Valor | Limitaciones |
---|---|---|
|
2007-03-20 |
Debe estar en formato ISO 8601 |
|
2007 |
Debe ser un año de cuatro dígitos |
|
3 |
Debe estar entre 1-12 |
|
20 |
Debe estar entre 1-31 |
|
79 |
Debe estar entre 1-366 |
|
"Mar 20, 07" |
La fecha original o la descripción de la fecha |
Caso 2: rango de fecha-hora abarcando varios días
Campo | Valor |
---|---|
|
2007-03-20T00:00:00Z/2007-03-27T06:00:00Z |
|
00:00:00Z/06:00:00Z |
|
2007 |
|
3 |
|
|
|
79 |
|
86 |
|
"La tercera semana de Marzo de 2007, durante 6 horas, empezando a medianoche." |
¿Dónde tuvo lugar el evento?
Check-ID | Campos | Requisitos |
---|---|---|
where 1 |
|
Las coordenadas de localización por puntos se deben introducir en grados decimales en |
where 2 |
|
Para proporcionar una localización específica por forma geométrica introduzca una representación en archivo de texto well-Known Text (WKT) para la forma geométrica en el campo |
where 3 |
|
|
where 4 |
|
Si las coordenadas originales de localización por puntos tuvieran que ser convertidas desde otro sistema de coordenadas como 'grados minutos segundos' |
where 5 |
|
Si se tomaron acciones para expresar la localización por puntos de manera menos específica que la original o la coordinateUncertaintyInMeters es muy alta, se debe introducir una explicación en |
where 6 |
|
Si la localización por puntos debe estar presente pero no se ha introducido, debería proporcionarse una explicación en |
where 7 |
|
Si la localización por puntos no existe o se ha calculado a partir del centro de una celda (en comparación a las lecturas GPS), se debería introducir una explicación en |
where 8 |
|
Se debe proporcionar tanta información adicional sobre la localización como sea posible. Si no se puede proporcionar el |
Caso 1: ubicación del punto convertida de grados minutos segundos a grados decimales
Campo | Valor | Limitaciones |
---|---|---|
|
42.4566 |
Debe estar entre -90 y 90, ambos inclusive |
|
-76.45442 |
Debe estar entre -180 y 180, ambos inclusive |
|
"EPSG:4326" |
Idealmente un código EPSG o vocabulario controlado, si no "unknown" |
|
500 |
Cero NO es un valor válido |
|
42° 27' 23.76", -76° 27' 15.91" |
|
|
42° 27' 23.76" |
|
|
-76° 27' 15.91" |
|
|
"grados minutos segundos" |
|
|
"North America" |
Preferiblemente nombres en inglés de acuerdo al Teosaurio de nombres geográficos de Getty |
|
"United States" |
Preferiblemente nombres en inglés de acuerdo al Teosaurio de nombres geográficos de Getty |
|
"US" |
Deben ser códigos de países ISO 3166-1-alpha-2 |
|
"New York" |
|
|
"Tomkins County" |
|
|
"Ithaca, Forest Home, CU Rifle Range" |
Debe ser una descripción específica del lugar |
Caso 2: ubicación del punto que se generalizó
Campo | Valor |
---|---|
|
42.44 |
|
-76.33 |
|
"EPSG:4326" |
|
5000 |
|
"Localización por puntos difuminada por un factor de 5.000m" |
¿Por qué tuvo lugar el evento?
Check-ID | Campos | Requisitos |
---|---|---|
why 1 |
|
El nombre del método o protocolo de muestreo utilizado para crear el evento debe ser introducido en |
Caso 1: debido a un esquema de monitoreo de mariposas
Campo | Valor | Limitaciones |
---|---|---|
|
"Caminatas polares" |
Debe ser un nombre corto o una URL con referencia a un método o protocolo de muestreo |
|
250 |
Debe emparejarse con |
|
"square_metre" |
Debe coincidir con el Vocabulario de unidades de medida |
|
"Un promedio de 30 minutos caminando en el transecto" |
Puede ser una descripción de texto libre |
|
"No se obtienen registros de Lepidoptera en todo el transecto" |
Puede ser una descripción de texto libre |
Metadatos del conjunto de datos
Los metadatos de los conjuntos de datos deben contener suficiente información para facilitar la reutilización de los datos y evitar, al mismo tiempo, las interpretaciones erróneas. Los editores también deben demostrar el rigor con el que se han producido los datos y reconocer a sus diversos colaboradores y financiadores. En última instancia, esto puede conducir a nuevas fuentes de colaboración y financiación.
Campo | Requisitos | Ejemplos |
---|---|---|
|
es un nombre conciso que describe los contenidos del conjunto de datos y que lo distingue de otros. |
"Reef Life Survey: Global reef fish dataset", "Insects from light trap (1992–2009), rooftop Zoological Museum, Copenhagen" |
|
es un párrafo (resumen) corto que describe el contenido del conjunto de datos. |
"Este conjunto de datos contiene registros de peces óseos y elasmobranquios colectados por buceadores de Reef Life Survey (RLS) en transectos de 50 m en arrecifes de coral rocosos poco profundos de todo el mundo. La información sobre abundancia está disponible para todos los registros encontrados dentro de unos límites de muestreo cuantitativos (franjas de 50 x 5 m durante una única inmersión a cada lado de la línea del transecto, distinguido cada uno como un Bloque), y los registros fuera de muestreo se identifican únicamente como presencias (Método 0)." |
|
la organización responsable de la publicación (producción, lanzamiento y tenencia) de este recurso. |
"Reef Life Survey" |
|
debe ser una de las tres opciones legibles por máquinas (CC0 1.0, CC-BY 4.0 o CC-BY-NC 4.0), que proporcionan una forma estandarizada para definir los usos apropiados del conunto de datos. |
"Este trabajo está protegido por una Liciencia Creative Commons de Reconocimiento (CC-BY) 4.0." |
|
las personas y organizaciones que crearon el conjunto de datos, en orden de prioridad. Se recomienda utilizar un identificador personal como ORCID o ResearcherID. |
"John Smith, jsmith@gbif.org, http://orcid.org/0000-0002-1825-0097" |
|
las personas y organizaciones que escribieron los metadatos del conjunto de datos, en orden de prioridad. Se recomienda utilizar un identificador personal como ORCID o ResearcherID. |
"John Smith, jsmith@gbif.org, http://orcid.org/0000-0002-1825-0097" |
|
las personas y organizaciones que deberían ser contactadas para obtener más información sobre el recurso o a las que se deben comunicar los problemas que presenta el conjunto de datos. Se recomienda utilizar un identificador personal como ORCID o ResearcherID. |
"John Smith, jsmith@gbif.org, http://orcid.org/0000-0002-1825-0097" |
|
es un GUID u otro identificador que está cerca de ser global y único. Tenga en cuenta que esto es obligatorio para proyectos BID. |
"BID-AF2015-0134-REG" |
|
información sobre la metodología de muestreo utilizada en la creación del conjunto de datos, similar a la sección de métodos de un artículo científico. Tenga en cuenta que esto es obligatorio para conjuntos de datos de eventos de muestreo. |
Ver aquí |
|
cómo debería ser citado el conjunto de datos. Se recomienda utilizar el Formato de citas del IPT (basado en el formato de citas preferido por DataCite y que cumple la Declaración conjunta de los orincipios de citas de datos). |
"Edgar G J, Stuart-Smith R D (2014): Reef Life Survey: Global reef fish dataset. v2.0. Reef Life Survey. Dataset/Sampling event. http://doi.org/10.15468/qjgwba" |