¿Qué es CKAN (Comprehensive Knowledge Archive Network)?

CKAN

CKAN es un DMS (Data Management System) de código abierto para alimentar concentradores y portales de datos. CKAN facilita la publicación, el intercambio y el acceso a los datos.

¿Qué es CKAN?

Comprehensive Knowledge Archive Network (CKAN) es un portal para Open Data de código abierto para el almacenamiento y la distribución de datos abiertos. CKAN se ha convertido en un potente sistema de catálogo de datos utilizado principalmente por instituciones públicas que desean compartir sus datos con el público en general (Open Data).

Rufus Pollock desarrolló su primera versión en 2005-2006. Desde su creación, CKAN ha evolucionado y es el software de plataforma de datos abiertos líder en el mundo, utilizado por gobiernos como el de EE.UU. y el Reino Unido, para publicar millones de conjuntos de datos públicos (datasets).

El código base de CKAN lo mantiene la Open Knowledge Foundation. El back-end de CKAN, la parte que se ejecuta en el servidor web, está escrito principalmente en Python. CKAN mantiene la información sobre los conjuntos de datos o datasets que se ofrecerán a los usuarios en bases de datos PostgreSQL.

Metadatos en CKAN

CKAN proporciona acceso a los datos a través de metadatos. Los metadatos son la descripción de los datos para poder etiquetarlos y encontrarlos después. Ejemplo: un libro incluye datos, mientras que una portada describe su título, subtítulo, autor, editorial y edición. Echando un vistazo a la portada se puede entender de qué trata el libro sin necesidad de abrirlo. Del mismo modo, CKAN proporciona una infraestructura para almacenar y mostrar metadatos con capacidad para acceder a los datos reales que hay detrás.

CKAN se puede utilizar como catálogo para listar todos los conjuntos de datos, libros, documentos y archivos de que disponga.

Plugins de CKAN

CKAN cuenta con un potente ecosistema de extensiones (plugins) mantenidas por los miembros de la comunidad. Al instalarlas, la funcionalidad del sistema se amplía y personaliza con un mínimo esfuerzo. Existe una gran variedad de extensiones.

¿Quién usa CKAN?

CKAN es utilizado por:

  • Gobiernos y entidades del sector público;
  • Organizaciones gubernamentales;
  • ONG y organizaciones sin ánimo de lucro;
  • Entidades comerciales;
  • Organizaciones científicas;
  • Universidades;
  • Pequeñas empresas;
  • Empresas.

CKAN también se utiliza para publicar datos de:

  • Proyectos comunitarios;
  • Proyectos de crowdsourcing.

Los principales portales de datos nacionales de todo el mundo confían en CKAN

  • EE.UU.: https://data.gov
  • Canadá: https://www.canada.ca
  • Suiza: https://opendata.swiss/en
  • Australia: https://www.nsw.gov.au
  • Singapur: https://data.gov.sg

En total hay más de 2000 instancias CKAN activas. Cada una de ellas representa a una organización que publica datos.

Ventajas

Como herramienta, CKAN enlaza con la revolución de los datos abiertos. CKAN ayuda a las organizaciones a utilizar realmente los datos de forma significativa y a mostrarlos de manera fácil de usar.

Algunas ventajas específicas de CKAN son:

  • Código abierto (es decir, gratuito y sin dependencia del proveedor).
  • Ampliamente utilizado en todo el mundo y con una base cada vez mayor.
  • Uso extendido en gobiernos clave de todo el mundo
  • Construido para los custodios de datos, por ejemplo, el gobierno (así como las máquinas y los usuarios finales)
  • Se integra bien con sitios web y aplicaciones

¿Es seguro usar CKAN?

El uso de CKAN se considera seguro siempre que se sigan ciertas buenas prácticas de seguridad. Es importante evaluar las necesidades de seguridad específicas de su organización y configurar CKAN en consecuencia. CKAN incorpora permisos y controles de acceso que pueden utilizarse para garantizar que sólo los usuarios autorizados tengan acceso a los datos. También cuenta con una serie de funciones de seguridad, como la compatibilidad con HTTPS, que pueden utilizarse para proteger los datos y la comunicación entre el servidor CKAN y los clientes.

Sin embargo, como cualquier software, CKAN no es completamente inmune a los riesgos y vulnerabilidades de seguridad. Por lo tanto, es importante mantener CKAN actualizado a la última versión y estar al tanto de cualquier vulnerabilidad conocida y aplicar parches o actualizaciones tan pronto como estén disponibles.

CKAN también puede configurarse para utilizar servicios externos de autenticación y autorización, como OAuth, LDAP u OpenID Connect, que pueden utilizarse para proteger el acceso a los datos.

También es importante seguir las mejores prácticas para la seguridad de los datos, como cifrar los datos confidenciales, controlar el acceso a los datos y realizar copias de seguridad periódicas.

Instalando CKAN desde GitHub Codespaces

Comentarios