Esta sección ofrece orientación sobre cómo seleccionar e implementar distintas tecnologías utilizadas para desarrollar plataformas de datos abiertos, haciendo especial hincapié en los catálogos de datos, que son los sistemas web que se usan para poner datos a disposición de los usuarios finales. El propósito es ayudar a los especialistas en tecnología de la información (TI) que cumplen una función de coordinación en la gestión de la infraestructura técnica de una iniciativa de datos abiertos.
Los términos “catálogo”, “plataforma” y “portal” suelen ser ambiguos y pueden dar lugar a confusión. En este conjunto de herramientas, se definen de la siguiente manera:
- Un catálogo de datos es una lista de conjuntos de datos disponibles en una iniciativa de datos abiertos. Los elementos esenciales de un catálogo de datos son: búsqueda, metadatos, información clara en cuanto a la licencia legal de uso y acceso a las bases de datos propiamente dichas. Habitualmente, un catálogo de datos es el elemento central en línea de una iniciativa de datos abiertos.
- Una plataforma constituye “una puerta de acceso” en línea para que los usuarios tengan disponibles todos los recursos de una iniciativa de datos abiertos. Una plataforma incluye el catálogo de datos y otras informaciones y servicios que forman parte del ecosistema de datos abiertos. Habitualmente, estos son: un foro en línea para preguntas, apoyo técnico y comentarios; una base de conocimientos sobre información de referencia y materiales de capacitación, y un blog para las comunicaciones y la difusión. Los servicios de una plataforma se suelen implementar mediantes distintas tecnologías (no una sola).
- Un portal puede hace referencia a distintas cosas; por eso, en este conjunto de herramientas se evita el uso de este término.
Qué aspecto tiene un catálogo de datos abiertos?
Como se describe en los próximos párrafos, los catálogos de datos pueden ser relativamente simples e “independientes” o muy sofisticados y estar integrados con otros sistemas. Sin embargo, la mayoría de los catálogos de datos tienen algunas características comunes (también se pueden consultar listas más extensas):
Fácil acceso. Los catálogos de datos abiertos permiten que los usuarios accedan a los datos de manera rápida, gratuita e intuitiva. El acceso a los catálogos de datos abiertos no requiere inscripción ni ingreso, ya que esas exigencias disuadirían al usuario que desea explorar y utilizar las bases.
Búsqueda. Los catálogos de datos abiertos facilitan la búsqueda de datos. En la mayoría de los catálogos los datos se ordenan por tema, organización o tipo, y se permite una búsqueda de texto completa en sus contenidos. Muchos catálogos de datos abiertos incluyen una optimización del motor de búsqueda para transmitir los datos a motores de búsqueda convencionales.
Acceso a datos que puedan leerse con máquinas. Los datos están disponibles para descarga en formatos electrónicos que pueden leerse con máquinas y no son exclusivos. Si es posible, es en gran medida preferible tener todos los datos en un conjunto que se pueda descargar como un solo archivo.
Metadatos. Los metadatos clave, como ser la fecha de la publicación y la autoría, se muestran claramente en cada conjunto de datos. En muchos catálogos de datos abiertos se implementa la norma Dublin Core y los metadatos se ponen a disposición del público en formatos digitales que se puedan leer con un Software común.
Licencias claras de uso de datos. Las licencias legales de uso de datos se muestran claramente y en letras grandes en cada conjunto de datos. Si los datos se ofrecen en virtud de una licencia Creative Commons, la licencia de datos abiertos u otras normas, se incluyen enlaces explícitos a estas licencias.
Vista previa/visualización de datos. Muchos catálogos de datos abiertos incluyen algún mecanismo para pre-visualizar los datos antes de descargarlos o para verlos mediante herramientas propias de generación de gráficos o mapas.
Cumplimiento de estándares. La mayor parte de los catálogos de datos abiertos son capaces de leer distintos formatos estándar, ya sean de datos (por ejemplo, CSV, XML, JSON) o metadatos (por ejemplo, Dublin Core). Los catálogos de datos de libre acceso suelen ofrecer cada conjunto de datos a través de una dirección URL única y permanente, lo que posibilita la mención y el enlace directo desde otros recursos.
Interfaz de programación de aplicaciones (API). Las API permiten a los desarrolladores de software acceder al catálogo de datos abiertos—y, a menudo, a los propios datos—a través del software. Las API permiten encontrar, analizar, integrar en catálogos, y recolectar metadatos de sitios externos y de una variedad de aplicaciones.
Seguridad. Los catálogos de datos abiertos incorporan medidas de seguridad para evitar que usuarios no autorizados cambien los datos o metadatos.
Por lo general, los catálogos de datos abiertos siguen uno de dos modelos de prestación de servicios. Los catálogos de código abierto normalmente son gratuitos porque pueden obtenerse mediante una descarga sin costo alguno y pueden modificarse o adaptarse sin restricciones ni cargos de licencias. Estos productos pueden alojarse en los propios servidores exclusivos del propietario o en la nube, pero ambos enfoques requieren que el operador del catálogo administre la logística de TI. Algunos proveedores ofrecen alojamiento de productos de código abierto en la nube como un servicio. Por el contrario, los productos de software como servicio (SaaS) están disponibles a cambio del pago de una cuota mensual o anual, y los proveedores asumen la responsabilidad de la gestión de TI, la seguridad y las actualizaciones de software. Los proveedores de SaaS también pueden proporcionar ciertas medidas de adaptación de productos.
Tres modelos de catálogos de datos abiertos
Los tres modelos que se describen a continuación presentan formas de concebir un sistema de catálogo de datos abiertos. La intención es mostrar cómo se relacionan entre sí los distintos elementos y cómo cambia el sistema en diferentes escalas.
Haga clic en los gráficos para verlos en tamaño completo.