Una Mirada a la Web de los Datos. Caso de Estudio: Consumo de Servicios CKAN

A View of the Web of Data. Case Study: Use of Services CKAN

  • Jhon Francined Herrera-Cubides Universidad Distrital Francisco José de Caldas
  • Paulo Alonso Gaona-García Universidad Distrital Franicisco José de Caldas
  • Kevin Gordillo-Orjuela Universidad Distrital Francisco José de Caldas
Keywords: CKAN, Web of Data, DataHub, JSON, Linked Data (en_US)
Keywords: CKAN, Web de Datos, DataHub, JSON, Linked Data. (es_ES)

Abstract (es_ES)

Contexto: se busca llevar a cabo el análisis, conexión y uso de los servicios ofrecidos por Comprehensive Knowledge Archive Network (CKAN, por sus siglas en inglés), con el fin de evaluar criterios base para obtener referentes preliminares de estudio sobre el estado de la web de los datos, a través de la exploración y acceso de los dataset publicados en el repositorio de datos abiertos DataHub.io.

Método: empleamos los servicios ofrecidos por CKAN para la consulta y descarga de los dataset publicados en Datahub.io, para lo cual presentamos una serie de procesos llevados a cabo para analizar los datos descargados. La propuesta se compone de tres actividades clave: (1) revisión y análisis de las plataformas; (2) configuración y uso de los servicios prestados por la API; y (3) descarga y revisión de la información obtenida.

Resultados: se configuraron y desplegaron los servicios requeridos, a través de CKAN, con el fin de llevar a cabo las consultas y descargas respectivas de dataset. Se procesó y analizó la información obtenida de los JSON descargados, permitiendo hacer un análisis preliminar comparativo, de la información obtenida acerca del comportamiento de la web de los datos.

Conclusiones: CKAN es una herramienta potente para gestionar catálogos de datos, permitiendo manejar una descripción de los datos y otra información relevante, tanto para las organizaciones que publican como para las personas que consultan dicha información, tales como categorías de organizaciones, formatos en que se encuentra disponible los datos, propietario de los datos, el tipo de licenciamiento de las publicaciones, enlaces a otros datos, entre otros datos, pertinentes para llevar a cabo un análisis de la web de los datos.

Abstract (en_US)

Context: In order to assess basic criteria so as to obtain preliminary guidelines on the current state of the Web of Data, we analyze the connection and use of the services offered by CKAN - Comprehensive Knowledge Archive Network; the analysis is conducted through exploration and connection to datasets published in the datahub.io open data repository.

Method: We use the services offered by CKAN for browsing and downloading datasets published in Datahub.io, we propose a procedure carried out to analyze the downloaded data. The proposal consists of three key activities: (1) review and analysis of platform, (2) Setting up and using the services provided by the API and (3) download and review of the information obtained.

Results: The required services offered by the platform CKAN were configured and deployed, in order to carry out queries and downloads related to each dataset. The obtained information was processed and analyzed from the downloaded JSON, allowing a comparative preliminary analysis of the information regarding the behavior of the Web of Data.

Conclusions: CKAN is a powerful tool to manage data catalogs. This tool can handle a description of the data and other relevant information, from organizations that publish to people who query such information. These queries provide information as categories of organizations, data formats and owners, the type of publication licenses, links to other data, among other which are relevant to perform an analysis of the Web data.

Downloads

Download data is not yet available.

Author Biographies

Jhon Francined Herrera-Cubides, Universidad Distrital Francisco José de Caldas

Profesor Asistente

Facultad de Ingeniería

Universidad Distrital Francisco José de Caldas

Ingeniero de Sistemas egresado de la Corporación Universitaria del Meta

Especialista en Construcción de Software para Redes de la Universidad Autónoma de Colombia

Magíster en Ingeniería - Sistemas y Computación de la Universidad de los Andes

 

 

Paulo Alonso Gaona-García, Universidad Distrital Franicisco José de Caldas

Profesor Asociado

Facultad de Ingeniería

Universidad Distrital Francisco José de Caldas

Ingeniero de Sistemas

Magister en Ciencias de la Información y de las Comunicaciones

Doctor en Ingeniería de la Información y del Conocimiento

Kevin Gordillo-Orjuela, Universidad Distrital Francisco José de Caldas

Universidad Distrital Francisco José de Caldas

Estudiante último semestre Ingeniería de Sistemas

Adscrito Grupo de investigación GIIRA

References

T. Berners-Lee, C. Bizer, T. Heath. (Enero, 2009) «Linked data-the story so far». International Journal on Semantic Web and Information Systems, vol. 5, pp. 1-22, 2009.

S. Dietze, H. Yu, D. Giordano, E. Kaldouidi, N. Dovrolis, D. Taivi. (Marzo, 2012) «Linked Education: Interlinking Educational Resources and the Web of Data,» 27th annual ACM symposium on Aapplied Computing, pp. 366-371, 2012. [Online]. Available: http://oro.open.ac.uk/31077/. [Último acceso: 2016 Abril 28].

B. Haslhofer, A. Isaac (2011). «Data. europeana. eu: The europeana linked open data pilot» International Conference on Dublin Core and Metadata Applications, pp. 94-104, 2011. [Online]. Available: http://dcpapers.dublincore.org/pubs/article/view/3625/1851. [Último acceso: 25 de Abril de 2016].

D’Aquin, M. et al. (Junio, 2014) «Building the Open Elements of an Open Data Competition» D-Lib Magazine, vol. 20, p. 3, 2014. [Online]. Available: http://www.dlib.org/dlib/may14/daquin/05daquin.html. [Último acceso: 28 de Abril de 2016].

L. Project. (Diciembre, 2014). «Linking Web Data for Education». [En línea]. Available: http://linkedup-project.eu/. [Último acceso: 27 Abril 2016].

G. Klyne, J. Carroll (2006). «Resource description framework (RDF): Concepts and abstract syntax» 2006. Edited by Brian Mcbride. [Online]. Available: http://www.citeulike.org/group/2170/article/532408. [Último acceso: 2016 Abril 28].

M. Hausenblas. (Julio, 2009). «Exploiting linked data to build web applications» IEEE Internet Computing, vol. 13, nº 4, p. 68. 2009.

S. Auer, C. Bizer, G. Kobilarov, J. Lehmann, R. Cyganiak, Z. Ives (2007). «DBpedia: A Nucleus for a Web of Open Data» de The Semantic Web, Busan, Korea, Springer, 2007.

LOD-Cloud. (s.f.). «The Linking Open Data Cloud Diagram» [Online]. Available: http://lod-cloud.net/. [Último acceso: 27 Abril 2016].

DataHub. (s.f.). «DataHub Project» [Online]. Available: http://datahub.io/dataset?tags=lod. [Último acceso: 27 Abril 2016].

Ministerio de Hacienda y Administración Pública - Ministerio de Industria Energía y Turismo, (Febrero, 2015.) «Plataformas de Publicación de Datos Abiertos» [En línea]. Available: http://datos.gob.es/sites/default/files/informe-herramientas-publicacion.pdf. [Último acceso: 30 Abril 2016].

OKF, (s.f.) «Open Knowledge Foundation» [En línea]. Available: http://services.okfn.org/. [Último acceso: 25 Abril 2016].

CKAN, (s.f.). «The Open Source Data Portal Software,» [En línea]. Available: http://ckan.org/. [Último acceso: 20 Abril 2016].

CKAN. (s.f.). «API Guide - CKAN’s API for developers,» [En línea]. Available: http://docs.ckan.org/en/latest/api/index.html. [Último acceso: 21 Abril 2016].

CKAN. (s.f.) «Ckan Wiki - CKAN Pages,» [En línea]. Available: https://github.com/ckan/ckan/wiki/_pages. [Último acceso: 23 Abril 2016].

J. Wonderlich. (Agosto, 2010). «Ten principles for opening up government information,» [En línea]. Available: http://sunlightfoundation.com/policy/documents/ten-open-data-principles/. [Último acceso: 15 Abril 2016].

CKAN. (s.f.). «CKAN API Guide» [En línea]. Available: http://docs.ckan.org/en/latest/api/. [Último acceso: 31 Mayo 2016].

J. Winn. (Mayo, 2013). «Open data and the academy: an evaluation of CKAN for research data management. (IASSIST 2013)». 28-31 Mayo 2013. [En línea]. Available: http://eprints.lincoln.ac.uk/9778/1/CKANEvaluation.pdf. [Último acceso: 31 Mayo 2016].

E. Rajabi, S. Sanchez-Alonso, M.-A. Sicilia. (Abril, 2014). «Analyzing broken links on the web of data: An experiment with DBpedia» Journal of the Association for Information Science and Technology. vol. 65, nº 8, p. 1721–1727, 2014. [Onine]. Available: http://onlinelibrary.wiley.com/doi/10.1002/asi.23109/abstract. [Último acceso: 31 Mayo 2016].

C. Bizer. (Octubr, 2009). «The Emerging Web of Linked Data». IEEE Intelligent Systems, vol. 24, nº 5, pp. 87-92, 2009. [Onine]. Available: http://lpis.csd.auth.gr/mtpx/sw/material/IEEE-IS/IS-24-5.pdf. [Último acceso: 31 Mayo 2016].

HPI Institut. (Septiembre, 2011). «State of LOD Cloud,» [En línea]. Available: http://lod-cloud.net/state/. [Último acceso: 26 Marzo 2016].

M. Allison, S. Richard, K. Patten, C. Caudill-Daugherty, A. Anderson. (Abril, 2015). «Open Access to Geoscience Data for Exploration and Assessment». 19 al 25 Abril 2015. [En línea]. Available: http://www.geothermal-energy.org/pdf/IGAstandard/WGC/2015/33032.pdf. [Último acceso: 27 Abril 2016].

W. Mao, J. Jan. (Octubre, 2015). «Visualization of Open Data: A CaseStudy of Climate Data». 36 Asian Conference on Remote Sensing. 19-23 de Octubre de 2015. Manila, Philippines. [En línea]. Available: http://www.acrs2015.org/list-of-accepted-abstracts/. [Último acceso: 4 Septiembre de 2016].

R. Carvalho, J. Aguiar, J. Rocha, C. Ribeiro. (Junio, 2016). «A comparision of research data management platforms: architecture, flexible metadata and interoperability» Junio de 2016. [En línea]. Available: https://www.researchgate.net/publication/303918099_A_comparison_of_research_data_management_platforms_architecture_flexible_metadata_and_interoperability. [Último acceso: 1 Septiembre 2016].

CURE. «Infraestructura semantica basada en el paradigma de datos abiertos para la gestion de investigacion de las Universidades españolas». (2016). CRUE Universidades Españolas. 2016. [En línea]. Available: http://tic.crue.org/wp-content/uploads/2016/07/Memoria-proyecto-H%C3%A9rcules.pdf. [Último acceso: 2 Septiembre 2016].

Datos.gob.es. (s.f.). «Estudio de Plataformas tecnologicas datos.gob.es». Ministerio de Industria, Turismo y Comercio. [En línea]. Available: http://datos.gob.es/sites/default/files/files/2_cms_01.pdf. [Último acceso: 2 Septiembre 2016].

P.A. Gaona-García, C. E. Montenegro., & H.W. Gonzalez, (2014) «Hacia una Propuesta de Mecanismos para la Autenticidad de Objetos de Aprendizaje en Plataformas LCMS». Ingeniería, Vol. 19, nº 1, p. 50 –64

How to Cite
Herrera-Cubides, J., Gaona-García, P., & Gordillo-Orjuela, K. (2017). A View of the Web of Data. Case Study: Use of Services CKAN. Ingeniería, 22(1), 111-124. https://doi.org/10.14483/udistrital.jour.reving.2017.1.a07
Published: 2017-01-30
Section
Systems Engineering

Most read articles by the same author(s)