Web semántica ¿Qué es?
Se oye decir que la web semántica es la web del mañana… desde hace más de diez años. Sin embargo hoy por hoy parece que esta no da señales de vida. ¿O no es tan así?
De acuerdo a la visión de Tim Berners-Lee, James Hendler y Ora Lassila (2001), la web semántica es una extensión de la web actual en la que la información se proporciona con un significado bien definido para que las computadoras y las personas trabajen mejor juntos. La meta de la web semántica es que la web deje de ser una colección de documentos para convertirse en una base de conocimiento.
La web semántica propone un ordenamiento de la información disponible en web que combine los recursos entre las computadoras para brindar servicios que faciliten a los usuarios la recuperación de dicha información. O dicho de otra manera, la implementación de la web semántica permite que las consultas de los usuarios sean intuitivas para las máquinas de modo tal que estas respondan de inmediato al interpretarlas.
La cooperación humano-máquina sería instantánea ya que la información legible por máquina representaría exactamente el pensamiento de las personas, y el sistema informático analizaría patrones de interacciones y solucionaría gran parte del trabajo de consulta de información en web. Sin embargo, hoy la web es aún explorada por personas que recuperan los recursos disponibles a través de un buscador y relacionan ellas mismas los resultados obtenidos.
La mayor parte del enorme volumen de recursos de la web actual se estructura con una semántica implícita de los datos que no permite a las máquinas el acceso real a su contenido y dificulta un tratamiento automatizado consistente de la información que relacione los documentos de diferentes sitios. La web semántica propone clasificar la información y estructurarla con una semántica explícita, para que sea procesable por máquinas. Para ello recurre a metadatos semánticos y ontológicos que describen el contenido, el significado y la relación entre los datos.
Tecnologías semánticas
La web semántica permite solucionar problemas corrientes en la búsqueda de información mediante el uso de una infraestructura común que explicita el significado del contenido de los recursos, permitiendo compartir, procesar e intercambiar información de forma automática.
La siguiente imagen representa gráficamente como está estructurada hoy la web y cuál es la propuesta de la web semántica (SPRI, 2001):
- Alfabeto Unicode: es una codificación del texto que permite expresar información en cualquier idioma.
- Referencias URI: es el acrónimo de «Uniform Resource Identifier», identificador único que permite la localización de un recurso que puede ser accedido vía Internet.
- Lenguaje RDF: es un lenguaje simple mediante el cual definimos sentencias en el formato de tripletes (sujeto: el recurso al que nos referimos; predicado: el recurso que indica qué es lo que estamos definiendo; y objeto: puede ser el recurso o un literal que podría considerarse el valor de lo que acabamos de definir). Por su parte RDF Schema provee un vocabulario definido sobre RDF que permite el modelo de objetos con una semántica claramente definida.
- Formato XML: ofrece un formato común para intercambio de documentos, y XML schema ofrece una plantilla para elaborar documentos estándar, ambas tecnologías que hacen posible que los agentes puedan entenderse entre ellos.
- Vocabularios Ontologías: ofrecen un criterio para describir y clasificar la información.
- Reglas de inferencia Lógica: permite a la computadora manipular los términos de modo más eficiente beneficiando la inteligibilidad humana.
- Pruebas: intercambio de «pruebas» escritas en el lenguaje unificador, a través del uso de reglas de inferencia.
- Confianza: comprobación exhaustiva de las fuentes de información.
- Firma digital: bloque encriptado de datos para verificar que la información adjunta ha sido ofrecida por una fuente específica confiable.
El siguiente mapa conceptual ilustra las relaciones entre estas tecnologías (Rodríguez Perojo, K. y Ronda León, 2005):
Mañana es hoy
Y aunque parezca que aún no se encuentra entre nosotros, la web semántica se utiliza ya en buscadores (Swoogle, Hakia, DuckDuckGo y Wolfram Alpha, entre otros), y la tendencia indica que numerosos sitios y gran variedad de aplicaciones están adoptando cada vez más sus estándares, en sectores tan diversos como economía y finanzas, ciencias médicas y telecomunicaciones.
Para seguir en el tema, se invita a acceder al siguiente video creado por Metaweb Technologies, compañía que desarrolló Freebase, una «base de datos abierta y compartida del conocimiento del mundo«, adquirida por Google en julio de 2010:
Bibliografía
- Berners-Lee, T., Hendler, J., Lassila, O.. (2001) The Semantic Web. Scientific American, 284(5).
- Rodríguez Perojo, K. y Ronda León. (2005) Web Semántica: un nuevo enfoque para la organización y recuperación de información en la web.
- Acimed, 13 (6). Disponible en: http://bvs.sld.cu/revistas/aci/vol13_6_05/aci030605.htm <Consultado el 10/10/2012>
- SPRI. Ekonsulta wiki, 2001. Disponible en: http://www.ekontsulta.net/ekontsulta/wiki/index.php/Web_Sem%C3%A1ntica <Consultado el 10/10/2012>
- World Wide Web Consortium. W3C España. Guía Breve de Web Semántica. Disponible en: http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica <Consultado el 10/10/2012>
María Patricia Prada. Máster en Documentación Digital (Universitat Pompeu Fabra – España). Lic. En Bibliotecología y Documentación (Universidad Nacional de Mar del Plata). Bibliotecario profesional del CENT Nº31. Se desempeña en el área de Capacitacíón, dependiente de la Dirección de Servicios de Información del Sistema de Bibliotecas y de Información de la Universidad de Buenos Aires (SISBI_UBA), ocupándose del establecimiento de los programas de capacitación y formación para los bibliotecarios y usuarios del sistema en general. Es Rectora del Instituto de Formación Técnica Superior (IFTS) Nº13, en el cual se dicta la Tecnicatura Superior en Bibliotecología.