Classora Knowledge Base es una base de conocimiento creada por Classora Technologies que agrega e integra la información volcada en diversas fuentes públicas de Internet. La base de conocimiento dispone de un API comercial para enriquecimiento semántico, y de una web abierta en la que es posible consultar de forma libre parte de la información recopilada.
Para la consulta de los datos contenidos en la base de conocimiento es necesario disponer de herramientas que guíen al usuario y faciliten el acceso a toda la información disponible. En este sentido, Classora Technologies ha desarrollado un lenguaje semiformal muy básico, denominado Classora Query Languaje (CQL), que actúa como base para la comprensión de los requisitos del usuario. En la aproximación inicial de CQL, este lenguaje permitía realizar dos tipos de consulta:
facturación, microsoft fecha de nacimiento, barack obama
edificio*, ubicación = estados unidos, altura < 300 metros
Sin embargo, un lenguaje formal de consulta no resulta intuitivo ni práctico para usuarios inexpertos, acostumbrados a formular la consulta en su propio idioma o apoyándose solo en palabras clave (keywords) debido al efecto Google:
«Edificios construídos en USA antes de 1.930 que midan más de 300 metros de altura»
Para abordar el problema, y debido a la cantidad de recursos necesarios y a la especialización requerida para obtener resultados de calidad, se planteó una colaboración entre Classora y el Grupo de Lengua y Sociedad de la Información (LyS) de la Universidade da Coruña.
El Grupo LyS está formado por profesores e investigadores de las áreas de Lingüística General y de Ciencias de la Computación e Inteligencia Artificial. En 2012 este grupo fue sometido a una evaluación externa por parte de la Agencia Nacional de Evaluación y Prospectiva (ANEP) en la que obtuvo una calificación cualitativa de A: Excelente, calidad comparable a nivel internacional en su área científica.
Además, un miembro este grupo, Jesús Vilares, involucrado directamente en el proyecto con Classora, forma parte de la junta directiva de la Sociedad Española de Recuperación de Información (SERI). La SERI se encuentra organizando en estos momentos su conferencia anual (Spanish Conference on Information Retrieval) que en esta edición se celebrará precisamente en nuestra ciudad, La Coruña, dentro de unas semanas.
Fruto de esta colaboración universidad-empresa se ha desarrollado un prototipo de Interfaz de Lenguaje Natural (ILN) para Classora Knowledge Base al que se ha denominado Ask Classora! El objetivo de este sistema no es otro acceder a la base de conocimiento permitiendo expresar las consultas en español, sirviendo a modo de traductor entre el lenguaje natural y el lenguaje formal subyacente, en este caso CQL.
Por ejemplo, para encontrar la respuesta a la pregunta ¿Qué ocupación tiene Fernando Alonso?, un usuario puede interactuar con el sistema a través de la interfaz web.
Una vez introducida la consulta, y desde un punto de vista general, ocurre lo siguiente:
Un prototipo de este sistema ha sido probado en un entorno cerrado con resultados muy prometedores, por lo que esperamos poder lanzar una beta pública próximamente.
Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes en contactar con nosotros para que te enviemos documentación adicional. Cuenta con Classora Technologies para estar informado sobre bases de conocimiento y recuperación de información procedente de fuentes públicas a través de NLP.