Ontologías

Luigi Ceccaroni es un científico del medio ambiente que se ha especializado en inteligencia artificial, semántica para agentes informáticos y sistemas de información. Trabaja en la Universidad Politécnica de Cataluña y en TMT Research [research.tmtfactory.com] investigando sobre ontologías, indexación semántica y servicios assembled on the fly. Antes, durante dos años, trabajó para Fujitsu Laboratories of America, en Estados Unidos, en el desarrollo de nuevos protocolos de comunicación entre agentes informáticos.

La World Wide Web que conocemos, navegamos y consultamos está bien para lo que es (gracias a Google y TweetMeme). Pero nosotros arquitectos de la información no podemos esperar para cambiarla. Tenemos una visión para el paso siguiente en la evolución de la web, un concepto llamado web semántica o tecnología semántica. La idea detrás de la tecnología semántica es la siguiente: los ordenadores aprenden cómo funciona el mundo. Por ejemplo, cuando un ordenador encuentra la palabra bill debe saber que bill en inglés tiene 15 significados diferentes. Cuando el ordenador se encuentra con la frase killed the bill, debe ser capaz de deducir que es una frase en inglés y que en este caso bill puede ser sólo un proyecto de ley y que kill sólo puede significar rechazar, mientras que kill bill no puede ser que el título de la película de Quentin Tarantino. Para llegar a tal nivel de habilidad en el manejo de los idiomas, los algoritmos de los ordenadores necesitan una ontología. La ontología no es ni un vocabulario ni un diccionario de sinónimos (tesauro). Es un mapa de conceptos y significados entrelazados. La construcción de una ontología que encapsula todo el conocimiento del mundo puede ser una tarea enorme, y requiere un esfuerzo y una experiencia iguales a los necesarios para elaborar una enciclopedia extensa, pero es factible. Lo están intentando start-ups en todo el mundo, como Hakia [www.hakia.com], Cognition [www.cognitionsearch.com] y Lexxe [www.lexxe.com]. Pero, ¿cómo puede un motor de búsqueda semántico resolver la cuestión de la calidad de la información? Simple: con precisión. Una vez que los ordenadores serán capaces de manejar idiomas con una semántica precisa, la información de calidad no tendrá que ser popular para llegar al usuario final, a diferencia de lo que ocurre con la mayoría de los motores actuales. Teniendo en cuenta la reducida velocidad de lectura de las personas (200-300 palabras por minuto) y el enorme volumen de información disponible, la capacidad de decisión hoy requiere un perfeccionamiento de los conocimientos a través de personalización y recomendación. No podemos permitirnos un futuro en el que el conocimiento está a merced de la popularidad. Gracias a la creación y utilización de ontologías, esta web de próxima generación permitirá a las máquinas entenderse fácilmente una a otra. Y los agentes software serán capaces de entender y trabajar con las palabras y la información que los seres humanos utilizan en correos electrónicos, documentos y bases de datos. Por lo tanto, muchas tareas de bajo nivel, que ahora requieren mucho tiempo y una persona trabajando con teclado, van a ser automatizadas.

Algernon - A frame-based knowledge-representation language using access-limited logic for inference (University of Texas at Austin).

Ask Jeeves - A question-answering Web search engine.

CKML – The conceptual knowledge markup language at Ontologos is an application of XML and an extension of OML.

Closed world assumption – Complete information about the environment; all relevant facts are stored in the ontology; any statement that is true about the actual world can be deduced from facts in the system. If a statement cannot be proved, it is assumed to be false. If you cannot prove P or non-P from a knowledge base (KB), add non-P to the KB.

CommonKADS - A comprehensive knowledge engineering methodology.

Common Logic – A new evolving version of KIF.

Conceptual graphs - Peirce/Sowa's theory for knowledge representation:

The CG Standard - The official standard for conceptual graph syntax and semantics is the ISO/IEC 24707 standard for Common Logic, which defines the semantics in terms of an abstract syntax and model-theoretic semantics.

Conceptual graphs - Harry Delugach's conceptual structures homepage.

CharGer - A CG visual editor, running under a Java VM.

Cyc - A massive ongoing effort to formalize common-sense knowledge.

DAML - Language which aims at a machine processable semantics of information sources which are accessible to agents.

DAML+OIL - This page contains the DAML+OIL (March 2001) language released by the Joint Committee on 27 March 2001.

DAML Ontology Library – A repository of ontologies.

Description Logics - Description logics (DL) are a family of knowledge representation languages which can be used to represent the concept definitions of an application domain (known as terminological knowledge) in a structured and formally well-understood way. Also see Franconi's excellent course and overheads on DL, and the DL systems CLASSIC, CRACK, DLP, FaCT, GRAIL, KRIS, LOOM, PowerLOOM and RACE.

Design Patterns - Repository of reusable, object-oriented programming abstractions. 

DLML - A description logic markup language.

FaCT - An optimized, tableaux-based DL.

FIPA - An organization aimed at producing standards for the interoperation of heterogeneous software agents. 

Open world assumption - In formal logic, the open world assumption is the assumption that the truth-value of a statement is independent of whether or not it is known by any single observer or agent to be true. It is the opposite of the closed world assumption, which holds that any statement that is not known to be true is false.

(sigue...)