Ontologías
Luigi Ceccaroni es un científico del
medio ambiente que se ha especializado en inteligencia artificial, semántica
para agentes informáticos y sistemas de información. Trabaja en la Universidad
Politécnica de Cataluña y en TMT Research [research.tmtfactory.com] investigando sobre ontologías,
indexación semántica y servicios assembled on the fly. Antes,
durante dos años, trabajó para Fujitsu Laboratories of America, en Estados Unidos, en el desarrollo de nuevos
protocolos de comunicación entre agentes informáticos.
La World Wide Web
que conocemos, navegamos y consultamos está bien para lo que es (gracias a
Google y TweetMeme). Pero nosotros arquitectos
de la información no podemos esperar para cambiarla. Tenemos una visión
para el paso siguiente en la evolución de la web, un concepto llamado web semántica o tecnología semántica. La idea detrás de la tecnología semántica es
la siguiente: los ordenadores aprenden cómo funciona el mundo. Por ejemplo,
cuando un ordenador encuentra la palabra bill
debe saber que bill en inglés tiene
15 significados diferentes. Cuando el ordenador se encuentra con la frase killed the bill, debe ser capaz de
deducir que es una frase en inglés y que en este caso bill puede ser sólo un proyecto de ley y que kill sólo puede significar rechazar,
mientras que kill bill no puede ser
que el título de la película de Quentin
Tarantino. Para llegar a tal nivel de habilidad en el manejo de los
idiomas, los algoritmos de los ordenadores necesitan una ontología. La ontología no es ni un vocabulario ni un diccionario
de sinónimos (tesauro). Es un mapa de conceptos y significados entrelazados. La
construcción de una ontología que encapsula todo el conocimiento del mundo
puede ser una tarea enorme, y requiere un esfuerzo y una experiencia iguales a
los necesarios para elaborar una enciclopedia extensa, pero es factible. Lo
están intentando start-ups en todo el mundo, como Hakia [www.hakia.com], Cognition [www.cognitionsearch.com] y Lexxe [www.lexxe.com]. Pero, ¿cómo puede
un motor de búsqueda semántico resolver la cuestión de la calidad de la
información? Simple: con precisión. Una vez que los ordenadores serán capaces
de manejar idiomas con una semántica precisa, la información de calidad no
tendrá que ser popular para llegar al usuario final, a diferencia de lo que
ocurre con la mayoría de los motores actuales. Teniendo en cuenta la reducida
velocidad de lectura de las personas (200-300 palabras por minuto) y el enorme
volumen de información disponible, la capacidad de decisión hoy requiere un
perfeccionamiento de los conocimientos a través de personalización y
recomendación. No podemos permitirnos un futuro en el que el conocimiento está
a merced de la popularidad.
Algernon - A frame-based knowledge-representation language using access-limited logic for inference (University of Texas at Austin).
Ask Jeeves - A question-answering Web search engine.
CKML – The conceptual knowledge markup language at Ontologos is an application of XML and an extension of OML.
Closed world assumption – Complete information about the environment; all relevant facts are stored in the ontology; any statement that is true about the actual world can be deduced from facts in the system. If a statement cannot be proved, it is assumed to be false. If you cannot prove P or non-P from a knowledge base (KB), add non-P to the KB.
CommonKADS - A comprehensive knowledge engineering methodology.
Common Logic – A new evolving version of KIF.
Conceptual graphs - Peirce/Sowa's theory for knowledge representation:
The CG Standard - The official standard for conceptual graph syntax and semantics is the ISO/IEC 24707 standard for Common Logic, which defines the semantics in terms of an abstract syntax and model-theoretic semantics.
Conceptual graphs - Harry Delugach's conceptual structures homepage.
CharGer - A CG visual editor, running under a Java VM.
Cyc - A massive ongoing effort to formalize common-sense knowledge.
DAML - Language which aims at a machine processable semantics of information sources which are accessible to agents.
DAML+OIL - This page contains the DAML+OIL (March 2001) language released by the Joint Committee on 27 March 2001.
DAML Ontology Library – A repository of ontologies.
Description Logics - Description logics (DL) are a family of knowledge representation languages which can be used to represent the concept definitions of an application domain (known as terminological knowledge) in a structured and formally well-understood way. Also see Franconi's excellent course and overheads on DL, and the DL systems CLASSIC, CRACK, DLP, FaCT, GRAIL, KRIS, LOOM, PowerLOOM and RACE.
Design Patterns - Repository of reusable, object-oriented programming abstractions.
DLML - A description logic markup language.
FaCT - An optimized, tableaux-based DL.
Open world assumption - In formal logic, the open world assumption is the assumption that the truth-value of a statement is independent of whether or not it is known by any single observer or agent to be true. It is the opposite of the closed world assumption, which holds that any statement that is not known to be true is false.
(sigue...)