Dado un conjunto , una partición
es
un subconjunto del
conjunto potencia
tal que cada elemento del conjunto pertenece
exactamente a una partición,
es decir,
y
Una relación, es denotada por , es un subconjunto del producto cruz
(el conjunto de pares ordenados). Dos elementos
se dice que
están relacionados, denotado por
, si el par
están en el mismo
subconjunto. Una relación
se dice que es una relación de
equivalencia si satisface, para todo
, las propiedades de:
a)Reflexividad
b)Simetria
c)Transitividad
Se muestra que cada partición induce una relación
de equivalencia
e inversamente
cada relación de equivalencia induce una partición. Dos elementos están
relacionados si ellos pertenecen a la misma
partición [Chi95]. Cada elemento
de la partición es entonces llamado
una clase de equivalencia.
Una clase de equivalencia
es a menudo llamada representativa (cualquier elemento
de
puede ser tomado como
un representativo).
Una definición alternativa de una clase de equivalencia de un elemento
es el conjunto de todos
tales que
. Denotaremos
la clase de equivalencia de
como
.
Por ejemplo, dado un conjunto de números reales , la relación
es una relación de
equivalencia. Un ejemplo de una clase equivalente en esta partición es el
conjunto de todos los
números reales tales que su suelo es uno.
Las clases de equivalencia del número 1 (
) y del número 1.5 (
) son la misma
(lo mismo ocurre en el intervalo entre los números 1 y 2 representado como
), hemos cambiado
sólo su representación.
Dado un conjunto y una relación de equivalencia
, obtenemos el
cociente
.
Esto indica que el conjunto de clases
equivalentes o co-conjuntos, son obtenidos cuando aplicamos la relación de
equivalencia al conjunto
.
En el ejemplo citado, los co-conjuntos
obtenidos de los números reales con la relación de equivalencia dado son
los intervalos
,
para todos los enteros
.
La relevancia de las clases de equivalencia en este trabajo viene de la
posibilidad de usarlas en
un espacio métrico así que el nuevo espacio
métrico es derivado del conjunto cociente. Este nuevo espacio
métrico es una versión engrosada
del original.
Las clases de equivalencia obtenidas con una relación de equivalencia de un
espacio métrico pueden ser
consideradas por sí mismas como puntos en un
nuevo espacio métrico, así que definimos una función de distancia en
su nuevo espacio métrico.
Introducimos una nueva función
definida ahora en el
cociente. Dado que
, está
definida entre clases equivalentes, una selección natural es
, así que esto da
los valores máximos posibles que mantienen el mapeo contractivo (Por ejemplo
para algún
). Desafortunadamente,
no satisface la desigualdad del triángulo, solo las propiedades de
positivo, positividad estricta y reflexividad. Por lo tanto,
por sí misma no es conveniente para propósitos de indexamiento.
Podemos usar cualquier distancia que satisfaga las
propiedades del espacio métrico y su límite inferior
(Por
ejemplo
). Llamamos
la extensión de
. De aquí que
es una distancia,
es un espacio métrico y sin embargo podemos hacer consultas en el
co-conjunto de la misma manera que hemos hecho en el conjunto. Redefinimos la salida de una
consulta en el co-conjunto como
(aunque formalmente deberíamos recuperar las clases, no los elementos).
Dado que el mapeo es contractivo
podemos convertir un problema de búsqueda en otro, esperemos que en un más simple.
Para una consulta dada
descubrimos cuales clases de equivalencia pertenecen al punto de consulta
(por ejemplo
). Entonces, usando la nueva función de
distancia
la consulta es transformada en
. Como el mapeo
es contractivo, tenemos
. Esto es,
es en efecto una lista candidata, así esto es
suficiente para desarrollar una búsqueda exhaustiva en la lista
candidata (ahora usando la distancia original), para obtener la salida
real de la consulta
.
El procedimiento antes citado es de hecho usado en cada algoritmo de
indexamiento. En otras palabras.
Todos los algoritmos de indexamiento para búsqueda de
proximidad consisten en construir un conjunto de clases de equivalencia,
descartando algunas clases, y buscando exhaustivamente en el resto.
En la figura podemos ver esquemáticamente un ejemplo de
esta idea. Dividimos el espacio en varias regiones (clases de
equivalencia). Los puntos dentro de cada región son indistinguibles.
Podemos considerarlos como puntos en un nuevo espacio métrico. Para
encontrar la respuesta, en lugar de examinar exhaustivamente el
diccionario completo, solo examinamos las clases que contienen
puntos potencialmente interesantes, en la imagen del lado derecho
en la figura
estas regiones de interés se
muestran sombreadas. En otras palabras, si una clase
puede contener un punto que debe ser regresado en la salida de una
consulta, entonces la clase será examinada.