Bases de datos evolucionan para combinar el aprendizaje automático y el almacenamiento de datos

Mujeres

Cuando Bob van Luijt, el CEO de SeMI Technologies , mira la historia de las bases de datos, destaca algunas olas distintas. Primero, estaba el mundo de SQL, donde todos los datos encajaban perfectamente en tablas rectangulares. Luego vino la revolución NoSQL que trajo la flexibilidad del modelo de documento, donde cada entrada no necesitaba tener los mismos campos. Ahora, su empresa está lanzando Weaviate al mercado como parte de una ola de bases de datos centradas en IA que fusionan el poder del aprendizaje automático con el almacenamiento de datos.

El nuevo modelo ofrece no solo el potencial para aprovechar el poder de los algoritmos de IA, sino también un motor de búsqueda más flexible que no está bloqueado en la búsqueda de coincidencias exactas. Mientras que las bases de datos tradicionales requieren que los nombres estén escritos correctamente o el código de confirmación exacto para ubicar un registro, Weaviate puede encontrar las entradas más similares.


Banner_frasco-suscripcion-800x250

¿Qué significa ser similar?

Esa sigue siendo una pregunta abierta para muchos usuarios. Gran parte del arte se dedica a definir cómo calcular qué tan cerca o lejos pueden estar dos datos. Encontrar los registros más cercanos en la base de datos comienza con encontrar una métrica o una forma de especificar qué significa estar cerca en algún espacio multidimensional definido por una IA.

Si bien SeMI Technologies es el principal recaudador de fondos, gran parte de la marca se centra en Weaviate, la base de datos de código abierto. Las empresas pueden descargar el código o comprar Weaviate como un servicio administrado.

Muchos usuarios de Weaviate confían en modelos preconstruidos para texto en inglés y otros idiomas conocidos. Hay un modelo creado a partir de la colección completa de artículos de Wikipedia que creó SeMI, para que la gente pueda experimentar. Hay disponibles otros modelos preconstruidos, incluido Haystack de deepset para la búsqueda semántica o la búsqueda basada en documentos de Jina.ai.

¿Qué es una base de datos vectorial?

Sin embargo, el motor central de Weaviate puede funcionar con cualquier colección arbitraria de valores, razón por la cual algunos llaman a estos sistemas «bases de datos vectoriales».

«La mayoría de los casos de uso todavía están en el texto». dijo van Luijt. “Pero te das cuenta de que cada vez más personas comienzan a entenderlo y dicen: ‘Oh, puedo hacer esto con texto. Permítanme también arrojar algunas imágenes’”.

Según van Luijt, después de experimentar con imágenes y audio, algunos usuarios están importando otros datos como secuencias de ADN o estudios geológicos. La búsqueda a través del genoma es una combinación natural para la tecnología porque algunas investigaciones genealógicas dependen de coincidencias inexactas. Los investigadores pueden rastrear el flujo de grupos y población a través del tiempo y la ubicación, oportunidades que abren caminos para estudiar la historia humana a través de datos de ADN .

Conoce más aquí

Banner_azules
Reciba las últimas noticias de la industria en su casilla:

Suscribirse ✉