Microsoft Azure Cosmos DB se une a la Cadena de Herramientas IA

Microsoft presentó una serie de herramientas nuevas para facilitar la personalización y el enfoque de los modelos de IA basados en GPT y Cosmos DB se está convirtiendo en una pieza clave dentro de esta estrategia.

¡Claro! Acá tenés la versión con los títulos acompañados de emojis y el texto redactado de forma más clara y fluida:

Microsoft en modo plataforma

Según el CEO Satya Nadella, la llegada de modelos como GPT-4 representa un “momento Mosaico”, similar al impacto del primer navegador web gráfico.

A diferencia de aquel entonces, esta vez Microsoft tomó la delantera y no quiere soltarla: está integrando IA en casi todos sus productos, desde Bing y Edge hasta GitHub, Microsoft 365 y Power Platform.

La visión de Microsoft como empresa plataforma impulsa su enfoque: proporcionar herramientas para que los desarrolladores creen sus propias soluciones.

Con APIs de Azure OpenAI, Prompt Engine y Semantic Kernel, los equipos pueden construir experiencias personalizadas sobre los modelos de lenguaje.

¿Por qué son importantes las bases de datos vectoriales?

Los modelos de lenguaje como GPT-4 trabajan en un espacio semántico multidimensional basado en vectores.

Esto permite encontrar similitudes entre conceptos, no solo palabras clave.

Pero para aprovechar eso con nuestros propios datos, necesitamos una forma de almacenarlos como vectores, algo que hasta ahora requería soluciones especializadas.

Sin embargo, construir o adaptar una base de datos vectorial desde cero es costoso y complejo.

Aquí es donde entra Cosmos DB con búsqueda vectorial, permitiendo aprovechar los datos ya almacenados y convertirlos en conocimiento útil para aplicaciones de IA.

Cosmos DB ahora permite búsqueda vectorial

Durante Microsoft Build 2023, se anunciaron nuevas capacidades de búsqueda vectorial en Cosmos DB, la base de datos nativa en la nube.

Esto significa que ya podés almacenar embeddings y realizar búsquedas semánticas sin necesidad de migrar a otro sistema.

Este soporte se suma a Cosmos DB for MongoDB vCore, lo que permite mantener la compatibilidad con APIs conocidas y migrar datos existentes fácilmente. Además, la función de cambio de feed mejora la replicación entre regiones.

¿Qué permite esta nueva búsqueda? ⚙️

La funcionalidad incluye:

  • Indexación vectorial básica (IVF Flat)
  • Soporte para hasta 2,000 dimensiones por vector
  • Tres tipos de métricas de distancia
  • Compatibilidad con embeddings generados por Azure OpenAI

Lo más interesante: todo esto se suma a una base documental que ya manejamos. Podés convertir documentos a JSON, generar embeddings y almacenarlos sin romper tus flujos de trabajo actuales.

Aplicaciones prácticas: copilotos empresariales

Con esta integración, es más fácil crear copilotos personalizados que respondan usando tus propios documentos empresariales: propuestas, contratos, casos de soporte, etc.

Los modelos no necesitan que el contenido tenga palabras clave exactas, solo que sea semánticamente similar.

Un ejemplo claro: una aplicación que redacta respuestas a licitaciones gubernamentales puede usar propuestas exitosas pasadas como base, mejorando precisión y eficiencia.

Cosmos DB como memoria semántica

La nueva búsqueda vectorial también se puede integrar con Semantic Kernel, la herramienta de Microsoft para construir habilidades de IA en C# o Python.

Esto permite crear memorias semánticas que conecten las respuestas del modelo con tu contenido, y construir copilotos más contextuales.

La idea es que tus aplicaciones puedan acceder a datos propios de manera más precisa, sin alucinar ni desviarse del tema, lo que mejora la calidad y confiabilidad de los resultados.

Un ecosistema completo de herramientas IA en Azure ️

Microsoft está armando un ecosistema unificado: Desde Azure AI Studio con su generador de copilotos low-code, pasando por Azure Cognitive Search, hasta herramientas personalizadas como esta búsqueda vectorial en Cosmos DB.

Todo esto apunta a un solo objetivo: ayudarte a construir soluciones de IA potentes, seguras y basadas en tus datos. Sin necesidad de salir del entorno Azure.


Descubre más desde CIBERED

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario