Microsoft lanza MAI-Transcribe, MAI-Voice y MAI-Image: independencia de OpenAI
Microsoft lanza tres modelos fundacionales propios de IA, reduciendo su dependencia de OpenAI con soluciones de transcripción, voz e imagen.
Publicado por BREIA — Categoría: IA y Tecnología
Microsoft rompe su dependencia de OpenAI con tres modelos propios El 7 de abril de 2026 , Microsoft anunció el lanzamiento oficial de tres modelos de inteligencia artificial desarrollados íntegramente por su equipo MAI: MAI-Transcribe-1 , MAI-Voice-1 y MAI-Image-2 . Es la primera vez en años que la compañía presenta modelos fundacionales competitivos independientes de OpenAI, con quienes renegoció recientemente los términos de su alianza estratégica. Los tres modelos ya están disponibles a través de Microsoft Foundry y el MAI Playground, y se están integrando en servicios propios como Copilot y Azure Speech. Esta estrategia sitúa a Microsoft en posición de mayor autonomía tecnológica, reduciendo su exposición a los cambios de precio o condiciones que pueda imponer OpenAI en el futuro. ¿Qué puede hacer cada modelo y qué implica para tu empresa? Los tres modelos cubren capacidades críticas para la automatización empresarial. MAI-Transcribe-1 convierte voz en texto en 25 idiomas con un coste de GPU un 50 % inferior al de las alternativas líderes del mercado, siendo además 2,5 veces más rápido que la oferta Azure Fast actual. Esto lo convierte en una opción muy atractiva para empresas que transcriben reuniones, llamadas de atención al cliente o contenidos de audio a gran escala. MAI-Voice-1 genera audio sintético personalizable capaz de producir hasta 60 segundos de voz en aproximadamente 1 segundo , con opciones de personalización de timbre y tono. Por su parte, MAI-Image-2 genera imágenes fotorrealistas profesionales a partir de texto, con resultados comparables a los modelos premium del sector. Ventajas concretas para pymes y agencias españolas La combinación de estos tres modelos a través de una misma plataforma (Foundry) reduce drásticamente la complejidad de integración. Las empresas que apliquen estas herramientas pueden: Automatizar la transcripción de reuniones, webinars y atención telefónica con un coste operativo hasta la mitad del actual. Crear locuciones y