Meta lanza modelo open source que fusiona texto y voz para Spirit LM.
Meta presenta Spirit LM, un modelo de lenguaje multimodal de código abierto que combina entradas y salidas de texto y voz. Esta innovación compite directamente con otros modelos multimodales como GPT-40 de OpenAI y EVI 2 de Hume, así como con herramientas dedicadas de texto a voz y voz a texto como ElevenLabs. Desarrollado por […] Más