El gigante chino del comercio electrónico y la web, Alibaba, ha lanzado oficialmente una serie de modelos de inteligencia artificial (IA) de código abierto llamados Qwen3, que parecen estar a la altura de los modelos más avanzados disponibles en el mercado y acercarse al rendimiento de los modelos propietarios de empresas como OpenAI y Google.
Estos modelos, desarrollados por el equipo de Qwen, ofrecen capacidades de razonamiento híbrido o dinámico, lo que permite a los usuarios alternar entre respuestas rápidas y precisas, y pasos de razonamiento más complejos y exigentes en términos computacionales. Esta función es especialmente útil para consultas difíciles en áreas como la ciencia, las matemáticas y la ingeniería.
El modelo más destacado de la serie Qwen3 es el Qwen3-235B-A22B, que cuenta con 235 mil millones de parámetros y supera a otros modelos de código abierto como el R1 de DeepSeek y el o1 de OpenAI en pruebas de referencia clave. Además, se acerca al rendimiento del modelo propietario Google Gemini 2.5-Pro.

Los modelos Qwen3 están disponibles en varias plataformas, incluyendo Hugging Face, ModelScope, Kaggle y GitHub, y pueden ser utilizados a través de la interfaz web de Qwen Chat y aplicaciones móviles. La licencia de código abierto Apache 2.0 permite su uso comercial ilimitado, lo que supone una ventaja significativa sobre otros modelos de código abierto con licencias más restrictivas.
En cuanto a la formación de los modelos, el conjunto de datos de preentrenamiento se duplicó en tamaño a aproximadamente 36 billones de tokens, lo que incluye extracciones de documentos en formato PDF, contenido web y contenido sintético generado utilizando modelos Qwen anteriores centrados en matemáticas y codificación.
El equipo de Qwen ha abordado importantes desafíos técnicos, como escalar el aprendizaje de refuerzo de manera estable, equilibrar datos de múltiples dominios y ampliar el rendimiento multilingüe sin sacrificar calidad.
Para el futuro, el equipo de Qwen tiene previsto escalar aún más los datos y el tamaño de los modelos, ampliar las longitudes de contexto, aumentar el soporte multimodal y mejorar el aprendizaje de refuerzo con mecanismos de retroalimentación ambiental.
En resumen, el lanzamiento de Qwen3 representa un avance significativo en el campo de la IA, ofreciendo modelos de código abierto altamente competitivos que pueden ser utilizados en una amplia gama de aplicaciones, desde la investigación hasta la implementación empresarial. Esto podría democratizar aún más el acceso a tecnologías de IA avanzadas y fomentar la innovación en diversos sectores.

GIPHY App Key not set. Please check settings