La programación de IA de código abierto recibe un gran impulso con el lanzamiento de NousCoder-14B, basado en el código de Claude
La guerra de la programación con IA acaba de ponerse más interesante. Mientras los desarrolladores llevan hablando con entusiasmo del Claude Code de Anthropic desde el día de Año Nuevo, la startup de IA de código abierto Nous Research ha lanzado discretamente su propia bomba: NousCoder-14B, un modelo de programación que iguala o supera a varios sistemas propietarios de mayor envergadura. Lo que lo hace especialmente atractivo para las empresas que exploran el desarrollo de IA es que todo el sistema se entrenó en solo cuatro días utilizando 48 de los últimos procesadores B200 de Nvidia, y todo es completamente de código abierto.
Este momento no es casual. Claude Code ha arrasado en las redes sociales con testimonios entusiastas de desarrolladores que han visto cómo recreaba en cuestión de horas sistemas complejos que a sus equipos les llevó meses construir. Jaana Dogan, de Google, se hizo viral al describir cómo Claude Code generó un sistema de orquestación de agentes distribuidos a partir de una indicación de tres párrafos, algo que a su equipo le llevó un año desarrollar. Pero Nous Research apuesta por que la transparencia y las alternativas de código abierto pueden competir cara a cara con los grandes del sector.
La transparencia radical que hay detrás del desarrollo de la IA y que realmente funciona
Lo que distingue al NousCoder-14B no es solo su rendimiento, sino la transparencia sin precedentes de su publicación. Nous Research no se limitó a publicar los pesos del modelo (algo que ya es poco habitual en el sector). Publicó el entorno completo de aprendizaje por refuerzo, el conjunto de pruebas de rendimiento, el sistema de entrenamiento y todo su marco Atropos. Esto significa que cualquier investigador que disponga de la potencia de cálculo suficiente puede reproducir, verificar o ampliar su trabajo.
El modelo alcanza una tasa de precisión del 67,87 % en LiveCodeBench v6, una prueba de evaluación estandarizada que evalúa problemas de programación competitiva. Esto supone una mejora de 7,08 puntos porcentuales con respecto a su modelo base, el Qwen3-14B de Alibaba. Pero lo realmente interesante es cómo lo han conseguido.
Joe Li, el investigador que entrenó el modelo, aportó al proyecto una perspectiva personal única. Como antiguo programador de competición, comparó la trayectoria de mejora del modelo con su propia experiencia en Codeforces, la plataforma de programación competitiva. El salto del modelo de una puntuación de entre 1600 y 1750 a una de entre 2100 y 2200 refleja el progreso que le llevó a Li casi dos años de práctica constante entre los 14 y los 16 años. El modelo logró esta mejora equivalente en cuatro días.
La infraestructura que sustenta la IA que aprende a programar
La arquitectura técnica pone de manifiesto lo sofisticado que se ha vuelto el entrenamiento de la IA moderna. El sistema utiliza «recompensas verificables»: genera soluciones de código, las ejecuta en casos de prueba y recibe una respuesta binaria sencilla: correcto o incorrecto. Aunque conceptualmente es sencillo, llevarlo a cabo a gran escala requiere una infraestructura considerable.
Mediante la plataforma de computación en la nube de Modal, el equipo ejecutó código en un entorno aislado de forma paralela en 24 000 problemas de entrenamiento, cada uno de los cuales contenía, de media, cientos de casos de prueba. Cada solución debe generar resultados correctos en un plazo de 15 segundos y con 4 gigabytes de memoria. El entrenamiento empleó la optimización dinámica de políticas de muestreo (DAPO), con una innovación clave que consistía en descartar los ejemplos en los que el modelo resolvía todos los intentos o fallaba en todos, ya que estos no proporcionan ninguna señal de aprendizaje útil.
El problema de los datos que podría frenar el avance de la IA
En el informe técnico de Li se esconde un hallazgo con enormes implicaciones para el sector de la inteligencia artificial: básicamente, se han agotado los datos de entrenamiento de alta calidad para la programación competitiva. Los 24 000 problemas utilizados para el entrenamiento representan «una parte significativa de todos los problemas de programación competitiva disponibles y verificables en un formato de conjunto de datos estandarizado».
Esto refleja la creciente preocupación que existe en todo el sector de la inteligencia artificial respecto a las limitaciones de los datos. Mientras que la capacidad de cálculo sigue aumentando de acuerdo con principios económicos y de ingeniería, los datos de entrenamiento son cada vez más limitados. En el caso concreto de la programación competitiva, el reto es especialmente acuciante, ya que este ámbito requiere problemas con soluciones correctas conocidas que puedan verificarse automáticamente.
Li identificó una posible solución: entrenar a los modelos no solo para resolver problemas, sino también para generar problemas que puedan resolverse, lo que permitiría el juego entre sí, de forma similar a las técnicas que han demostrado su eficacia en los sistemas de IA dedicados a los juegos. «Una vez resuelta la generación sintética de problemas, el juego entre sí se convierte en una vía muy interesante», escribió.
Qué significa esto para las aplicaciones empresariales
Para los líderes empresariales que estén considerando herramientas de programación basadas en IA, NousCoder-14B representa algo significativo: la prueba de que las alternativas de código abierto pueden competir con los sistemas propietarios, al tiempo que ofrecen una transparencia total sobre sus capacidades y limitaciones. A diferencia de las soluciones de «caja negra», se puede ver exactamente cómo se ha entrenado este modelo y qué es capaz de hacer. Para las organizaciones que buscan optimizar sus operaciones, estas capacidades de programación de IA representan una de las muchas oportunidades para aprovechar la automatización con el fin de aumentar la eficiencia, de forma similar a como la automatización de procesos mediante IA reduce los costes operativos en un 40 % en otras funciones empresariales.
Sin embargo, hay que tener en cuenta algunas salvedades importantes. Los modelos actuales funcionan mejor para problemas de codificación de un solo paso que para el desarrollo iterativo y en múltiples iteraciones que caracteriza a los proyectos de software reales. Los investigadores identificaron el aprendizaje por refuerzo en múltiples iteraciones como un paso fundamental a seguir: entrenar modelos para que incorporen información de retroalimentación, como errores de compilación y pruebas fallidas, a lo largo de múltiples intentos.
La apuesta de 65 millones de dólares por el código abierto
Nous Research se ha labrado una posición destacada gracias a su compromiso con el lanzamiento de productos de código abierto que compiten con las alternativas propietarias. Su ronda de financiación de 65 millones de dólares, liderada por la empresa de capital riesgo especializada en criptomonedas Paradigm, refleja el creciente interés por los enfoques descentralizados en el entrenamiento de la IA. Entre sus lanzamientos anteriores se encuentran Hermes 4, que, según se informa, supera a ChatGPT sin restricciones de contenido, y DeepHermes-3, el primer «modelo de razonamiento activable».
La empresa se enfrenta a cierto escepticismo: los críticos se preguntan si su imagen de marca, inspirada en el anime, prima la forma sobre el fondo, y siguen realizándose comparaciones técnicas con alternativas como los modelos Nemotron de Nvidia. Sin embargo, la transparencia radical de este lanzamiento ofrece pruebas concretas de sus capacidades.
Lo que a Li le llevó dos años de práctica dedicada, un sistema de IA lo replicó en 96 horas. Él necesitó 1.000 problemas; el modelo necesitó 24.000. Pero la tendencia es clara: estos sistemas se están acercando rápidamente a un rendimiento de nivel humano en tareas de programación estructuradas, y están aprendiendo a enseñarse a sí mismos. A medida que la IA sigue transformando la forma en que creamos software, la pregunta no es si las máquinas pueden aprender a programar, sino si pronto se convertirán en mejores profesores de lo que nosotros jamás fuimos.
Escrito por
Oliver K.G
Oliver K.G. es el fundador de AI Meets Life, una publicación que ayuda a los profesionales del mundo empresarial estadounidense a ir al grano y aplicar la inteligencia artificial donde realmente importa: en sus equipos, en sus flujos de trabajo y en sus resultados. Analiza las herramientas, las tendencias y las decisiones que están dando forma al futuro del trabajo.