OpenAI o1: el razonamiento como nueva dimensión de la IA

El 12 de septiembre, OpenAI presentó el modelo o1 —anteriormente conocido en fase de prueba como "Strawberry"— e introdujo con él un concepto que cambiaría la discusión técnica sobre inteligencia artificial para los meses siguientes: el inference-time compute. En lugar de aumentar el tamaño del modelo para mejorar el desempeño, o1 invierte tiempo adicional en razonar antes de producir una respuesta. El modelo genera internamente cadenas de pensamiento —pasos intermedios de razonamiento que el usuario no ve directamente— antes de entregar su respuesta final.

Los resultados en benchmarks de matemáticas, ciencias y programación avanzada fueron inmediatamente distinguibles. En el examen de calificación de la Olimpiada Internacional de Matemáticas, o1 resolvió el 83% de los problemas, contra el 13% de GPT-4o. En tareas de programación competitiva alcanzó percentiles de experto humano. El patrón era consistente: cuanto mayor la complejidad del problema y más claramente definidos los criterios de corrección, más marcada la ventaja de o1 sobre los modelos anteriores.

Por qué "pensar más" amplía el rango de aplicaciones útiles

La distinción no es cosmética. Los modelos de lenguaje anteriores producían respuestas en milisegundos, lo cual los hacía excelentes para generación de texto fluida pero limitados en tareas que requieren verificación interna, corrección de errores propios o seguimiento de múltiples restricciones simultáneas. o1 introduce la posibilidad de tardar minutos en responder si eso es lo que requiere la tarea, y esa latencia adicional se traduce directamente en mayor precisión en dominios técnicos.

"El modelo o1 no es simplemente 'más inteligente'. Es un sistema que asigna deliberadamente más recursos computacionales a pensar antes de hablar. Para muchas aplicaciones empresariales, esa diferencia es la que separa un asistente útil de una herramienta en la que se puede confiar."

Para aplicaciones empresariales, esto abre categorías que antes eran impracticables con IA: revisión de contratos complejos con múltiples condiciones legales, análisis de código con búsqueda de vulnerabilidades de seguridad, generación de planes financieros con restricciones de múltiples variables. La advertencia importante es que o1 no reemplaza a GPT-4o en todo —para generación de texto conversacional, redacción o resúmenes, la velocidad y fluidez de los modelos anteriores sigue siendo superior. o1 es una herramienta especializada, no una sustitución universal.

iPhone 16: el primer iPhone diseñado para la era de la IA

El 9 de septiembre, Apple presentó el iPhone 16 con una narrativa central que no había usado en años: este dispositivo fue diseñado desde cero para inteligencia artificial. El chip A18, con una Neural Engine de segunda generación, prometía ejecutar modelos de lenguaje directamente en el dispositivo sin enviar datos a servidores externos. El nuevo botón de control de cámara añadía interacción física para las funciones de IA visual. Y Apple Intelligence —la plataforma de IA personal de Apple— comenzaría a desplegarse en fases a partir del otoño.

Las ventas del iPhone 16 fueron sólidas pese a que Apple Intelligence aún estaba en beta al momento del lanzamiento. El argumento de compra era en parte aspiracional: los usuarios adquirían hardware preparado para funciones que arribarían en actualizaciones posteriores. Este modelo de venta —hardware que promete capacidades futuras— es inusual en el mercado de consumo y revela cuánta confianza tiene Apple en su base de usuarios para tolerar la espera.

Boeing Starliner: el fracaso que la NASA no pudo ignorar

El 7 de septiembre, la cápsula Boeing Starliner regresó a la Tierra sin sus astronautas. La decisión de la NASA fue contundente: los riesgos técnicos acumulados durante la misión —fugas de helio, fallos en propulsores— eran suficientes para descartar el regreso tripulado en esa nave. Los astronautas Butch Wilmore y Suni Williams, que habían llegado a la Estación Espacial Internacional en junio con lo que debía ser una misión de ocho días, esperarían hasta 2025 para regresar en una cápsula Crew Dragon de SpaceX.

Boeing perdió aproximadamente 1,600 millones de dólares en el programa de desarrollo del Starliner —por encima de las estimaciones iniciales— y el contrato con la NASA no cubrirá esas sobrecostos. El fracaso es especialmente significativo porque Boeing y SpaceX recibieron contratos simultáneos de la NASA bajo el programa Commercial Crew en 2014. SpaceX entregó el Crew Dragon en tiempo y costo. Boeing lleva una década de retrasos y un fracaso de certificación. El contraste ilustra con claridad la diferencia de cultura de ingeniería entre ambas organizaciones.

El Reglamento de IA de la Unión Europea entra en vigor

En septiembre de 2024 entraron en vigor los primeros artículos del EU AI Act, el marco regulatorio más comprehensivo para inteligencia artificial en el mundo. Las prácticas prohibidas incluyen sistemas de scoring social para determinar el acceso a servicios públicos, reconocimiento biométrico en tiempo real en espacios públicos con excepciones muy limitadas, y sistemas que manipulan el comportamiento humano de manera subliminal. Las prohibiciones aplican a cualquier empresa que opere en la UE, independientemente de su sede.

Para empresas mexicanas con operaciones o clientes en Europa, el EU AI Act establece obligaciones de documentación, auditoría y transparencia que van significativamente más allá de lo que la regulación local exige. La lectura prudente es que los estándares europeos se convertirán, por presión de mercado, en el piso mínimo efectivo para cualquier empresa que aspire a operar en economías desarrolladas. Ignorarlos hoy significa mayor esfuerzo de adaptación mañana.