Saltar al contenido
Infinite Labs
Briefing #11 6 min

Briefing #11 · Agentes, infra y AI Act en revisión

Código agéntico en producción, infraestructura de agentes con tracción real, y la UE reescribiendo el AI Act antes de que termine de aplicarse.

TL;DR

  • La UE reescribe partes del AI Act antes de que entre en vigor por completo.
  • Agentes de código ya escriben pull requests completos: el evento de Anthropic en Londres lo dejó claro.
  • Infraestructura de agentes crece a ritmo acelerado: Daytona alcanza 850.000 ejecuciones diarias.

🤖 Modelos & Capacidades

Los agentes de código ya no son demos: son el flujo de trabajo

El evento Code with Claude de Anthropic, celebrado en Londres los días 19 y 20 de mayo, fue una demostración práctica de hacia dónde va el desarrollo de software. Según MIT Technology Review, varios asistentes confirmaron haber fusionado pull requests escritos íntegramente por el modelo en la última semana, sin apenas edición manual. No es una promesa de laboratorio: equipos reales ya trabajan así.

Para una empresa que evalúa cuándo introducir asistencia de IA en su ciclo de desarrollo, la señal es clara: el punto de inflexión no está en el futuro próximo, está pasando ahora. La pregunta relevante ya no es “si” sino “qué parte del pipeline técnico cedo primero y con qué guardarraíles”.

GPT-next demuestra capacidad matemática con coste muy bajo

Según Latent Space, un modelo de OpenAI resolvió un problema matemático abierto desde hace décadas, el problema de la distancia unitaria en el plano de Erdős, con un coste de inferencia por debajo de los 1.000 dólares. El resultado es relevante no por la anécdota matemática, sino por lo que ilustra sobre la relación coste-capacidad: razonamiento formal de alto nivel a precio asequible apunta a que tareas de verificación lógica, auditoría de contratos o revisión de código complejo dejarán de necesitar especialistas costosos para las comprobaciones rutinarias.


🛠️ Herramientas para Equipos

Daytona: sandboxes de bare metal para agentes, con tracción real

Daytona, plataforma de entornos de ejecución para agentes, publica datos de crecimiento que merecen atención: 850.000 ejecuciones diarias y un crecimiento mensual del 74%. En una entrevista con Latent Space, su CEO Ivan Burazin explica la tesis: los agentes necesitan entornos de cómputo aislados, reproducibles y rápidos, algo que ni los contenedores estándar ni las VMs tradicionales resuelven bien a escala. Daytona apuesta por bare metal con sandboxes efímeros y evaluaciones con refuerzo (RL evals) integradas.

Para equipos que ya construyen flujos agénticos, esto es infraestructura directamente aplicable. Si tu arquitectura actual usa contenedores Docker para el entorno de ejecución del agente, vale la pena revisar si Daytona reduce latencia y coste operativo en tu caso concreto.

Datasette Agent: consulta bases de datos en lenguaje natural

Simon Willison, creador de Datasette, ha publicado Datasette Agent, una capa de agente sobre su herramienta de exploración de datos SQLite. Permite lanzar consultas en lenguaje natural contra cualquier base de datos Datasette, con el modelo traduciendo a SQL y devolviendo resultados interpretados. El proyecto es open source y está pensado para analistas o gestores sin perfil técnico que necesitan acceso a datos sin pasar por un desarrollador cada vez.

Para equipos con datos internos en SQLite o exportaciones de bases de datos relacionales, el coste de integración es bajo y el caso de uso es inmediato: autoservicio de datos operativos sin escribir una sola consulta.


📊 Adopción & Casos Reales

AdventHealth reduce carga administrativa con ChatGPT en hospitales

AdventHealth, red hospitalaria estadounidense, ha publicado junto a OpenAI los detalles de su despliegue de ChatGPT for Healthcare. El foco no está en diagnóstico sino en la capa administrativa: documentación clínica, resumen de historiales y gestión de flujos de trabajo que consumen tiempo de enfermería y personal médico. El objetivo declarado es devolver tiempo de calidad a la atención al paciente reduciendo el trabajo burocrático.

El caso es relevante para cualquier sector con alta carga documental regulada (salud, legal, seguros, educación): el ROI no está en hacer el trabajo intelectual, está en eliminar la fricción documental que rodea ese trabajo.

Google DeepMind acelera investigación de rejuvenecimiento celular con Co-Scientist

DeepMind describe cómo su herramienta Co-Scientist ayudó a biólogos a identificar factores genéticos capaces de rejuvenecer células humanas. Los investigadores usaron el sistema para explorar hipótesis y priorizar candidatos experimentales, reduciendo el ciclo de descubrimiento inicial.

El patrón es el mismo que en otros sectores: la IA no reemplaza al experto, comprime el tiempo que ese experto tarda en llegar a las hipótesis que merecen ser testadas. En sectores donde la investigación tiene coste marginal alto (pharma, biotech, materiales), ese ahorro de tiempo tiene valor económico directo.


💼 Mercado & Estrategia

El problema de monetización del contenido en la web agéntica

Stratechery publica una entrevista de Ben Thompson con Parag Agarwal, fundador de Parallel, sobre cómo remunerar a los creadores de contenido cuando los agentes consumen información sin generar tráfico hacia el sitio original. La tesis de Agarwal es que la web agéntica rompe el modelo de atribución publicitaria actual: si el agente lee, resume y actúa, el publisher no recibe visita, no sirve anuncio, no cobra.

Para empresas que publican contenido como parte de su estrategia comercial (blogs, bases de conocimiento, documentación técnica), este debate es relevante ya. Los modelos de licenciamiento de contenido para entrenamiento e inferencia están aún sin estandarizar, y quien defina el estándar tendrá ventaja negociadora.

Tres nuevos unicornios de infraestructura AI: Exa, Modal y TurboPuffer

Según Latent Space, Exa (búsqueda semántica), Modal (cómputo serverless para ML) y TurboPuffer (base de datos vectorial) han alcanzado valoraciones de unicornio en rondas recientes. El patrón es consistente con lo que se ve en el mercado: la capa de infraestructura especializada para IA está captando capital de forma selectiva, no indiscriminada.

Para un CTO evaluando stack, estas valoraciones indican que los inversores apuestan a que estas capas de infra no serán absorbidas por los hiperescalares a corto plazo. Eso da cierta garantía de continuidad como proveedores de terceros.

Hark recauda 700 millones en Serie A para una plataforma AI aún no lanzada

Hark ha cerrado una Serie A de 700 millones de dólares para desarrollar lo que describe como una interfaz AI “universal” y multimodal, con hardware propio previsto para más adelante. La compañía no ha lanzado producto aún y los detalles técnicos son escasos.

La cifra es la noticia. Una Serie A de 700 millones en un producto sin tracción pública es una señal del momento especulativo en el que opera el mercado de inversión en IA de consumo. Útil para contextualizar con tu consejo o inversores cuando preguntan por valoraciones del sector.


🇪🇺 Regulación & Política

La UE reescribe partes del AI Act antes de que entre en vigor del todo

Sifted publica un análisis de los cambios que la Comisión Europea está introduciendo en el AI Act antes de que se complete su calendario de aplicación. Las presiones combinadas de competitividad industrial, lobbying de grandes tecnológicas y la aceleración del mercado han llevado a revisar algunos requisitos, especialmente los que afectan a modelos de propósito general (GPAI) y a las obligaciones de transparencia.

Para empresas que han iniciado procesos de cumplimiento basados en los textos de 2024, el consejo práctico es sencillo: no congeles tu hoja de ruta de compliance hasta tener el texto consolidado de cada artículo que te aplica. Los cambios en curso pueden aliviar algunas obligaciones o redistribuirlas entre proveedor y deployer.

Las cadenas de suministro de software, bajo ataque sistemático

Wired informa sobre TeamPCP, un grupo que ha comprometido cientos de organizaciones mediante ataques a repositorios de código abierto en GitHub. La táctica es inyectar código malicioso en dependencias populares para infectar proyectos que las incorporan sin revisión.

Para equipos que usan librerías de terceros en sus pipelines de IA: el perímetro de seguridad ya no termina en tu código. Cualquier dependencia externa es superficie de ataque. Revisar los procesos de auditoría de dependencias y considerar herramientas de análisis de composición de software (SCA) es una acción concreta y ejecutable esta semana.


🎯 Para llevar

  • Revisa tu hoja de ruta de cumplimiento del AI Act con los últimos cambios publicados por Sifted: algunos requisitos para modelos GPAI están siendo revisados y podrías estar sobrecomplicando (o infraestimando) tu preparación. Leer análisis

  • Audita las dependencias de código abierto en tus proyectos de IA, especialmente las que se actualizan automáticamente: el ataque de TeamPCP a GitHub afecta a cualquier equipo que incorpore paquetes externos sin revisión de integridad. Contexto en Wired

  • Evalúa Datasette Agent si tienes analistas que necesitan acceso a datos operativos sin pasar por un desarrollador: el coste de adopción es bajo y la integración con bases SQLite existentes es inmediata. Ver proyecto

Compartir: X LinkedIn