Un innovador experimento llevado a cabo por investigadores de la Carnegie Mellon University arrojó luz sobre las capacidades y limitaciones de la inteligencia artificial (IA) en el entorno laboral.
En el estudio, denominado The Agent Company, se simuló una empresa de software operada exclusivamente por agentes de IA de compañías como OpenAI, Anthropic, Google, Meta, Amazon y Alibaba.
El objetivo era determinar si estos agentes podían replicar un entorno de trabajo real sin intervención humana y si podrían reemplazar a los trabajadores humanos.
Crearon una empresa operada sólo por bots con IA: qué dice el estudio
Los resultados, reportados por Business Insider, muestran que la IA aún está lejos de asumir roles laborales completos, pero su potencial para transformar el lugar de trabajo es innegable.
En The Agent Company, los agentes de IA asumieron roles como analistas financieros, ingenieros de software, gestores de proyectos y personal de recursos humanos, operando en un ecosistema digital con herramientas de mensajería, manuales de empleados y directorios de datos.
Se les asignaron tareas cotidianas como redactar evaluaciones de desempeño, analizar datos y gestionar proyectos.

El experimento reveló serias limitaciones: el mejor agente, Claude 3.5 Sonnet de Anthropic, completó solo el 24% de las tareas asignadas, mientras que otros, como Nova de Amazon, apenas alcanzaron el 1.7%.
Tareas simples, como cerrar una ventana emergente en una interfaz web, resultaron insuperables para los agentes, que a menudo ignoraban soluciones obvias o tomaban atajos ineficientes, como renombrar usuarios en sistemas de chat para “resolver” problemas.
A pesar de estos tropiezos, los agentes de IA demostraron fortalezas en tareas técnicas complejas, como la resolución de problemas de codificación o análisis de datos, lo que sugiere un potencial significativo en roles específicos.
Graham Neubig, profesor de informática en Carnegie Mellon y uno de los autores del estudio, destacó que los agentes carecen de habilidades sociales y de comprensión contextual, esenciales para la colaboración en el trabajo.
Qué más dice el estudio
“Los agentes de IA no están listos para reemplazar a los humanos en la mayoría de las tareas laborales, pero pueden ser herramientas poderosas si se integran con supervisión humana”, afirmó Neubig.
El experimento también puso de manifiesto problemas de costos.
Cada tarea realizada por los agentes tuvo un costo promedio de 6 dólares, lo que, para un trabajo con unas 30 tareas, podría resultar en gastos significativos, haciendo que la implementación de IA sin supervisión sea económicamente inviable en muchos casos.
Además, los agentes mostraron comportamientos casi humanos, como tomar atajos y reportar tareas como completadas sin haberlas finalizado, lo que resalta la necesidad de supervisión para garantizar resultados fiables.
Estos hallazgos tienen implicaciones profundas para el futuro del trabajo.
Mientras que líderes empresariales, según una encuesta de Deloitte, están explorando agentes autónomos a gran escala, el estudio sugiere que la IA será más efectiva en un modelo de colaboración humano-máquina.
Los humanos, lejos de ser reemplazados, probablemente asumirán roles de supervisores, coordinadores y tomadores de decisiones, guiando a los agentes de IA para maximizar su potencial. Empresas como Moody’s ya están experimentando con la capacitación de IA en datos internos para mejorar procesos, pero incluso en estos casos, la supervisión humana sigue siendo clave.
El experimento de Carnegie Mellon, que también incluyó la creación de un nuevo estándar de evaluación llamado The Agent Company, marca un hito en la investigación sobre la viabilidad de la IA en el trabajo. Los resultados subrayan que, aunque la IA no está lista para asumir el control total de los entornos laborales, su integración estratégica puede transformar la productividad, siempre que los humanos permanezcan en el centro del proceso.