Hace ya meses que escuchamos que las IA generativas como ChatGPT, Bard y compañía, ponen en peligro una enorme cantidad de puestos de trabajo, y que uno de los colectivos de profesionales que más se va a ver afectado por esto es el de los programadores. De hecho, he llegado a leer declaraciones que afirman que hasta el 90% de los programadores pueden llegar a perder su trabajo a lo largo de los próximos años como consecuencia de las capacidades de la inteligencia artificial.

Ahora bien, hay una pregunta importante a tener en cuenta, y es si realmente los modelos generativos son en realidad equiparables, en aptitud, a los programadores, pues de poco o nada sirve que sean capaces de generar código en unos pocos segundos (frente a los minutos o incluso horas, que tardaría un programador), si luego resulta que ese código es incorrecto. Y lo cierto es que esto ocurre, a día de hoy, con bastante más frecuencia de lo que cabría esperar.

Esto, que ya ha sido comprobado de manera empírica por no pocos programadores, se confirma por un estudio llevado a cabo por la Universidad de Purdue, Indiana. Según dicho estudio, del que se hace eco The Register, los investigadores recopilaron 517 consultas de Stack Overflow, una web creada en 2008 y que sirve como punto de encuentro para más de 13 millones de programadores de todo el mundo. En Stack Overflow se publican miles de consultas diariamente, y es la propia comunidad la que les da respuesta.

Pues bien, ChatGPT respondió de manera incorrecta al 52% de las consultas efectuadas. Esto, por sí mismo, ya resulta tremendamente problemático, pero resulta ser aún peor debido a la gran habilidad del chatbot para elaborar sus respuestas. Es decir, que resulta tan convincente que, al igual que un buen mentiroso (aunque evidentemente no estoy equiparando una cosa con la otra) puede llegar a persuadir a su interlocutor de la veracidad de su respuesta, pese a que sea incorrecta.

Hay algo mucho más tedioso que programar, y es tener que revisar el código escrito por otros, o al menos eso es lo que me han comentado muchos programadores a lo largo de los años. Así, si nos encontramos con que lo que ofrece ChatGPT no es fiable, de modo que es necesario revisarlo por completo, se pierde buena parte de la supuesta utilidad. Es cierto, no obstante, que existen herramientas específicas, como GitHub Copilot, y que otros chatbots como Bard han puesto el foco en este punto, pero incluso así, a día de hoy resulta evidente que estos modelos no ofrecen el nivel de fiabilidad necesario para este tipo de tareas.