Estaba haciendo un poco de orden en mis archivos digitales (sobre los otros he abandonado hace mucho toda esperanza) cuando me encontré con una ilustración en 3D de una lectora de CD-ROM desarmada. Mi memoria no es muy buena, pero de todos modos identifiqué de inmediato el trabajo. Y esa fue la primera sorpresa.
Hace muchísimos años, más o menos entre 1997 y 2002, publiqué en el suplemento Tecnología una serie llamada El ABC, en la que desarrollaba los conceptos fundamentales de la computación, en una época en la que la computación era de verdad novedosa. Tanto, que era casi imposible conseguir buenas ilustraciones de los componentes de estas máquinas que, por entonces, se limitaban a desktop con monitor de tubo y notebooks corpulentas.
La serie había tenido buena recepción, y era lógico; durante ese período respondí unas 25.000 consultas de lectores sobre decenas de asuntos que, en una época sin YouTube ni Instagram, eran, además de herméticos, escurridizos. Pero de entrada El ABC había encontrado un obstáculo. Las ilustraciones.

Parece que no, pero uno aprende muy pronto en este oficio que hay ciertas notas que no sirven para nada sin buenos gráficos. Podía haber echado mano de fotos de productos, que las compañías siempre están más que dispuestas a ofrecer. Pero era, se suponía, una serie de divulgación. Las fotos de los dispositivos por fuera no servían, salvo en casos muy especiales. Los lectores ya conocía esa vista. Toda la gracia era mostrar las máquinas por dentro.

Sí, lo sé, hoy una búsqueda en Google arroja docenas de resultados y las agencias de imágenes tienen montones de fotos y diagramas en venta. Pero estoy hablando de una época en la que Google no existía. Así que decidí que para poder cumplir en tiempo y forma con los cierres, el mejor camino era tomar ese trabajo en mis manos.
Paréntesis: Antes de que me acusen de micromanagement, consulté a todos los ilustradores que conocía, y ninguno se atrevió a meterse con estos temas; de hecho, 25 periodistas que había convocado un par de años antes para trabajar en el suplemento habían rechazado la propuesta, “porque de esas cosas no entendían nada”, y solo un puñado se subió a aquella aventura.
En fin, con el lanzamiento encima, me puse a estudiar los básicos del diseño 3D, cosa que me llevó unos cuantos fines de semana, y luego de probar varios programas, me compré el Moray, que servía para el modelado y la creación de la escena (creo que me costó 49 dólares), y opté por el motor de render POV-Ray, gratis y de software libre.
Motor de render suena de lo más estratosférico, así que lo explico. Se trata del software que toma la escena creada con un programa de diseño 3D y la convierte en una imagen. La escena son puros datos; la imagen son pixeles. El motor de render hace esa conversión de datos a pixeles. El nombre POV-Ray viene de Persistence of Vision Ray Tracer; el trazado de rayos es una de las técnicas para crear imágenes realistas con un motor de render.
Desarmemos esto
Usé primero Moray 3.3 y luego 3.5. La 3.3 todavía corre en mi Windows 11. No he podido encontrar el instalador de la 3.5. Tiene sentido; han pasado más de 25 años. Moray cambió de manos varias veces y su desarrollo se estancó en 2016. Por mi parte, seguí haciendo diseño 3D en mis ratos libres, pero pronto me pasé a Blender, que por entonces todavía no llegaba a las computadoras con Windows. Blender se iba a convertir pronto en software libre y gratis, y sería tapa del suplemento Tecnología el 24 de julio de 2000. Hoy sigue siendo mi programa favorito para hacer 3D.

Hasta aquí, el relato parece de lo más redondito. No había imágenes como las que pretendía, así que aprendí a modelar y a renderizar, y salimos a la cancha. Pero a este relato redondito le falta un dato. ¿Cómo componer el 3D de una lectora de CD-ROM por dentro? ¿Hay que desarmar una? Sí, claro. En esa época, sí.
Por fortuna, como me llevo bien con estas cosas y siempre ensamblé mis propias computadoras, con un destornillador y algunos diagramas que ya por entonces era posible conseguir en Internet o en manuales técnicos, las ilustraciones fueron saliendo con la fidelidad que me había imaginado (y que hoy, como pueden ver, suena muy rústica o ingenua o ambas cosas), y no con una foto de oficio y solo para cumplir. En algunos casos, no es improbable (no lo recuerdo, con toda franqueza; ha pasado demasiado tiempo) que haya usado algunos modelos de uso libre que por entonces se conseguían en la recién nacida Web. Pero no puedo asegurarlo. Me tomé, eso si, el tiempo para buscar en mi colección del suplemento Tecnología algunos ejemplares donde aparecieron estas publicaciones, que ilustran este artículo.

Recuerdo, sí, la enormidad de trabajo que daba hacer una de esas ilustraciones. Me encantaba, pero hoy me impresiona un poco; cuando lo mira desde la actualidad, cuando estas tecnologías están tan instaladas, parece un delirio invertir tanto esfuerzo en hacer una ilustración. Pero en aquella época veía que tales gráficos aparecían en las revistas extranjeras o en libros de divulgación y pretendía publicar algo a la altura. Supongo que, como siempre, salió mejor de lo que se esperaba (insisto, para la época) y mucho peor de lo que mi perfeccionismo aspiraba.
De oído
Pero esperen, que hay una segunda sorpresa. Cuando encontré estas imágenes 3D que había producido más de un cuarto de siglo atrás, se las mostré a mi mujer, a quien por entonces todavía no conocía, y le conté lo laborioso que había sido aquello. Entonces me dijo algo no solo cierto, sino palmario: “Pensar que hoy eso lo hacés con IA”.

No sé si saben lo que es un gancho al mentón. Bueno, eso fue un gancho al mentón. Sin ninguna mala intención, por supuesto. Era una observación aguda, y añadió: “Deberías contar eso en una columna”. Absolutamente. ¿Pero qué tan buena sería la IA para hacer una imagen técnicamente correcta de un dispositivo complejo?
Bueno, no fue precisamente soplar y hacer botellas. Conseguir que la lectora creada por la IA fuera algo más que fotográficamente realista resultó casi imposible. Gemini, en casi todos los casos, se olvidaba de una cuestión clave: la bandeja para los discos. GPT hizo un trabajo mejor en ese aspecto, pero, según el bot de OpenAI, dentro de un dispositivo de estos solo hay una plaqueta, y nada más. Ni motores, ni correas, ni un cabezal láser.
En otros casos, aparecían varios cables planos. Sí, hay al menos tres cables planos dentro de una lectora de CD; uno que va al motor que gira el disco; otro que conecta el brazo con el componente que emite el laser y lee los datos, y un tercero que va al frente, donde hay un led y un botón de expulsión. Pero en las ilustraciones creadas por IA los cables planos o bien carecían de sentido o bien no terminaban en ninguna parte.

Asimismo, se veían aquí y allá, en la plaqueta electrónica, enchufes espurios, porque a una lectora de este tipo solo se le conectan el cable de datos y el de alimentación, y todo eso por fuera. Ahora bien, esos componentes, aunque inexactos, daban la impresión de verosimilitud. Por supuesto, no hay intención en un modelo de IA (es una de sus muchas limitaciones), así que el pronóstico es todavía más alarmante. El razonamiento sería más o menos este: es un dispositivo electrónico, así que tiene circuitos impresos y en general los circuitos impresos van a tener uno o más enchufes. Esto es de rigor en los motherboards, pero no en un aparato cerrado donde no hay necesidad de enchufar nada más que lo que ya está enchufado.

Por lo tanto, dos cosas. Primero, no es del todo cierto que hoy podría hacer todas esas ilustraciones con IA. Trabajé bastante, y no hubo nada que me convenciera. Otro gran faltante era el concepto de diagrama simplificado para que el lector pudiera ver lo que importa del interior de uno de estos aparatos, y no los detalles irrelevantes. Cuando pedí un diagrama simplificado, el resultado fue algo por completo disociado de la realidad, con etiquetas incorrectas y repetidas y componentes desarticulados. La idea de mostrarle al lector el hecho de que un lector de CD (o lo que sea) tiene un motor que gira el disco, un brazo con un cabezal que emite el láser y lee datos montado sobre un eje con un motor de pasos y una bandeja para insertar el CD parecía superar por mucho la capacidad de síntesis de la IA.
Naturalmente, podría resguardarme en la creencia de que mis prompts no fueron demasiado buenos. Pero algo me dice que la explicación no es de ninguna manera tan cómoda y que el asunto es tan preocupante como previsible. Los modelos de IA por ahora no pueden hacer algo tan sencillo como desarmar una lectora de CD-ROM. Y eso que son solo cuatro tornillos.
Por Ariel Torres
Fuente: La Nación
Sea el primero en comentar en "Solo tiene que parecer verosímil; si está bien es lo de menos"