Sabelotodo

31 | Algunas consideraciones sobre la Inteligencia Artificial

Sep 10, 2024

Soy pro-tecnología. Me gusta internet, me gustan las computadoras, los celulares, el 3G, el 4G y el 5G. ¡Me gustan todas las Gs! Por supuesto, la modernidad ha traído consigo problemas nuevos y cosas malas, pero nada es perfecto, amigos. Dejen de quejarse y maduren, convivan con la imperfección del mundo.

Digo que soy pro-tecnología, pero la inteligencia artificial me aburre como pocas cosas en el mundo. No me sorprende, no me asombra. La falta de asombro hace que me cueste mucho investigar sobre el tema, estar al día, estudiarlo. Sí, mis amigos, es cierto: no lo sé todo. Sin embargo, la “IA” (la peor combinación de vocales, la cosa más incómoda para decir) está tan presente que no puedo evitar haber formulado opiniones. Las comparto.

No sé si esta es una distinción universal, pero voy a establecer tres grandes categorías de IA. Los asistentes, los generadores de texto y los generadores de imagen. Los asistentes (como Siri, aunque no estoy seguro de que Siri sea una IA y tampoco me importa) no me interesan tanto. ¡No me interesan y se acabó! De los otros dos, en cambio, tengo cosas para decir.

Pomelos, promedios, prompts

Los generadores de imagen tienen distintas formas. La idea universal de todos ellos es que uno les pide una imagen y la IA genera esa imagen. Según qué tan específicos seamos con nuestro pedido (nuestro prompt), más precisa será la imagen. Esa imagen que construyen la hacen a partir de tener en su base de datos todas las imágenes que alguna vez se subieron a internet. (Estoy simplificando, pero la idea general es esa). Si yo le pido un pomelo a la IA, la IA busca todas las cosas catalogadas como “pomelo” en su base de datos y me devuelve un pomelo que, de alguna manera, es el pomelo. Eso que me da es como un promedio de todos los pomelos que conoce. Esto del promedio es importante.

Ese pomelo puede ser realista, una caricatura, una pintura al estilo del pintor que queramos, iluminado de la manera que queramos, etc. Podemos ser específicos. Si pido un pomelo pintado por Hopper, la IA de alguna manera va a promediar el estilo de Hopper para imitar el estilo. El problema de esto, como todo primer problema, es que los promedios suelen ser poco interesantes.

Por ejemplo, la página Rotten Tomatoes, muy popular para evaluar películas, es lo que se llama un “review aggregator”. Esto quiere decir que Rotten Tomatoes reúne todas las críticas que hay de una película y devuelve un promedio de aceptación. Esto es muy importante: el promedio que da no es de puntaje, sino de aceptación. Si una película tiene 100% en Rotten Tomatoes, lo único que quiere decir es que a todos los críticos les gustó la película. Pero “gustar” significa que la evaluaron, como mínimo, con un 6. Es decir que el promedio de puntaje de una película con 100% en Rotten Tomatoes puede ser de 6 puntos. Como regla general, las películas que tienen porcentajes muy altos en Rotten Tomatoes no son muy buenas. O, por lo menos, no son tan buenas como uno creería cuando lee “noventa y pico porciento en Rotten Tomatoes”. Esto es así porque las mejores películas, las buenas de verdad, muchas veces traen consigo decisiones arriesgadas que no son necesariamente populares. Las obras más disruptivas son, también, divisivas, controversiales. Son las que despiertan emociones más fuertes. Por ejemplo. La mujer maravilla tiene un “tomatómetro” de 93%. La delgada línea roja, de Terrence Malick, tiene 80%. No me cuesta imaginarme dos críticos de cine yéndose a las manos por esta diferencia de puntaje entre estas dos películas. No estoy diciendo que La mujer maravilla sea una poronga (no lo es) ni que La delgada línea roja sea una obra maestra (lo es). Pero es razonable aceptar que una busca activamente apelar a la mayor cantidad de público posible, mientras que la otra exige una participación más activa de parte del espectador. Para apelar a la mayor cantidad de público, en general, se toman menos riesgos y se toman decisiones más seguras.

Me fui a cualquier lado. Lo que quiero decir es que cuando uno genera arte con IA corre el riesgo de recibir un producto mediocre, porque lo que recibe es un promedio. Esto no es culpa de la herramienta: también se pueden crear productos mediocres con un pincel y un lienzo. La IA es una herramienta como cualquier otra. El operador de la IA puede ser increíblemente específico y creativo con su uso. Pero, si se usa con desidia, el resultado es pobre. Se nota mucho la diferencia entre una imagen genérica de IA y otra (también generada por IA) original y sorprendente.

El otro gran problema de los generadores de imagen es el pantanoso terreno ético sobre el que están plantados. Digamos, si la IA está promediando imágenes, de alguna manera las está usando. Agarra un poco de una, otro poco de otra y así hasta generar su propia imagen. El problema sería que los creadores originales de esas imágenes, las que conforman la base de datos de, por ejemplo, Dall-E, nunca dieron su consentimiento para que sus obras sean usadas de esta manera. Por eso se dice, muchas veces, que programas como Dall-E y Midjourney son una forma de plagio.

De eso no estoy tan convencido. Como diría Kamala Harris, yo existo en el contexto de todo lo que viví y de aquello que existió antes que yo. Ningún artista existe en un vacío y todos tienen, en su base de datos personal (su cerebro) una acumulación de influencias, conscientes e inconscientes, que terminan de dar forma a su obra. ¿Es muy distinto eso a lo que hace la IA? Y, además, mi postura más radical es que la obra no es del artista. Uno hace arte y se lo entrega al mundo. Me parece extraño, de repente, que haya una pretensión de autoría tan extrema. Por supuesto cada artista es dueño intelectual de su obra, pero lo que devuelve la IA después de promediar la base de datos no es una copia literal. Quiero decir, no es que uno pueda señalar una parte de una obra generada por IA y afirmar fehacientemente “esa tonalidad de rojo la sacó de mi obra”. Es como si los Pixies le exigieran regalías a Nirvana por haber sido influyentes en su música. (El ejemplo es confuso y Kurt Cobain está muerto).

Decisiones

Los generadores de texto son un monstruo similar. Chat GPT, por ejemplo. Me gusta ChatGPT. Es como charlar con Google, en lugar de tirar palabras sueltas en un recuadro (aunque también se podría usar así). ChatGPT, además de contestar preguntas, puede resumir textos, explicarlos, alargarlos, redactar correos, discursos, etc. ¿Cómo lo hace? Supongo que promediando a partir de su base de datos, que es algo así como toda la internet hasta cierta fecha. ChatGPT se puede equivocar, pero eso no me importa. Yo me equivoco todo el tiempo. Mi problema con ChatGPT es que tiene un tono muy reconocible y ese tono es feo. Se nota mucho cuando un texto se escribió con ChatGPT.

Hace poco salió una nota en The New Yorker sobre este tema. La nota es de Ted Chiang, escritor de ciencia ficción que me gusta mucho y el autor del cuento Story of your life, a partir del cual se basó la película Arrival (el cuento es mejor que la película). La nota se llama “Por qué la IA nunca va a hacer arte”. No sé si coincido con todo lo que dice, pero igual Chiang es un tipo inteligente e interesante. El centro de la cuestión, para Chiang, es que hacer arte se trata, fundamentalmente, de tomar cientos de pequeñas decisiones todo el tiempo. Cuando uno escribe ficción, por ejemplo, se toman decisiones casi con cada palabra que se escribe. Cuando uno le pide a una IA que genere algo, en cambio, toma muy pocas decisiones. Por lo menos, toma considerablemente menos decisiones que si hiciera la obra uno mismo. Por ejemplo, cuando pedí un pomelo pintado por Hopper, la única decisión que tomé es bastante superficial. Si yo mismo pintara el pomelo al estilo de Hopper tendría que decidir una cantidad de cosas casi inmensurable.

Chiang dice:

Si una IA genera una historia de diez mil palabras basada en tu sugerencia, tiene que llenar todos los vacíos de las decisiones que no estás tomando. Hay varias formas en que puede hacerlo. Una es tomar un promedio de las decisiones que otros escritores han hecho, representadas por textos encontrados en Internet; ese promedio equivale a las decisiones menos interesantes posibles, lo que explica por qué el texto generado por IA suele ser bastante insípido. Otra opción es instruir al programa para que imite un estilo, emulando las decisiones tomadas por un escritor específico, lo que produce una historia altamente derivativa. En ninguno de los dos casos está creando arte interesante.

Si llevamos esto a un extremo podríamos concluir que el mejor prompt posible para la novela que tenemos en la cabeza es la propia novela. En tal caso, ChatGPT ya no tiene ningún valor (ni supone ningún riesgo para nadie).

Debo haber mencionado varias veces los videos de Vox. Una de las periodistas que más me gustan de Vox es Joss Fong (aunque ya no trabaja en Vox y tiene su propio canal, Howtown). Hace un tiempo, quizás un año, Fong planteó en un tuit algo que me pareció interesante. Decía que, tradicionalmente, la regla número uno del periodismo es “vos no sos la historia”. Es decir, que el periodista debe intentar ser objetivo y reportar las cosas con distancia, que no se note, a priori, que hay una persona escribiendo la nota. Pero con la popularización de ChatGPT y sus variantes, ahora la regla podría invertirse. Ahora habría un valor en reconocer que algo está escrito por un humano, que siente cosas y tiene opiniones.

Final

Mi única conclusión, por ahora, es la siguiente. Notas malas en los diarios y portales las hay a montones, desde mucho antes de que exista ChatGPT. Esas notas malas, sin firma, que exprimen los caracteres a más no poder sin dar ni una sola información real y que están escritos con el culo, con el único objetivo de conseguir clicks. Eso ya existía y seguirá existiendo. También existen imágenes de stock, genéricas, feas, que se usan para no tener que filmar uno mismo ciertas cosas. Las imágenes de stock son reconocibles, tienen su propia estética (fea) como la tiene una mala imagen generada por Midjourney. Para que cualquiera de estas dos variantes funcione de verdad y devuelta un producto de calidad, por ahora, aún tiene que haber una persona detrás tomando decisiones. Esas decisiones tienen una forma distinta a la que tenían antes, a lo mejor, pero existen. El día que una IA no necesite una persona para funcionar será el día en el que será una inteligencia real, y para ese entonces dará lo mismo todo.

Igual, todo este tema no me interesa para nada.

Nos vemos en dos semanas.

Si están satisfechos con nuestra tarea, piensen en colaborar con un poco de dinero mensual de manera de ir construyendo una base de seguidores pagos que nos permitan mantener y desarrollar este emprendimiento. Los valores pueden no significar mucho en sus economías mensuales pero para nosotros son un ladrillo más para construir el servicio que soñamos.

Vean si algunos de los valores de acá abajo les resultan accesibles, el aporte es mensual vía Mercado Pago (PayPal para el extranjero) y podés salir cuando quieras sin ninguna dificultad:

Y, como siempre, los que quieran colaborar desde el exterior, lo pueden hacer vía PayPal:

PayPal (dólares)

Sabelotodo

31 | Algunas consideraciones sobre la Inteligencia Artificial

Pomelos, promedios, prompts

Decisiones

Final

Discussion about this post