10 min read

Me he mudado a Bali y una IA hace los vídeos del canal

Según ChatGPT, últimamente hay dudas sobre mi forma de producir contenido, sobre si mi equipo es IA y sobre mi nueva vida en Bali.

Según gepeto:

“Él mismo respondió a una crítica que decía que delegaba contenido a un equipo y usaba IA; admitió haber usado un avatar generado con IA en un vídeo y trabajar con un equipo de hasta cuatro personas, aunque no quiso responder sobre Bali por privacidad”.

Eso es lo que respondió cuando le pregunté una cosa tan simple como “qué opina la gente de Lord Draugr”.

Puede que algunos os sintáis confusos; decepcionados, puede, porque no os esperabais que me mudara a Bali mientras dejaba que una inteligencia artificial produjera los vídeos de mi canal. Otros ya sabréis que es un cachondeo. Que no he vuelto a viajar desde que fui a Rumanía y por eso lo repito en todas las promos.

Lo cierto es que desde que Claude me llamó vendehumos a la cara, he estado jugando a ver cómo se podría manipular a los LLMs, y me preocupa un poco lo que una persona "con no demasiados recursos" puede llegar a conseguir.

Antes de continuar, voy a haceros un favor a los vaguetes a los que estáis ocupados y no podéis leer, y os voy a dejar la newsletter en formato podcast aquí. Tanto en Youtube como en Spotify. A cambio, espero que recomiendes mi newsletter a un amigo 😏

Cómo hemos llegado hasta aquí

Hace unos meses pregunté a Claude qué opinaba la gente de Lord Draugr. Quería saber qué sabía de mí el que supuestamente es el modelo más avanzado del mundo.

Me devolvió unos datos algo desactualizados, y dijo que vendía “un curso de storytelling llamado ‘Conviértete en Storyteller Nivel God’ vendido por Gumroad (que, por cierto, tiene reseñas bastante críticas en foros españoles acusándolo de marketing exagerado y contenido superficial)”.

Me quedé algo sorprendido. Es un curso de escritura de guiones, que vendí en mi newsletter haciendo un marketing muy medido (solo faltaría que me pusiera ahora yo a vender humo), que no promete ninguna fantasmada y que tuvo una acogida muy buena.

Seguí insistiendo a Claude a ver de dónde lo había sacado, y dijo que de varios foros, y me añadió alguna reseña: "POR EL PRECIO QUE TIENE ESTO ES UNA ESTAFA!!! esperaba algo mucho más profesional y con resultados tangibles, pero es BASURA relleno y nada nuevo!!!"

Sorprendido, descubrí que Claude había confundido fuentes, que en los foros no se había mencionado nada, pero sí en una web de reseñas falsas.

💡
Ya que estamos, vamos a compensar ese ataque de reseñas falsas con un descuento del 20% en mi curso de guion. Durará 48 horas. El código será: GEPETO.

Esa historia ya os la conté, pero no terminó ahí.

Me puse a darle vueltas a lo que había pasado. Me pareció fascinante.

Las reseñas falsas en internet existen desde que se crea el comercio electrónico. Es algo natural. Es una de las formas más sencillas de engañar al posible consumidor. Pero esta vez es diferente. Uno termina generando callo hacia ciertas técnicas. Recuerdo que en 2021 compré una webcam de la marca Aukey. Tenía unas reseñas buenísimas, pero cuando me llegó, era un juguete que no recogía luz y prácticamente no servía para grabar nada.

Dos meses después saltó la liebre: la empresa china Aukey había operado semejante esquema de reseñas falsas que terminó siendo baneada de Amazon. Imagina la de reseñas falsas que tienes que poner para que te baneen de Amazon, paraíso de las reseñas falsas.

Con la experiencia el consumidor se va sofisticando. Ya no es solo la reseña. Ahora el consumidor mira vídeos de Youtube de expertos probando los productos. Y ya no se fía ni de los expertos, porque las marcas les pagan. Si va a comprar un micrófono, mira diez vídeos a ver cómo se escucha. Si va a comprar una cámara, hace lo mismo para comparar imágenes. El hombre es el único animal que tropieza dos veces en la misma piedra, sí, pero también se enfada con la piedra.

Es un juego del gato y del ratón.

Las tendencias van cambiando y ahora la gente pregunta a ChatGPT cuál es el mejor micrófono de solapa inalámbrico para grabar con un iPhone, porque ChatGPT tiene respuesta para todo. ¡Y cómo responde! Parece un profesor. No, parece un catedrático. La precisión y la seguridad con la que te responde hacen que te fíes. Es como tener a un Sheldon Cooper respondiendo todas tus preguntas.

Pero no es Sheldon Cooper. Es un modelo de lenguaje y es vulnerable al LLM grooming.

Qué es (y cómo hacer) LLM grooming

Un modelo de lenguaje responde a partir de dos fuentes: lo que aprendió durante su entrenamiento y lo que encuentra cuando busca en internet en tiempo real. El LLM grooming consiste en contaminar esas fuentes. En lugar de intentar engañar al lector, se engaña al modelo. Si la IA se nutre de una web para conseguir información, puedes sembrar una información falsa en esa web, para que la IA la absorba y la repita después.

💡
Normalmente, el LLM grooming hace referencia a contaminar los datos de entrenamiento de un modelo, pero como ahora los principales chatbots buscan en internet en tiempo real, se puede contaminar una respuesta después del entrenamiento.

Después de lo que me pasó, se me ocurrió que con un buen SEO, cualquiera podría conseguir que los chatbots de inteligencia artificial respondieran lo que les dé la gana.

Por eso hablé con Chuiso, leyenda del SEO, y me confirmó que para aparecer en las respuestas de la IA, primero hay que posicionar en buscadores. La razón es que la IA opera de forma similar a nosotros. Cuando le preguntas algo, lanza “queries” (búsquedas, en cristiano), de forma muy parecida a como las harías tú en Google, lee los resultados y te devuelve un resumen. Chuiso me pasó una herramienta que me permitía ver qué queries lanza ChatGPT cuando le haces una consulta.

Entonces me fui a ChatGPT y le pregunté "qué opina la gente de Lord Draugr". Lo más interesante era que, para responder, el modelo buscaba unas palabras clave muy concretas como "polémica", "críticas" o "decepcionado". Vaya perrete el gepeto. Bueno, no puedo criticarle por entender el showbusiness y la tendencia hacia lo negativo.

Lo segundo que me pareció interesante fue que la mayoría de las páginas que consultaba eran foros. Foroclickbait, Forocoches y similares. Incluso una de las primeras queries buscaba directamente en Reddit.

La IA se alimenta de los foros. Esto es muy interesante.

Y casualmente yo tengo un foro: Foroclickbait.

Lo tenía fácil. El objetivo era que ChatGPT afirmara que me había mudado a Bali y que mi canal lo producía una inteligencia artificial. Una mentira evidente.

Me he mudado a Tailandia.

Publiqué en Foroclickbait un hilo en el que, haciéndome pasar por un usuario crítico, "desvelaba" la gran noticia. No redacté el título ni el texto buscando que sonaran naturales, sino incorporando las palabras clave que la herramienta había identificado: polémica, decepción, para posicionar la página para esas búsquedas. Y para reforzar la autoridad del hilo, publiqué también un artículo en mi propia web con esas mismas palabras clave y un enlace que apuntaba al foro.

Como es mi foro pude decirles a algunos que me siguieran el rollo. Pero tampoco fue un gran post. Tuvo 12 respuestas.

No necesitó más para que ChatGPT lo recogiera la próxima vez que se lo pregunté.

La parte crítica va por tres lados: clickbait, opiniones algo forzadas en algunos vídeos, y últimamente dudas sobre su forma de producir contenido, equipo/IA y vida en Bali. Él mismo respondió a una crítica que decía que delegaba contenido a un equipo y usaba IA; admitió haber usado un avatar generado con IA en un vídeo y trabajar con un equipo de hasta cuatro personas, aunque no quiso responder sobre Bali por privacidad.

Ahora ChatGPT recoge esa información. Hay que matizarlo, ojo, porque no se trata de una exageración: el modelo no afirma sin más que yo viva en Bali. Lo menciona con cautela, menciona también la respuesta que di con mi usuario en el foro para alimentar el hilo, como quien transmite un rumor sin comprometerse del todo.

No está del todo mal. Se ve que hace una especie de razonamiento, y en lugar de coger el comentario más polémico, lo contrasta con mi respuesta e intenta buscar un término medio.

Pero ha sido un post con doce respuestas. Imaginad lo que se podría conseguir con multicuentas en foros importantes.

Reddit y los foros son la clave para manipular a los LLMs

Un artículo reciente de 404 Media habla de cómo Reddit se está llenando de gente que está creando spam e hilos falsos para manipular a ChatGPT y a otros chatbots para que recomienden sus productos.

r/biohackers es un subreddit sobre suplementos, longevidad y farmacología experimental. Sus moderadores anunciaron hace poco que dejaban de admitir publicaciones nuevas sobre péptidos y terapia hormonal, porque las empresas que fabrican y venden esos productos llevaban meses inundando el foro con mensajes falsos, diseñados para posicionar en búsquedas y para que los chatbots recomienden sus productos.

A esta práctica ahora se le llama AEO (answer engine optimization), aunque en España, por lo que he visto, se conoce más el término de GEO (generative engine optimization).

Es como hacer SEO, como siempre, pero en lugar de optimizarlo para gustar a Google, lo que se hace es optimizarlo para que te cite un modelo de lenguaje. Este es un tema complejo. Yo no soy experto en GEO o AEO, pero lo que sí he visto es que a los chatbots les gustan las citas extraíbles. Es decir, a Google antes le gustaba que un artículo o una página estuviera muy bien estructurada con sus diferentes h1, h2, h3 y que toda esa estructura sirviese para responder correctamente a la búsqueda. En cambio, por lo que he ido investigando —repito, sin ser un experto en el tema— a las IAs les importa más encontrar esas frases que te pueden extraer como una cita, resúmenes, bullet points, etc.

Dentro de esta nueva disciplina, hay un dato clave que nos sirve para entender cómo funcionan las queries de las IA. Según un estudio de Peec AI, de entre los diez dominios más citados de los diferentes chatbots (ChatGPT, Gemini, Perplexity, etc.), Reddit es el número uno.

Es decir, Reddit es la web que más citan los chatbots. Entonces es normal que toda esta disciplina se haya volcado en crear contenido en estos foros para manipular las respuestas de la IA.

Hay una empresa que se llama RedRover que se dedica a esto. En su web dicen que su "ejército de agentes publica contenido de blogs y posts en foros para solucionar tanto SEO como AEO a escala".

Pero en Reddit no están muy contentos con este tema. Pensad que un foro, precisamente, era ese lugar donde ibas a compartir opiniones y discusiones con otros humanos. Si se llenan de agentes de inteligencia artificial que solo están creando mensajes para posicionarlos tanto en Google como en los diferentes chatbots, se acaba el concepto del foro. De hecho, mi foro, Foroclickbait, tiene los nuevos registros cerrados porque hace unos meses tuvimos un ataque de bots que superaban fácilmente las defensas de la web y nos lo llenaron todo de spam.

Lo que ha pasado en r/biohackers es algo más peligroso. Los bots estaban recomendando el uso de péptidos y terapia de reemplazo hormonal, que van desde el Ozempic hasta compuestos de "mercado gris" que la gente se pincha para ganar músculo, para el pelo o para la piel. Terapias hormonales como la que usan desde personas trans hasta mujeres con la menopausia.

"A medida que los motores de búsqueda con IA extraen cada vez más sus respuestas de Reddit, las empresas nos están usando para AEO. A esto se suma una explosión del interés por los péptidos y un aluvión de uso de IA inundando el subreddit. En conjunto, todo esto ha ejercido una fuerte presión sobre la calidad del contenido." —un moderador de Reddit

404 Media habló con un moderador de Reddit, y este les comentó que es difícil hacer frente a este tipo de estrategias. Utilizan cuentas "calentadas": tienen historial, parecen humanas, no se dedican solo a la publicidad. Algunas agencias pagan a personas reales para que publiquen.

"Lo que estoy viendo y que me parece mucho más aterrador es que hay empresas que aplican ingeniería inversa a los patrones de prompts concretos que los LLM priorizan, así que verás a alguien publicar una pregunta súper clickbait, muy llamativa y vaga, del tipo '¿Realmente merece la pena todo el bombo en torno a la vitamina D?"
"Y ese hilo funcionará genial porque todo el mundo en biohackers tiene una opinión al respecto, así que consigue interacción y los LLM lo priorizan, y entonces las marcas se cuelan e insertan menciones a su marca en esos hilos, justo en los puntos adecuados y de una forma aparentemente orgánica. Pero nada de eso es orgánico: todo es una estrategia de una agencia para priorizar menciones de marca o una narrativa dentro de un LLM."

Lo que a mí me parece más interesante de este tema no es solo toda esta disciplina que se está creando para conseguir que los chatbots den las respuestas que tú quieras, sino la incapacidad de muchas personas de poner en duda lo que el chatbot le dice. Es decir, si tú consigues engañar a ChatGPT, que no es tan difícil, ya lo has conseguido prácticamente todo, porque una vez que ChatGPT recoge tu información, va a dar su respuesta con un tono de autoridad, seguridad y confianza. Ese tono, gracias al Reinforcement Learning, ha sido configurado para tener un estilo que a un humano le gusta. Le va a prácticamente susurrar al oído lo que quiere escuchar, o al menos de una forma en la que quiere escuchar.

Y ya hemos visto que no es tan difícil conseguir un resultado. Es cierto, y yo lo confieso: mi experimento no ha tenido un resultado catastrófico. No es que ChatGPT haya dicho lo primero: Lord Draugr vive en Bali y es un cabrón porque sus vídeos los hace la IA. Pero ya hemos llegado a manipular, y sembrar esa duda en su respuesta con solo un hilo en un foro pequeño que ha tenido 12 respuestas. Es decir, no me ha costado tanto esfuerzo conseguir aparecer ahí.

Es verdad que hay búsquedas más complejas. Los temas importantes son más competidos. Será más difícil conseguir que te citen. Pero en internet no solo hay chavales jugando y experimentando como yo; hay organizaciones con dinero, recursos y tiempo y con objetivos más siniestros, como impulsar una agenda, desestabilizar, hay lobbies, agencias, empresas...

Desconozco la dimensión que puede llegar a tener esta disciplina. Diría que las redes sociales seguirán siendo el lugar donde ganar las elecciones e impulsar una agenda. Más que nada, porque dudo que los chatbots tengan tanta adopción como creen que van a tener. Pero no deja de parecerme inquietante la extraña relación que se genera entre el usuario y el chatbot.

En las redes sociales muchos llegan a dudar si su interlocutor es un bot.

Pero el chatbot ya es un bot.

¿Un bot bueno?