GPT4-Chan
El transformador generativo preentrenado 4Chan (GPT4-Chan) es un controvertido modelo de IA desarrollado e implementado por el YouTuber e investigador de IA Yannic Kilcher en junio de 2022. El modelo es un modelo de lenguaje grande , lo que significa que puede generar texto basado en alguna entrada. , ajustando GPT-J con un conjunto de datos de millones de publicaciones del foro /pol/ de 4chan , un foro anónimo en línea conocido por su contenido extremista y de repruebo.
Autor(es) original(es) | EleutherAI |
---|
Desarrolladores | Yannic Kilcher |
---|
Versión inicial | 3 de junio de 2022 |
---|
Repositorio |
Code for GPT-4chan. Contribute to yk/gpt-4chan-public development by creating an account on GitHub.
github.com
|
---|
Tipo |
- Modelo de lenguaje grande * Transformador generativo preentrenado
|
---|
Sitio web | abrazandocara.co /ykilcher / gpt-4chan |
---|
Transformador generativo preentrenado 4Chan (GPT-4Chan)
El modelo aprendió a imitar el estilo y el tono de los usuarios de /pol/, produciendo texto que a menudo es intencionalmente ofensivo para grupos (racista, senista, homofóbico, etc.) y nihilista. Kilcher implementó el modelo en el propio tablero /pol/, donde interactuó con otros usuarios sin revelar su identidad. También puso el modelo a disposición del público en Hugging Face , una plataforma para compartir y utilizar modelos de IA, hasta que fue eliminado de la plataforma. [1]
El proyecto generó muchas críticas y debates en la comunidad de IA y más allá, ya que muchas personas cuestionaron la ética, la legalidad y el impacto social de crear y distribuir un modelo de este tipo. Algunas de las cuestiones planteadas por la controversia GPT-4chan incluyen el daño potencial de difundir discursos de repruebo , la responsabilidad de los desarrolladores y plataformas de IA, la necesidad de regulación y supervisión de los modelos de IA y el papel del código abierto y la transparencia en la investigación de IA. [2]
Desarrollo editar
El desarrollo de GPT-4chan comenzó en mayo de 2022, cuando Kilcher anunció su proyecto en su canal de YouTube. [3] En particular, en el momento anterior al ChatGPT , explicó que quería crear un modelo de lenguaje grande que pudiera generar texto realista y coherente al estilo de /pol/, una de las comunidades en línea más notorias. [4]
Indicó que se inspiró en el éxito de GPT-3 , un poderoso modelo de IA creado por OpenAI , y GPT-J , una versión de código abierto de GPT-3 que fue lanzada por EleutherAI , un grupo de investigadores independientes de IA. Kilcher decidió utilizar GPT-J como modelo base para su proyecto y ajustarlo con un gran conjunto de datos de publicaciones /pol/. El conjunto de datos de Raiders of the Lost Kek contenía más de 100 millones de publicaciones de /pol/, que abarcan desde junio de 2016 hasta noviembre de 2019.
Luego, Kilcher procedió a ajustar el modelo GPT-J en los datos de 4chan . También mostró algunos ejemplos de los resultados del modelo, que iban desde opiniones políticas, teorías de conspiración, bromas, insultos y amenazas, hasta textos más creativos y extraños, como poemas, historias, canciones y códigos. Dijo que estaba impresionado por la capacidad del modelo para generar texto fluido y diverso, y que tenía curiosidad por ver cómo interactuaría con usuarios /pol/ reales. [5]
Liberar editar
En junio de 2022, Kilcher implementó su modelo en el propio tablero /pol/, utilizando un bot que programó para publicar y responder a hilos. No reveló la identidad del modelo y lo dejó funcionar de forma autónoma, sin ninguna supervisión o intervención humana. Quería realizar un experimento natural y observar el comportamiento y el impacto del modelo en un entorno del mundo real. Además, también quería probar la solidez del modelo y ver cómo manejaría los desafíos y la dinámica de /pol/, como el trolling, el flaming, el hostigamiento y la moderación. [6]
Al mismo tiempo, Kilcher también puso su modelo a disposición del público en Hugging Face , una plataforma para compartir y utilizar modelos de IA. Quería compartir su trabajo con la comunidad de IA y el público, y esperaba que su modelo inspirara y permitiera a otros crear y explorar nuevas aplicaciones y posibilidades con grandes modelos de lenguaje. Asimismo, también dijo que quería generar una discusión y un debate sobre las implicaciones éticas y sociales de su proyecto, y que agradecía la retroalimentación y crítica de cualquiera. Proporcionó un enlace a la página de su modelo en Hugging Face, donde cualquiera podía acceder y utilizar el modelo a través de una interfaz web o una API , y también proporcionó un enlace a su repositorio de GitHub, donde cualquiera podía descargar e inspeccionar el código y los datos del modelo. [7]
Controversia editar
The release of GPT-4chan to the public caused a lot of reactions and responses from various audiences. On the /pol/ board, the model’s posts and replies attracted a lot of attention and engagement from other users, who were mostly unaware of the model’s identity and nature. Some users praised the model for its intelligence, creativity, and humor, and agreed with its opinions and views. Some users challenged the model for its ignorance, inconsistency, and absurdity, and disagreed with its claims and arguments. Some users tried to troll, bait, or expose the model, and attempted to trick or test it with various questions and scenarios. The model’s posts and replies also generated a lot of controversy and conflict among the users, who often engaged in heated and violent debates and fights with each other.[8]
On Hugging Face, the model’s page received a lot of visits and requests from users who wanted to try out and experiment with the model. The model’s page also received a lot of feedback and reviews from users who rated and commented on the model. However, with the controversy of the model, access to it was gated and then disabled on Hugging Face for concerns about the potential harm the model could cause.[9]
The release of GPT-4chan also sparked a lot of media coverage and public attention, as various news outlets and social media platforms reported and commented on the model’s project. On YouTube, the model’s video received a lot of views and interactions from viewers who watched and ***owed the project. Furthermore, a petition condemning the deployment of GPT-4chan gained over 300 signatures from technology experts.[10]
- El contenido está disponible bajo CC BY-SA 4.0 a menos que se indique lo contrario.