-->

lunes, 27 de febrero de 2023

Análisis literario e inteligencia artificial 005 (3.0.0)



Ayer, 26/2/23, agregué una captura nueva en la sección 1 y cambié el principio del ensayo, que ahora quedó así:





1.

   Composición, tema: como la vaca faltó, un buen tema (?) es si una inteligencia artificial (IA) como GPT-3 puede hacer cierto tipo de análisis literario de un cuento nuevo (o sea, no analizado por ninguna de las lecturas usadas en su entrenamiento). Es la misma consigna que resuelven estudiantes humanos. El 22/02/2023 se lo pregunto a ChatGPT y me responde con un sí, pero:


   En cuanto al tipo de análisis esperado, intenté
   También intenté describirlo en la tercera pregunta del diálogo con Chat­GPT que tuve el 17 de febrero de 2023, entre las 21 y las 22 horas:


   También disponible en texto



   ¿Cómo podría entrenarte para que lograr que hagas cierto tipo de análisis literario que no está en tu pre-entrenamiento?


   Para entrenarme para hacer un tipo específico de análisis literario que no está en mi pre-entrenamiento, se requeriría crear un conjunto de datos específico y detallado que contenga ejemplos de textos literarios que ilustren las características y elementos del análisis deseado.

   Luego, el modelo de lenguaje podría ser entrenado utilizando técnicas de aprendizaje profundo, para aprender a identificar y analizar las características literarias específicas presentes en los textos. Esto se puede hacer a través de la creación de modelos de redes neuronales que permitan a la máquina aprender de forma autónoma, identificando patrones en los datos de entrenamiento y ajustando los parámetros del modelo para mejorar la precisión de los resultados.

   Una vez entrenado el modelo, se podría utilizar para realizar el análisis literario deseado. Es importante tener en cuenta que la calidad y precisión del análisis dependerá en gran medida de la calidad y cantidad de los datos de entrenamiento, por lo que es esencial tener un conjunto de datos suficientemente grande y representativo del tipo de análisis que se desea hacer.


   ¿Qué tan grande debería ser "un conjunto de datos suficientemente grande"?


   La cantidad de datos necesarios para entrenar un modelo de lenguaje con éxito depende de varios factores, como el tipo de análisis que se desea hacer, la complejidad del lenguaje involucrado, y la calidad de los datos. En general, cuanto más grande y diverso sea el conjunto de datos, mejor será la capacidad del modelo para generalizar y producir resultados precisos y útiles.

   En el campo del procesamiento del lenguaje natural, se han utilizado conjuntos de datos con tamaños que van desde unos pocos miles hasta millones de ejemplos. Por ejemplo, algunos modelos de lenguaje han sido entrenados en conjuntos de datos como el Corpus of Contemporary American English, que contiene más de 560 millones de palabras en inglés, o el Google Books Ngram Corpus, que contiene más de 1 billón de palabras en varios idiomas.

   En resumen, para entrenar un modelo de lenguaje para realizar un análisis literario específico, se necesitaría un conjunto de datos lo suficientemente grande y representativo del tipo de texto que se desea analizar, para permitir que el modelo aprenda patrones y características relevantes del lenguaje literario. El tamaño específico del conjunto de datos dependerá de la tarea y los recursos disponibles.


   Y con ese entrenamiento, ¿podrías hacer un análisis que genere un conocimiento nuevo sobre un cuento mediante la interconexión de sus datos y la elaboración de hipótesis de lectura a partir de esas conexiones?


   Un modelo de lenguaje entrenado en el análisis literario puede ayudar a identificar patrones, temas y elementos en un texto y a elaborar hipótesis de lectura a partir de esas conexiones. Sin embargo, el conocimiento nuevo generado dependerá de la creatividad y el juicio crítico del usuario que esté utilizando el modelo.

   El modelo de lenguaje puede ayudar a facilitar el análisis, identificando patrones y elementos que pueden haber pasado desapercibidos para un lector humano. Pero la interpretación de esos resultados, la elaboración de hipótesis de lectura y la generación de nuevo conocimiento sigue siendo responsabilidad del usuario.

   En resumen, un modelo de lenguaje entrenado en el análisis literario puede ayudar a generar nuevas hipótesis de lectura a partir de la interconexión de los datos, pero sigue siendo necesaria la interpretación y el juicio crítico del usuario para generar conocimiento nuevo.


   La interpretación de esos resultados, la elaboración de hipótesis de lectura y la generación de nuevo conocimiento, ¿seguirían siendo responsabilidad del usuario si te entreno con muchos ejemplos de análisis que hacen esa interpretación, esa elaboración y esa generación?


   Si el modelo de lenguaje es entrenado en muchos ejemplos de análisis literarios que contienen interpretaciones, hipótesis de lectura y generación de nuevo conocimiento, es posible que el modelo pueda generar este tipo de resultados por sí mismo. Sin embargo, es importante tener en cuenta que la calidad y precisión de los resultados dependerán en gran medida de la calidad y la precisión de los ejemplos de entrenamiento.

   Aun así, incluso si el modelo de lenguaje es capaz de generar este tipo de resultados, seguirá siendo responsabilidad del usuario evaluar y validar la precisión de los resultados. El análisis literario y la generación de conocimiento siguen siendo un proceso crítico y creativo que requiere un juicio humano y una comprensión profunda del contexto y el significado del texto en cuestión.

   En resumen, aunque el entrenamiento con muchos ejemplos de análisis literarios puede ayudar a un modelo de lenguaje a generar interpretaciones, hipótesis de lectura y conocimiento nuevo, todavía es necesario el juicio crítico y la validación humana para garantizar la calidad y precisión de los resultados.


   ¿O sea que lograr resultados como la generación de conocimiento, que surge de un proceso crítico y creativo, sería un salto importante de un modelo de lenguaje?


   Sí, generar conocimiento a través de la interpretación crítica y creativa de los datos es un proceso complejo que requiere una comprensión profunda del contexto, el significado y las implicaciones de los datos. Los modelos de lenguaje pueden ser entrenados para identificar patrones y relaciones en los datos, pero la interpretación y la generación de conocimiento son tareas que requieren una comprensión contextual y un juicio humano más allá de lo que actualmente pueden hacer los modelos de lenguaje.

   Los modelos de lenguaje están diseñados para procesar grandes cantidades de datos y encontrar patrones y relaciones en ellos. Pero, la interpretación y la generación de conocimiento a partir de esos datos todavía depende de la habilidad y el juicio crítico del usuario humano. A medida que los modelos de lenguaje se vuelven más sofisticados y precisos, pueden ayudar a los humanos en este proceso y permitir un análisis más rápido y eficiente de grandes conjuntos de datos, pero todavía hay un límite en cuanto a su capacidad para generar conocimiento por sí mismos.


   ¿O sea que un modelo de lenguaje aún está limitado a ser una herramienta e imposibilitado de ser un usuario de una herramienta?


   Sí, un modelo de lenguaje sigue siendo una herramienta diseñada para procesar datos y ofrecer resultados basados en su programación y su entrenamiento. Aunque puede procesar grandes cantidades de datos de manera rápida y eficiente, sigue siendo limitado por su programación y su entrenamiento, y no tiene la capacidad de utilizar herramientas como lo haría un usuario humano.
   Aunque los modelos de lenguaje pueden ayudar en muchas tareas, incluyendo la generación de texto, la clasificación y el análisis de datos, y la toma de decisiones basadas en datos, todavía dependen de la programación y del entrenamiento para hacerlo. Aun así, el desarrollo de modelos de lenguaje cada vez más sofisticados y precisos está permitiendo una mayor automatización de tareas que antes requerían la intervención humana, lo que puede aumentar la eficiencia y la precisión en muchas áreas.


2.

   La última oración parece estar diciéndome:
   –Sí, también vos vas a quedar sin trabajo, si es por eso que preguntás si puedo hacer los análisis de relato que decís que hacés; en IA, “Hoy no se puede” casi siempre significa “Esperá un poco”.
   Como no cobro por estos ensayos, si hay implicación personal me debe venir de otro lado, como puede ser el de un golpe al narcisismo humano o propio. Pero el propio también se estimula con la idea de encontrar/identificar una máquina de pensar, de hacer saberes analizando (comparando) datos.
   Idealmente, un análisis debe tener en cuenta todos los datos del universo analizado; pero no tiene que dar cuenta de todos, sino sólo de aquellos datos involucrados en las conexiones que una lectura hace para inferir cosas que no están dichas. La idea es que están implicadas en esa red, que no es lo mismo que sugeridas o insinuadas en tal o cual dato.
   La tarea no es interpretar (o sea, cargar de un sentido especial) un dato suelto o varios complotados, para decir que representan/simbolizan/reflejan tal o cual cosa. La tarea es encontrar, en o con esas conexiones, patrones en ese universo de datos, que puede ser un cuento, una novela, una poesía, un corpus de obras, una película, varias, un combo de película más contexto histórico y cultural, etc.
   ¿Cómo se conectan dos o más datos? En razón de compartir una característica (morfológica, posicional, funcional, semántica...). Esos archipiélagos de datos conectados pueden, a su vez, conectarse con otros archipiélagos. Lo que afirmes de estas conexiones de segundo grado (o mayores) será la lectura que hagas y el saber que postules sobre el universo que hayas analizado.
   

3.

   Todavía no probé con entrenar a GPT-3 con los ensayos que mencioné y otros, o con el contenido entero de Zambullidas, así que no pude chequear la primera oración de la cuarta respuesta:
   «Si el modelo de lenguaje es entrenado en muchos ejemplos de análisis literarios que contienen interpretaciones, hipótesis de lectura y generación de nuevo conocimiento, es posible que el modelo pueda generar este tipo de resultados por sí mismo.»
   De lo dubitativo a lo concesivo: el «es posible» no alcanzó y llega al párrafo siguiente el refuerzo y paraguas del «aun así, incluso si»:
   «Aun así, incluso si el modelo de lenguaje es capaz de generar este tipo de resultados, seguirá siendo responsabilidad del usuario evaluar y validar la precisión de los resultados. El análisis literario y la generación de conocimiento siguen siendo un proceso crítico y creativo que requiere un juicio humano y una comprensión profunda del contexto y el significado del texto en cuestión.»
   Es decir: por mejor que simule un análisis de esos (que «siguen siendo un proceso crítico y creativo»), yo no dejo de ser una herramienta y vos su (mi) usuario. Te puedo relevar de muchas tareas de escritura, pero no de aquellas «que requieren una comprensión contextual y un juicio humano más allá de lo que actualmente pueden hacer los modelos de lenguaje», porque «todavía hay un límite en cuanto a su capacidad para generar conocimiento por sí mismos».
   Es un límite y es el siguiente nivel a desbloquear, el próximo hito en términos de efectos de lenguaje. Ni bien la IA empezó a parecer humana, demasiado humana (o sea, a vencer en todos los test de Turing), empezamos a querer sondearla, a ver qué tan humana puede parecer, si esto o aquello también lo puede fingir tan bien que no detectemos la falsificación.
   Otra manera de verlo es que tal vez la vía humana no es la única para llegar a esos resultados.


No hay comentarios: