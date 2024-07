En este artículo analizaremos las debilidades y fortalezas de Chat GPT y otros productos similares de inteligencia artificial. El propósito de este análisis es brindar a los usuarios un conocimiento general de los escenarios donde estos productos tecnológicos importantes tienen una alta probabilidad de falla. De la misma manera, también analizaremos los escenarios en los que estas herramientas pueden resultar de mucha utilidad y agregar alto valor a nuestra vida. De esta forma, los usuarios podrán sacar el máximo provecho de estas tecnologías emergentes, de gran impacto para la sociedad.

Comencemos por analizar: ¿Qué es Chat GPT? Es un modelo de lenguaje grande (LLM), implementado en software, que puede responder a nuestras consultas mediante texto, imágenes o voz. Este modelo ha sido desarrollado por la empresa estadounidense Open AI. Actualmente, podemos usar, de forma gratuita, su versión más reciente llamada Chat GPT-4o que está disponible desde el 13 de mayo de 2024. La primera versión fue Chat GPT-3.5, lanzada el 30 de noviembre de 2022. Aparte de Chat GPT, en la actualidad también podemos usar, de forma gratuita y desde cualquier navegador, otras herramientas con funcionalidad similar:

Copilot de Microsoft, Gemini de Google, Claude de Anthropic, Perplexity de Perplexity AI.

Estas herramientas generan sus respuestas palabra por palabra, construyendo así textos (escritos o hablados) que suenan o parecen coherentes, pero que no siempre son ciertos. Es decir, en determinados momentos, los LLMs se parecen a aquella persona de nuestro entorno que parece que todo lo sabe, y lo que no sabe se lo inventa. Justamente, el problema es que los LLMs casi siempre nos dan una respuesta que suena convincente, lo cual hace difícil detectar mentiras o datos inexactos, sobre todo cuando no tenemos cierto conocimiento de lo que estamos requiriendo. Sería ideal que los LLMs puedan decir “no sé” cuando les planteamos requerimientos para los que su capacidad no les permite retornar una respuesta correcta.

Afortunadamente, hoy en día conocemos de algunos escenarios en los que los LLMs tienen una alta probabilidad de retornar respuestas incorrectas. Típicamente, son escenarios donde les planteamos requerimientos que involucran cierto razonamiento o análisis. Los LLMs generan sus respuestas a una velocidad constante y, lamentablemente, esto no siempre funciona en la realidad, donde la complejidad de los problemas es muy variada. En problemas sencillos, donde el requerimiento de análisis o razonamiento es bajo, la respuesta se la puede dar muy rápidamente. Por ejemplo, si preguntamos ¿cuál es la capital de Francia?, la respuesta es inmediata: París. Pero si preguntamos ¿cuántas letras hay en esta pregunta?, la respuesta requiere de cierto análisis. Primero debemos analizar y comprender la pregunta. Posteriormente, debemos identificar las palabras y separarlas de los signos de interrogación y espacios en blanco. Luego debemos contar cuántas letras hay en cada palabra, y finalmente debemos sumar los resultados parciales para obtener el resultado total:

cuántas: 7 letras, letras: 6 letras, hay: 3 letras, en: 2 letras, esta: 4 letras, pregunta: 8 letras.

Por lo tanto, tenemos en total 7 + 6 + 3 + 2 + 4 + 8 = 30 letras. Puede plantear esta pregunta a cualquier LLM y analizar la respuesta. Luego de que el LLM le responda, le puede preguntar si ¿está seguro de la respuesta? Es muy probable que se lleve una gran sorpresa al ver lo que le responde.

Otro escenario donde los LLMs pueden fallar es cuando les consultamos sobre hechos concretos. Afortunadamente, varios LLMs tienen actualmente la capacidad de hacer búsquedas en internet para respaldar sus respuestas. También les podemos pedir que, expresamente, nos indiquen las fuentes consultadas. De esta forma, podemos reducir el riesgo de respuestas falsas o imprecisas referentes a hechos o escenarios concretos.

Una vez que hemos visto las debilidades de los LLMs, es momento de pasar a analizar sus fortalezas. Los LLMs son la única tecnología que disponemos en la actualidad con alta capacidad de comprensión del lenguaje natural. El lenguaje natural es lo que usamos las personas para comunicarnos unos con otros de forma oral o escrita. Es decir, los LLMs tienen la capacidad de “entender” la estructura y el significado de los textos o discursos. Por lo tanto, los potenciales usos de los LLMs son muy grandes y diversos. Por ejemplo, podemos usar un LLM para que nos mejore la escritura, detecte errores ortográficos, o palabras mal escritas en un texto dado. También nos pueden ayudar a generar rápidamente resúmenes de textos o documentos muy largos. Una lectura que a una persona le puede tomar minutos u horas, a los LLMs les toma tan solo segundos. También podemos generar tablas a partir de textos o viceversa, y podemos extraer textos desde imágenes.

Los LLMs también se pueden desempeñar como nuestros asistentes personales o copilotos en muchas actividades profesionales o personales. Nos pueden, por ejemplo, ayudar o asistir en la planificación de nuestra agenda diaria, en la lectura y respuesta de correos electrónicos. También nos pueden generar rutinas de ejercicio, sugerir recetas de cocina, o ideas para nuestras próximas vacaciones. De la misma manera, pueden ser nuestros asesores para analizar diferentes opciones a la hora de resolver problemas, o nos pueden ayudar con ideas para emprender negocios o realizar ventas. En todos los casos de uso de los LLMs, una parte muy importante es ser muy claros y amplios en el planteamiento de nuestro requerimiento (o prompt). Antes de presionar la tecla de enter, lea lo que le pide al LLM, y responda si Usted puede dar la respuesta o acción que busca con lo que ha escrito. Si la respuesta es no, entonces describa mejor lo que necesita.

Los LLMs también tienen una importante capacidad de comprensión de algunos lenguajes de programación. Los lenguajes de programación es lo que usamos las personas para dar instrucciones a los computadores. De esta forma, cualquier persona puede desarrollar un código, de pequeña o mediana extensión, tan solo con especificar, en nuestro lenguaje, lo que debe realizar dicho código. Por ejemplo, si quiere hacer una página web donde va a promocionar sus servicios profesionales, puede pasar a un LLM una imagen de una página web que le resulte interesante, y pedirle que le genera una página web similar con sus propios datos.

El desarrollo de nuevos LLMs y la mejora de los LLMs existentes es bastante vertiginosa. Cada vez se agregan nuevas capacidades y funcionalidades. Cada vez los LLMs pueden procesar (enviar y recibir) textos más largos. Adicionalmente, a los LLMs no solo les podemos dar texto, sino también les podemos proporcionar archivos e imágenes. Inclusive, Open AI ha anunciado que, para finales del 2024, se pondrá a disposición del público general un modelo que será capaz de, en sus respuestas orales, modular el tono de voz para simular emociones. Adicionalmente, este modelo también podrá recibir como entrada video. Para que se haga una idea más clara de lo que pronto tendremos a nuestra disposición, le recomiendo ver la película Her. Por lo tanto, el mundo de los LLMs es fascinante y debemos aprender a sacarles el máximo de provecho. Para esto es importante conocer, entre otros aspectos, sus debilidades y fortalezas. Finalmente, ¡no se olvide de hacer un uso ético y responsable de las herramientas de inteligencia artificial!