Antonio del Río Portilla: ChatGPT

Mostrando entradas con la etiqueta ChatGPT. Mostrar todas las entradas

miércoles, 26 de julio de 2023

ChatGPT y los bienes digitales públicos

La Internet ha modificado nuestra forma de vivir en los últimos 30 años. En particular, Wikipedia, la enciclopedia libre, que ahora es una de las fuentes primarias de información, ha permitido que quienes tenemos acceso a la Internet, al mismo tiempo, tengamos a la mano información de calidad sobre infinidad de tópicos. Es interesante que tanto Wikipedia como otras fuentes de información libre en la Internet hayan sido la información que entrenó a los principales grandes modelos de lenguaje (LLM) que hoy son los ejemplos de inteligencia artificial (IA) con los que interaccionamos. Tanto ChatGPT como Bard son ejemplos de estas aplicaciones con las que cada vez interaccionamos más frecuentemente.

Hace unos días llamó mi atención un artículo en los axiv.org, un depósito de artículos científicos de acceso libre (que también se utilizó para entrenar a estos modelos de inteligencia artificial de texto a texto) que abordó la cuestión de sí los LLM amenazan a estas fuentes de información libre que pueden ser considerados como bienes públicos de información.

Para comprender a profundidad la pregunta, déjenme abundar el punto. Recordemos que en los inicios de Google, el buscador más usado en la Internet, cuando escribíamos unas palabras o hacíamos una pregunta nos ofrecía una serie de ligas donde posiblemente encontrábamos la información que buscábamos, es decir, teníamos que ir a consultar la información y decidir si era útil y confiable. Hoy en día al hacer la misma pregunta a algún buscador recibimos un breve texto con la posible respuesta y algunas ligas adicionales. Es decir, ya tienen instrumentada algunos algoritmos de IA que seleccionan la respuesta, facilitándonos el trabajo a costo de un posible sesgo. De manera similar, cuando hacemos la misma pregunta a un modelo LLM como ChatGPT o Bard ahora recibimos como respuesta un texto estructurado como si estuviéramos en una conversación y, por supuesto, que el texto tiene el sesgo de la información con la que ha sido entrenada la aplicación. Así el texto que nos entrega la aplicación de IA es el resultado de un filtraje, de alguna forma, de la información. Aquí debo enfatizar que en cambio las fuentes tradicionales (Wikipedia, por ejemplo) tienen reglas que pretenden evitar los filtros o sesgos mediante moderación de la comunidad en la información que proporcionan. Así, que al utilizar las aplicaciones de IA, estamos recibiendo información con sesgo que no ha sido moderada o valorada por alguna comunidad humana. Cuando escribo valoración me refiero en específico a otro tipo de depósitos de información, por ejemplo Stack Overflow (SO) que es uno de los principales sitios en la web donde se plantean preguntas y se interacciona con otras personas que dan respuestas en tópicos de programación computacional. Este sitio fue creado en 2008 por Jeff Atwood y Joel Spolsky. La comunidad que se ha conformado en SO es muy activa y ahí podemos encontrar preguntas y sus respuestas a una amplia gama de problemas computacionales desde muy básicos hasta complejos en el diseño e implementación de algoritmos. En este sitio, las diferentes respuestas son valoradas por la comunidad indicando el nivel de utilidad que se encuentra en la respuesta. De esta manera, la propia comunidad retroalimenta y modera las respuestas.

Imagen generada con inteligencia artificial con la frase "impressionist paint with an elephant and a wonderful unicorn" en https://labs.openai.com/

Es precisamente, este sitio de interacción entre personas que programan donde el artículo que les mencioné enfoca su estudio y con ello pretende responder a la sencilla pregunta: ¿los modelos de LLM pueden sustituir o rivalizar con los depósitos de información libres?, es decir ¿ChatGPT o Bard pueden sustituir a Wikipedia o a Stack Overflow?

Antes de comentar los hallazgos del artículo, quisiera compartirles lo que me respondieron estas dos plataformas a la pregunta: ¿ChatGPT (Bard) puede sustituir a Stack Overflow? Primero, quiero decir que ambas aplicaciones respondieron correctamente al preguntarles si sabían que era SO, segundo, con base en mi experiencia, las habilidades de ayuda para las personas que codifican en diferentes lenguajes de programación que tiene ChatGPT son muy buenas, en cambio, Bard todavía es elemental en este aspecto. Sus respuestas fueron: ChatGPT, “No, ChatGPT no puede sustituir completamente a Stack Overflow. Aunque ambos son recursos útiles para obtener información y respuestas, tienen propósitos y enfoques diferentes... Además, el sistema de votación y revisión de respuestas en Stack Overflow asegura que las respuestas más útiles y confiables sean destacadas.” Bard respondió: “No creo que Bard pueda reemplazar a Stack Overflow. Stack Overflow es una comunidad en línea de programadores que ayudan a otros programadores a resolver problemas... Bard no tiene la misma experiencia o conocimiento que los miembros de Stack Overflow. Además, Bard no es capaz de participar en la misma forma de diálogo y colaboración que los miembros de Stack Overflow.” Ambos modelos de lenguaje dan respuestas que apuntan hacia un mismo sentido, la interacción entre personas expertas es una de las características esenciales de SO; aunque la información con la que han sido entrenados les permite brindar información útil.

Al regresar a comentar los reveladores resultados del artículo, podemos destacar que al estudiar los cambios en la actividad de SO después de la aparición de ChatGPT se observa una disminución del 16 % en el número de preguntas y esta disminución es más grande para los lenguajes de programación más usados. Un aspecto interesante a resaltar del estudio es que observa que la distribución de las calificaciones de las respuestas es muy similar antes y después de la aparición de ChatGPT. Esta situación indica que SO sigue siendo un muy buen lugar para postear las preguntas y respuestas de calidad y que las preguntas sencillas o repetitivas son capturadas por ChatGPT. El artículo enfatiza que los valiosos bienes públicos digitales pueden ser subutilizados como resultado de la proliferación de la IA, disminuyendo su influencia. Desde mi perspectiva, lanza importantes retos para las comunidades: cómo podemos incentivar la creación de dichos bienes moderados y valorados por las propias comunidades en aras de una web abierta sostenible y un ecosistema de IA que se base en sus datos, cómo mantener a las personas intercambiando información y conocimientos en línea evitando sesgos.

Les invito a leer el artículo y a reflexionar sobre los cambios que estamos observando con el uso de la IA.

Este artículo fue publicado el día 26 de Julio en el periódico La Unión de Morelos

martes, 28 de marzo de 2023

La vida cotidiana y la IA

La inteligencia artificial está cambiando nuestras vidas poco a poco. Estos cambios en nuestras diarias actividades son paulatinamente o repentinamente y necesitamos acostumbrarnos a ellos. No solo acostumbrarnos, sino adaptarnos a una vida con actividades donde nuestras interacciones ya no son con personas sino con algoritmos de Lenguaje Natural.

Hace apenas unos 20 años muchas personas se resistían a usar los teléfonos con acceso a la Internet, los comúnmente llamados teléfonos inteligentes, hoy en día muchas personas usan a diario este tipo de artefactos. Muchos servicios al cliente de muy diversas compañías ya usan aplicaciones de lenguaje natural como ChatGPT para atender a sus clientes y resolver sus necesidades.

De hecho, la brecha entre quienes sepan usar este tipo de aplicaciones o servicios como ChatGPT y quienes no, promoverá mayores diferencias entre las
personas.

Desde mi punto de vista es muy importante que empecemos a usarlas, familiarizarnos con ellas y acceder a sus ventajas.

En un futuro habrá más aplicaciones como ChatGPT disponibles para todo mundo, no solo aquellas incorporadas ya en sistemas de atención a clientas, sino disponibles para obtener respuestas rápidas y precisas a las preguntas que se les hagan. Esto puede ser útil para aquellas personas que necesitan información o ayuda de forma inmediata. De esta manera, se ahorrará tiempo, ya que en lugar de buscar información en línea estas aplicaciones podrán proporcionar respuestas rápidas y precisas en cuestión de segundos con una disponibilidad las 24 horas. Quienes hemos usado esta aplicación sabemos que es fácil de usar y pueden ser accedidas desde cualquier dispositivo con conexión a Internet. Debemos tener en cuenta que las aplicaciones como ChatGPT deben establecer claramente que se respeta la privacidad de quien las usa. En particular, ChatGPT, en estos momentos no pide proporcionar información personal para hacer preguntas o recibir respuestas; pero debemos estar atentos.

Imagen creada con inteligencia artificial con el texto "mexican style, old and young people chating with robots in a happy enviroment " en https://huggingface.co/spaces/stabilityai/stable-diffusion

El uso de este tipo de aplicaciones puede también ser muy útil para aprender y expandir nuestros conocimientos en una variedad de temas. Para las juventudes, este tipo de herramientas son útiles para aprender de forma interactiva, pueden hacer preguntas sobre temas que les interesen y recibir respuestas detalladas, lo que puede ayudarles a expandir sus conocimientos. Una de las ventajas de las herramientas de lenguaje natural es que se tiene conversaciones familiares y esto nos puede agradar. Para las personas mayores, una de las ventajas es que no requieren conocimientos técnicos avanzados para su uso y se obtiene respuestas en lenguaje sencillo y claro, lo que lo hace fácil de entender. Con esta forma, parecería proporcionar una compañía útil para las personas mayores que pueden sentirse solas o aisladas y sentirse conectadas con el mundo exterior.

Estas herramientas pueden proporcionar respuestas a preguntas relacionadas con actividades cotidianas, como cocinar, hacer compras o realizar actividades físicas.

Existen otras herramientas como perplexity.ai donde se usa información disponible en la Internet para contestar las preguntas ofreciendo la liga específica del documento donde se extrajo la respuesta. Esto último es muy importante para los procesos de educación, ya que permite ir y consultar la fuente y ampliar la información así como analizar el contexto de la respuesta.

Ya en anteriores ocasiones hemos abordado el tema de inteligencia artificial y hemos mencionado que existen herramientas para crea música a partir de texto o de imágenes. De lo más interesante es que hay aplicaciones como Voice Cloning que puede imitar las características específicas de nuestra voz y como su nombre indica clonar nuestra voz. Este hecho facilita la creación de material audiovisual; pero nos alerta ya que puede haber suplantación de personas por voz. Para contrarrestar este peligro podemos usar también la inteligencia artificial. De manera similar como GPTzero puede detectar textos elaborados por inteligencia artificial, DeepFake Detection puede detectar videos realizados por inteligencia artificial aunque a primera vista parezcan reales.

Otra de los usos que están siendo explorados es el análisis de sentimientos mediante la inteligencia artificial para identificar y evaluar las emociones de una persona a partir del texto o del habla. Esto puede ser útil en campos como el servicio al cliente, la publicidad, la atención a personas solitarias, y el análisis de redes sociales.

En general, las herramientas de inteligencia artificial pueden ofrecer sugerencias y consejos sobre las actividades cotidianas; sin embargo, siempre es importante entender que son herramientas que todavía no entienden o procesan lo que se dice, sino que se basan en probabilidades.

Desde mi punto de vista es necesario que empecemos a usar este tipo de herramientas y las incorporemos a nuestras actividades. Los entornos laborales, educativos y comerciales están siendo modificados y se puede crear una mayor desigualdad entre las personas que usan y obtienen provecho de las herramientas de inteligencia artificial y aquellas que no las incorporen a sus actividades.

Este artículo fue publicado el día 29 de marzo en el periódico la Unión de Morelos

miércoles, 8 de febrero de 2023

Inteligencia Artificial del Theseus al ChatGPT

En un siglo hemos transitado de la era de la máquina a la era de la inteligencia artificial. A principios del siglo XX las preocupaciones sobre lo que pasaría si las máquinas empezaban a sustituir a las personas se pueden constatar en la obra cinematográfica, por ejemplo “Metropolis”, dirigida por Fritz Lang. Como lo he mencionado en estos textos a mediados del siglo XX, en 1953, Ray Bradbury en su novela de ciencia ficción “Farenheit 451” narraba un futuro donde había manipulación mediante conversaciones con entes artificiales. A finales del siglo XX la saga de “Terminator” también abordaba ese tema con máquinas inteligentes. Hoy, ChatGPT ha puesto estas preocupaciones en nuestro entorno cercano. Sin embargo, me parece que las actuales aplicaciones de inteligencia artificial nos muestran la puerta de entrada a un futuro en el que las conversaciones con “máquinas” o “aplicaciones” fluirán con la misma naturalidad que nuestras charlas con otras personas. El propio ChatGPT dice: "Un cerebro digital con el poder de la conversación, ChatGPT es la tecnología que está revolucionando la forma en que interactuamos con las computadoras."

Mucho se ha escrito en estos dos últimos meses, en Internet podemos consultar una gran diversidad de artículos, videos o pódcasts sobre el tema. Por ejemplo, este martes se publicó un artículo en la sección de Ciencia del periódico “La Unión de Morelos” que edita la Academia de Ciencias de Morelos sobre el tema donde se explica de una forma sencilla el tipo de inteligencia artificial que usan estas herramientas.

En este texto quiero comentar algunos orígenes y bondades de estas aplicaciones de inteligencia artificial para prepararnos de una mejor forma en su comprensión e incorporación a nuestras actividades cotidianas.

En 1950, Claude Shannon construyó un ratón robótico que podría resolver laberintos. Podemos decir que este es uno de los primeros ejemplos de inteligencia artificial. Ese primer robot resolvía unas 40 operaciones aritméticas con punto decimal por segundo (40 flops). El conteo de las operaciones de punto flotante que puede realizar un sistema computacional es una medida de su capacidad de cálculo. Así que en 1950, Theseus, el ratón de Shannon, realizaba unas cuantas operaciones por segundo. En los inicios de la década de 1990, una computadora para calcular y representar fenómenos en transporte de fluidos, como las estaciones de trabajo computacional de “Silicon Graphics” que usábamos en el antiguo Laboratorio de Energía Solar (hoy Instituto de Energías Renovables), realizaba millones de operaciones de punto flotante, Mflops. Los sistemas de inteligencia artificial que operan en la actualidad como Dall-E o ChatGPT, tienen una capacidad de cálculo de más de 300 millones de Petaflops (el prefijo Peta indica una magnitud multiplicada por uno y 15 ceros, mega indica solo uno y 6 ceros). Es decir, el poder computacional en menos de un siglo se ha incrementado casi infinitamente comparada con la escala humana y han permitido el desarrollo de este tipo de aplicaciones, que parecen estar al alcance de muchas personas, las posibilidades de sustituir el trabajo rutinario y potenciar el creativo afloran cada vez con mayor intensidad.

El surgimiento de estas tecnologías y su profusa difusión en la Internet está pasando por diferentes etapas que podemos visualizar como curvas de fenómenos del tipo Dunning Kruger. Estas curvas aparecen cuando en la ordenada consideramos la confianza en la herramienta y en la abscisa el conocimiento de cómo funciona la herramienta. Al considerar esta forma de análisis, nuestra confianza en la tecnología transita por diferentes fases que podemos esquematizar resumidamente en 4. Una primera fase de la sorpresa y muy altas expectativas, lo pueden resolver todo. Un segundo estadío, donde preguntamos cómo funcionan y entendemos que estas herramientas de inteligencia artificial usan modelos probabilísticos que no tienen entendimiento de los fenómenos de lo que hacen y disminuye nuestra confianza, si no entienden ¿cómo lo hacen?, dudamos. Después hay una tercera fase de desencanto más profundo, cuando observamos que los modelos probabilísticos como ChatGPT se equivocan o comunican información errónea o Dall-E dibuja un perro con cinco patas. Posteriormente, alcanzamos una fase estable donde comprendemos que podemos aprender a usarlas de ciertas maneras y, con ello, potenciar nuestras actividades con su uso, aquilatamos su utilidad y sobrepasamos sus deficiencias. Estoy seguro de que hemos pasado por alguna de estas fases en cuanto conocemos a ChatGPT y, desde mi punto de vista, lo más relevante es transitar rápidamente a esa fase de uso adecuado de estas herramientas para usarlas.

Version simplificada del esquema de Dunning Kruger (JAdRP).

Aquí he mencionado a Dall-E, donde se crea imágenes a partir de texto, y ChatGPT, que escribe textos a partir de textos; pero existen otras herramientas similares desarrolladas por las compañías más grandes en el manejo de información. Por ejemplo, hace unas semanas un equipo de desarrollo de Google liberó información de la aplicación MusicLM que compone música a partir de texto. Este mismo objetivo lo comparte Moûsaie desarrollado por un grupo del Tecnológico de Zurich (ETH) y del Instituto Max Planck. Las herramientas de inteligencia artificial están en muchos ámbitos de las actividades humanas.

Así como vemos, actividades que nos parecían propiamente humanas: escribir a partir de una pregunta, crear un dibujo inspirado en un texto y componer música a partir de la descripción de nuestras emociones, pueden ser realizadas por sistemas con inteligencia artificial.

Ante estos hechos, la posibilidad de que las fuentes de empleo pudieran ser asignadas a estos tipos de sistemas y entonces reemplazar a la fuerza laboral humana es un hecho. Sin embargo, algunos estudios nos indican que podemos capacitar de forma flexible a las personas para que puedan transitar de una ocupación a otra o que aprendan a utilizar estas herramientas para incrementar la confiabilidad en ellas con una productividad mayor.

Lo primero es conocerlas y usarlas de manera crítica para percatarnos de sus fortalezas y entender debilidades. Con este uso nos familiarizaremos, de manera similar como con los teléfonos inteligentes; que ya tienen de alguna forma incorporadas opciones de este tipo de inteligencia artificial. Así que les invito a jugar con estas herramientas de inteligencia artificial.

Finalmente, las instituciones de educación superior en México han incorporado a sus esquemas de formación en el nivel licenciatura de carreras en ciencias de datos o de computación. Este paso es fundamental, pero, desde mi perspectiva, hace falta un decidido apoyo para que grupos de investigación y desarrollo puedan seguir el paso de los grandes consorcios de manejo de datos en el ámbito mundial. Aquí la participación de organismos empresariales o de la sociedad civil es necesaria. Por ejemplo, las actuales deficiencias del uso en español de ChatGPT son causadas en parte por la limitada fuente de información en este idioma comparada con la información en inglés. Un trabajo que podemos hacer quienes tenemos acceso a subir información es la diseminación de información en nuestro idioma, y en otras lenguas locales, para que también sea posible utilizar estas herramientas por muchas más personas que no dominan el inglés. Así de sencillo: jugar y escribir o digitalizar imágenes o digitalizar sonidos o música. Con este objetivo tenemos a Wikimedia, usémosla.

Una versión resumida de este artículo fue publicada el día 8 de febrero en el periódico la Unión de Morelos.

Antonio del Río Portilla