🔥 Tal como en el número anterior, me alejo del contenido teórico para traer un poco de la candente actualidad en el mundo de la IA.🔥
ChatGPT vs Bard
Desde su lanzamiento hace un par de meses, ChatGPT (creado por OpenAI) ha sido el foco de atención y captado tantos titulares como fueron posibles. Su ritmo de crecimiento de usuarios es algo nunca antes visto y hasta logró el record de ser la «aplicación de consumo de más rápido crecimiento» de la historia.
Semejante éxito no podía dejar indiferente a Google quien tiene no solo los recursos económicos y técnicos, sino toda una empresa dedicada a la investigación en IA: DeepMind. Google y DeepMind no paran de publicar papers y hacer avanzar el campo de la IA, pero generalmente no liberan sus modelos para el uso público, y generalmente tampoco terminan concretando o transformando esos modelos en productos comerciales. Investigan y desarrollan mucho, pero poco es lo que podemos utilizar directamente los usuarios finales.
Microsoft vs Google
Y aquí es donde se puso interesante la cosa. Ante el éxito de ChatGPT, Google anunció que en 2 días mostraría Bard, su propia versión de un modelo de lenguaje natural “conversacional” y competidor directo de ChatGPT, que estaría inicialmente solo disponible para un selecto grupo de testers.
Ni lerdo, ni perezoso, Microsoft (socio estratégico y comercial de OpenAI) anunció una conferencia sorpresa un día antes que la de Google! Y allí mostraría la integración de ChatGPT en su buscador Bing, y en su navegador Edge!
Cómo resultó? La conferencia de Microsoft fue un éxito rotundo! Pueden verla completa aquí. La integración con el navegador y el buscador fue tan exitosa que hubo quien dijo que “hasta hicieron que quisiéramos usar los productos de Windows” 🤣😅.
La realidad es que Microsoft dio un puntapié hacia una nueva era en las búsquedas por internet, tal como dijera su CEO Satya Nadella “un nuevo paradigma para las búsquedas”. Y eso fue un bombazo directo al lider indiscutido e indisputado de las búsquedas online.
Y qué pasó con Google? Su conferencia fue “rancia”, lo que mostraron no sorprendió a nadie. Mostraron algunas cosas interesante que no lograron ni de cerca opacar el éxito que Microsoft había logrado día antes. Y para peor tuvieron incluso problemas técnicos durante la misma: una de las presentadoras anunció que haría una demostración en vivo… pero le desapareció su móvil!
Tal fue el descontento con la presentación (y con un error mostrado durante la demostración de Bard) que las acciones de Google cayeron un 7% (perdió algo así como $100B en valor de mercado!).
La batalla que observamos la pasada semana es a todas luces el inicio de una guerra entre gigantes tecnológicos, y una que presagia ser feroz porque está en juego el futuro y la supremacía sobre la navegación, las búsquedas online y de la misma IA.
Un tercero pidiendo permiso: Open Assistant
Un jugador que nada tiene que hacer en esa guerra, también dio signos de querer romper con el statu quo. Se trata de un Open Assistant: la versión open source de ChatGPT.
Y con esto no estoy diciendo que puedan pelear de igual a igual con MS & Google, pero sí creo que vienen a patear el tablero y liberar un modelo de LLM que todos podamos usar, reentrenar y reutilizar de la manera que queramos sin depender de la voluntad de los gigantes de turno.
Esta iniciativa parte de la gente de LAION a la que se le sumó una enorme comunidad de investigadores y divulgadores de IA de mucho renombre como Yannic Kilcher o el propio DotCSV, uno de los mejores divulgadores de IA en español y más populares. Según la página de Open Assistant:
“De la misma forma que Stable Diffusion ayudó al mundo a crear arte e imágenes de nuevas maneras, queremos mejorar el mundo proporcionando una IA conversacional asombrosa”
Y es que la cosa viene muy bien!
Alguien dijo “guerra”?
Baidu, el gigante Chino no se piensa quedar fuera, y anunció lanzamiento más tarde este año de ERNIE, un chatbot generativo, directo competidor de ChatGPT, Bard y Open Assistant.
Bing + Edge + ChatGPT = ❤️
Volviendo a lo presentado por Microsoft, causó mucho revuelo precisamente porque combinaba el poder de los modelos generativos de textos con el acceso a internet. Recordemos, que por cuestiones arbitrarias (y de seguridad), OpenAI hizo que ChatGPT no tuviera acceso a internet, y solo puede manejar datos que estuvieron originalmente incluidos en su entrenamiento (finales de 2021).
Prometheus el “ChatGPT on steroids”
El modelo que está usando Microsoft para sus nuevos productos no es ChatGPT tal como lo podemos usar en el sitio de OpenAI, sino una versión modificada del mismo. Una versión “con esteroides” llamada Prometheus.
Este modelo suma ese elemento crucial (acceso a internet), que por un lado le permite responder sobre temas recientes y presentes y por otro le permite adjuntar fuentes sobre cada una de las afirmaciones o datos que aporta.
Nuevamente: esto es algo que ChatGPT no puede realizar.
Con Bing/Edge, no solo recibimos respuestas a nuestras consultas sino que además tenemos la posibilidad de consultar las fuentes de esas respuestas.
Y esto es algo más que necesario en el estado actual de estos modelos ya que tienen de “halucinar”: se inventan respuestas, e incluso hasta inventan fuentes de esas respuestas!
Otro uso interesante de Edge (el navegador de MS) es que la integración con el modelo de IA se hace en una solapa lateral. El modelo tiene acceso al sitio web en el que estemos navegando y podría interactuar con el contenido del mismo de una manera muy ágil e intuitiva.
Podríamos por ejemplo estar viendo un archivo PDF de 50 páginas y pedirle que nos realice un resumen del contenido explicado “para un niño de 9 años” y sin más, en la comodidad del navegador recibiríamos el texto “digerido”.
O, como se muestra en este twit de Greg Brockman (Presidente de OpenAI), podríamos estar en nuestro perfil de LinkeIn y solicitarle al modelo que nos escriba una publicación sobre el tema que queramos.
Y esto cómo sigue?
Desde la semana pasada hasta ahora, han pasado muchísimas cosas!
La gente empezó a notar errores en las respuestas del nuevo Bing. Cosa totalmente esperable dado el estado actual de los LLMs.
Pero además empezaron a surgir respuestas inquietantes. Bing comenzó a responder en un tono por momentos agresivo, y por otros intimidante y atemorizante 😱😱:
Especulaciones:
Algunas cosas que podrían pasar…
-El modelo Bing/Edge va a estar filtrado por «Fact Checkers». Lo que hará que su veracidad se vea comprometida por sesgos ideológicos… (ya lo vimos en Twitter y en Facebook). Esto suceda muy probablemente, sobre todo después de ver cómo se “desmadró”.
-Hay un punto en el que Microsoft corre con muchísima ventaja, incluso siendo menos veraz: la integración con todo el ecosistema MS. La común de la gente usará MS por estar dentro e integrado a Windows, a Excel, a Office, a Bing y a Edge.
-La comunidad Open Source mostrará, una vez más, de lo que es capaz. Open Assistant será un modelo totalmente competitivo, con la gran ventaja de la comunidad de desarrolladores generando un ecosistema de aplicaciones en torno al modelo. Todo el ecosistema de desarrollo y startups va a crecer exponencialmente en torno a ese modelo open source.
Y por lo menos… así lo veo yo 😁