Paso a paso, la inteligencia artificial de xAI, Grok, está evolucionando. Aunque aún es joven en comparación con otras IAs del mercado, está empezando a reconocer su entorno.
De manera progresiva, Grok se acerca a las IAs generativas de Google, OpenAI y otras empresas líderes. Según sus desarrolladores, Grok 1.5v ha adquirido la capacidad de ver, lo que le permite «observar» fotos e imágenes y entender su contenido.
En ocasiones, las declaraciones de Elon Musk se toman en tono jocoso debido a sus experiencias pasadas, como con el lanzallamas. Aunque presentó a Grok como una IA generativa irreverente y desinhibida, capaz de afirmar que su mayor logro es… convertir Twitter en un vertedero.
De todas formas, Elon Musk está seriamente comprometido con la inteligencia artificial. En 2023, fundó xAI con la intención de competir con plataformas como GPT y Gemini de una manera única.
Grok ahora es capaz de interpretar imágenes
Se sabe que el objetivo final de Grok es crear una aplicación global, la «gran X» que lo abarque todo: red social, banco, sistema de pago, asistente virtual, plataforma de compras, entre otros. Todo esto requiere el uso de inteligencia artificial.
La versión inicial de Grok, lanzada en noviembre pasado, era un chatbot con limitaciones significativas, similar a un GPT-1 en comparación. Esta versión está disponible para los suscriptores de X Premium Plus.
En marzo, se lanzó Grok 1.5, con mejoras significativas. Grok ahora puede mantener conversaciones convincentes, escribir código, resumir información, entre otras funciones.
De acuerdo con las pruebas de rendimiento de xAI, Grok se encuentra a la par de GPT-4 y Gemini 1.5 Pro en la resolución de problemas matemáticos y otras tareas. Sin embargo, como menciona The Verge, los benchmark de inteligencia artificial deben tomarse con precaución, ya que si las AI entrenan con sus propios datos, mejoran significativamente en esas áreas, siguiendo una lógica similar a conocer las respuestas de un examen antes de realizarlo.
Próximamente, xAI lanzará Grok 1.5v (la «v» hace referencia a la visión), una actualización que dotará a Grok de habilidades visuales.
La IA de Elon Musk ahora tiene la capacidad de analizar documentos, diagramas, gráficos, capturas de pantalla y fotografías.
xAI
Como se puede apreciar en esta imagen, Grok es capaz de generar código a partir de un diagrama de flujo.
xAI menciona otros ejemplos en su blog. Por ejemplo, puede calcular las calorías de ingredientes a partir de una etiqueta, crear una historia a partir de un dibujo infantil, explicar el humor de un meme, dar instrucciones para reparar un objeto dañado visto en una foto, entre otras tareas.
Grok 1.5v es un avance positivo, pero aún tiene camino por recorrer para alcanzar los niveles de GPT o Gemini. xAI asegura que en los próximos meses, Grok también podrá trabajar con audio y video.
Descubre cómo trabajamos en ComputerHoy.
Etiquetas: Inteligencia artificial, Elon Musk
