xAI a récemment dévoilé Grok, un outil d'assistance à la recherche inspiré du "Guide du voyageur galactique". Grok est conçu pour répondre à presque toutes les questions et, plus difficile encore, suggérer quelles questions poser. Avec un brin d'humour et un esprit rebelle, Grok est recommandé pour ceux qui apprécient l'humour dans l'apprentissage.
L'avantage unique de Grok réside dans sa capacité à accéder à des informations en temps réel via la plateforme 𝕏. Il répond également à des questions piquantes généralement rejetées par la plupart des autres systèmes d'IA. Bien que Grok soit encore en version bêta précoce, xAI promet des améliorations rapides grâce aux retours des utilisateurs.
Le moteur de Grok est Grok-1, un modèle de langage de pointe développé sur quatre mois. Grok-1 a subi de nombreuses itérations, améliorant considérablement ses capacités de raisonnement et de codage. Sur des benchmarks standard, Grok-1 a affiché des résultats impressionnants, surpassant tous les autres modèles de sa classe de calcul, y compris ChatGPT-3.5 et Inflection-1, et n'est dépassé que par des modèles formés avec des données et des ressources de calcul nettement plus importantes, comme GPT-4.
xAI a également mené une évaluation humaine de Grok-1 sur les finales nationales hongroises de mathématiques de 2023, un test "réel" sur un ensemble de données pour lequel le modèle n'a jamais été explicitement ajusté. Grok a obtenu un C (59%), tandis que Claude-2 a obtenu la même note (55%), et GPT-4 a obtenu un B avec 68%.
L'infrastructure d'ingénierie de xAI est construite avec soin, utilisant Kubernetes, Rust et JAX pour créer Grok. Cette infrastructure permet de minimiser les temps d'arrêt et de maintenir une utilisation élevée des flops du modèle, même en présence de matériel peu fiable.
En termes de recherche, xAI vise à atteindre un raisonnement fiable, un défi majeur pour les systèmes actuels. Les directions de recherche prometteuses incluent la supervision évolutive avec assistance d'outils, l'intégration avec la vérification formelle pour la sécurité, la compréhension et la récupération de longs contextes, la robustesse adversaire et le développement de capacités multimodales.
xAI offre un accès anticipé à Grok pour un nombre limité d'utilisateurs aux États-Unis, avec l'intention de recueillir des retours précieux pour améliorer ses capacités avant un lancement plus large. Avec une feuille de route passionnante, xAI prévoit de déployer de nouvelles capacités et fonctionnalités dans les mois à venir.