N'écoutez pas les détracteurs, Gemini 3 est extrêmement bon pour toutes sortes de tâches de codage. Tout, de l'interface utilisateur pour les applications web, au développement iOS en Swift, au code backend en Python, tout ce qui concerne l'IA/ML, etc. Il est vraiment puissant et bon pour suivre des règles et utiliser des outils.
Il semble que chaque fois qu'un modèle de frontière majeur est publié, un tas de personnes essayant de se faire remarquer parlent de à quel point il est "décevant" et comment il a échoué à leur tâche fétiche. En général, vous constaterez qu'ils étaient horribles à formuler des requêtes ou que leur tâche est idiote et pas du tout pertinente dans la vie réelle.
Il y a quelques exceptions, comme Llama4, qui était évidemment horrible pour quiconque l'a essayé pendant 3 minutes. Mais les gens ont dit cela à propos de GPT-5 et c'était risiblement faux. C'est comme avec le marché boursier, les gens attirent plus d'attention en étant sceptiques et contraires. La négativité se vend.
Ce qui compte (du moins pour le codage), c'est la qualité du modèle pour les personnes qui sont déjà compétentes dans l'utilisation de modèles similaires pour le développement de logiciels, et leur opinion raisonnée après l'avoir essayé pendant plusieurs heures sur une variété de tâches réalistes et concrètes, et non sur des problèmes pièges stupides.
Et cela prend du temps et beaucoup d'essais indépendants pour vraiment voir à quel point le modèle est cohérent et autonome, combien d'agence et de "courage et détermination" il montre (une partie de cela dépend également du harnais de l'agent, donc Cursor contre Gemini-CLI), à quel point il est fiable avec les outils.
Gemini 3 brille sur toutes ces dimensions, et ce, de manière significative. Google a créé une énorme valeur de marché pour lui-même avec ce modèle, notamment parce qu'ils peuvent l'héberger à coût nul sur leur propre silicium personnalisé.
Il sera difficile (quasi impossible) pour d'autres d'atteindre ce point sur la courbe prix-performance. Même si GPT-6 est quelque peu plus intelligent, les coûts d'hébergement pour OpenAI après avoir payé la "taxe Nvidia" et donné à Jensen ses 90 % de marges brutes le feront échouer en termes de Pareto.
6,74K