L’article de ZDNET, rédigé par David Gewirtz, porte sur une évaluation détaillée et comparative de DeepSeek, un nouveau chatbot d’intelligence artificielle (IA) open source venant de Chine. La curiosité autour de DeepSeek a été attisée par ses revendications de performances compétitives, malgré une utilisation réduite d’infrastructure par rapport à ses concurrents bien établis. Pour déterminer les capacités de programmation de DeepSeek, cet article présente une série de tests auxquels le chatbot a été soumis, intégrant des défis complexes et variés. Cette étude comparative vise à évaluer objectivement et précisément la place de DeepSeek parmi les grandes IA actuelles.
Caractéristiques Distinctives de DeepSeek
DeepSeek se distingue par plusieurs caractéristiques principales qui le démarquent de ses concurrents. Tout d’abord, son origine non américaine le propulse dans un contexte géopolitique sensible, surtout avec les préoccupations croissantes du gouvernement américain à propos des technologies chinoises, similaires aux débats entourant TikTok. Cependant, l’aspect le plus notable est son statut open source et l’utilisation d’une infrastructure nettement plus légère par rapport à d’autres IA majeures. Ces attributs non conventionnels suscitent à la fois l’intérêt et la prudence dans le domaine de l’IA, surtout pour les chercheurs et les développeurs qui cherchent à adopter des solutions novatrices.
Bien que ces caractéristiques puissent paraître mineures, elles influencent considérablement la perception et les attentes autour de DeepSeek. En écartant les considérations politiques, l’article se concentre sur une évaluation purement technique pour offrir une perspective équilibrée et juste sur les réelles capacités de l’IA. Cette approche permet de discerner l’impact de l’infrastructure allégée sur la performance de DeepSeek, sans être biaisé par des préjugés externes. Ainsi, DeepSeek se présente comme un sujet d’étude intrigant, promettant des découvertes enrichissantes tant pour les novices que pour les experts en IA.
Test de Création d’un Plugin WordPress
Le premier test visait à évaluer la capacité de DeepSeek à créer un plugin WordPress, un défi qui mesure à la fois la compétence technique et la compréhension des directives de codage spécifiques à cette plateforme. La création d’un plugin WordPress impose une connaissance approfondie de la structure du logiciel et une précision méticuleuse dans la mise en place de l’interface utilisateur et de la logique sous-jacente du programme. Le test reflète un scénario réel que les développeurs doivent régulièrement aborder, soulignant l’importance de cette compétence.
DeepSeek a réussi ce test avec brio, générant un plugin selon les spécifications et les attentes définies. Ce succès le place parmi les IA performantes capables de s’adapter aux exigences spécifiques et pointues du développement WordPress. Cette victoire n’est pas anodine; elle démontre que malgré son infrastructure réduite, DeepSeek est en mesure de rivaliser avec des IA plus installées. Cette performance impressionnante renforce la validité de ses revendications de compétitivité et attire davantage l’attention sur ses capacités techniques concrètes.
Réécriture d’une Fonction de Chaîne de Caractères
Le deuxième test impliquait la réécriture d’une fonction de chaîne de caractères pour permettre l’inclusion de dollars et de cents dans un champ de saisie de dons. Ce test a révélé des aspects nuancés des compétences en programmation de DeepSeek. Si le chatbot a produit un code fonctionnel, plusieurs critiques ont souligné que le code était inutilement long et répétitif, avec une faiblesse potentielle concernant l’arrondi des grandes valeurs. Ces imperfections montrent que DeepSeek, bien que capable, n’échappe pas entièrement aux erreurs humaines dans le développement de code.
Malgré ces défauts, les résultats obtenus par DeepSeek n’ont pas empêché le bon fonctionnement du programme. Cette réalisation montre que même avec des faiblesses, l’IA parvient à fournir des solutions viables et opérationnelles, soulignant un succès mitigé mais significatif pour ce test. En examinant ces détails, l’évaluation de DeepSeek devient plus complète, révélant non seulement ses forces mais aussi ses zones de progression nécessaires pour une meilleure optimisation futuriste.
Résolution d’un Bug Complexe
Le troisième test, quant à lui, confrontait DeepSeek à un bug complexe nécessitant une compréhension approfondie des appels d’API de WordPress. La capacité à identifier et résoudre des bugs dans des environnements de développement est un test crucial pour toute IA destinée à entrer dans des cycles de développement réels. Face à cette tâche ardue, DeepSeek a prouvé sa valeur en identifiant correctement la source du problème, une performance que toutes les IA n’ont pas réussie à accomplir.
En effet, ce succès place DeepSeek au-dessus de plusieurs autres IA de renom comme Gemini, Copilot, Claude et Meta. Non seulement a-t-il démontré une capacité à naviguer dans des environnements API complexes, mais il a également démontré une perspicacité et une précision impressionnantes dans la résolution de problèmes. Cette performance renforce l’idée que DeepSeek, même avec ses limitations d’infrastructure, peut fournir des solutions de haute qualité, solidifiant ainsi sa position comme un compétiteur sérieux dans l’arène de l’IA.
Interaction dans un Environnement de Script Complexe
Le quatrième test, considéré comme le plus complexe, a évalué DeepSeek sur sa compréhension et son interaction avec trois environnements différents : AppleScript, le modèle d’objet Chrome, et Keyboard Maestro. C’est un domaine où les connaissances techniques et la capacité à intégrer et orchestrer divers outils et scripts sont mises à l’épreuve. Malheureusement, ce test a révélé des lacunes dans les compétences de DeepSeek.
DeepSeek a échoué à ce test, en grande partie en raison de sa faible connaissance d’AppleScript et de son incapacité à diviser correctement la tâche entre les différents outils requis. Cette difficulté met en évidence une limite dans la capacité de DeepSeek à gérer des environnements multi-scripts complexes, une compétence essentielle pour certains domaines de programmation avancée. Bien que cet échec soit notable, il offre aussi une direction claire pour les améliorations futures et les domaines où une concentration accrue pourrait apporter des résultats significatifs.
Potentiel et Limites de DeepSeek
En conclusion, DeepSeek a réussi trois des quatre tests, une performance qui, bien qu’impressionnante, laisse entrevoir des marges de progression notables. L’article dénote que si DeepSeek est performant, il n’atteint pas encore le niveau des IA avancées comme les versions ultérieures de GPT. Cependant, son infrastructure plus légère et son développement récent suggèrent un potentiel prometteur qui pourrait se concrétiser à mesure que l’IA continue d’évoluer.
L’auteur note également quelques inconvénients opérationnels observés durant les tests, tels que l’insistance de DeepSeek à utiliser une adresse e-mail publique et des problèmes de réactivité. Malgré ces inconvénients, la performance globale de DeepSeek est jugée respectable pour une IA émergente, ce qui suggère qu’elle pourrait rapidement devenir un concurrent sérieux dans le domaine de l’intelligence artificielle. Ce constat encourage les développeurs et les chercheurs à surveiller l’évolution de DeepSeek, incluant ses mises à jour et ses améliorations futures.