Top
crédit image : Unsplash

OpenAI siphonne les sites web pour entraîner GPT-5 : comment bloquer son bot ?

août 8, 2023

Via: LeBigData
Rubrique:

Afin d’améliorer ses modèles d’intelligence artificielle comme GPT-4 ou le futur GPT-5 qui pourrait être la première IA consciente, OpenAI a besoin de données. Beaucoup, beaucoup de données.

Pour les obtenir, la firme de Sam Altman vient de lancer un robot « web crawler » dénommé GPTBot. Son rôle ? Parcourir internet et les sites web afin de récupérer leurs data pour entraîner les IA.

Parfois appelé « web spider », un web crawler est un type de robot qui indexe le contenu des sites web. Les moteurs de recherche comme Google et Bing les utilisent pour choisir et classer automatiquement les sites apparaissant dans leurs résultats.

En lire davantage sur LeBigData