WIT by Google AI est un ensemble de données image-texte spécialement conçu pour les applications d'apprentissage automatique. Il contient des images avec les légendes correspondantes et est basé sur des articles de Wikipedia. Cet ensemble de données est idéal pour les développeurs et les chercheurs qui cherchent à créer des modèles d'apprentissage automatique multimodaux et multilingues.
WIT by Google AI contient plus de 300 000 images et les légendes correspondantes dans plusieurs langues, dont l'anglais, le français, l'allemand, l'espagnol, le chinois, le japonais et le coréen. L'ensemble de données est divisé en deux ensembles : la formation et l'évaluation. L'ensemble de formation est utilisé pour former les modèles, tandis que l'ensemble d'évaluation est utilisé pour évaluer les performances des modèles formés.
L'ensemble de données offre également une variété de caractéristiques, telles que la reconnaissance d'images et le traitement du langage naturel, afin de faciliter le développement de modèles d'apprentissage automatique avancés. En outre, WIT by Google AI fournit des outils pour l'augmentation et l'évaluation des données. Ces outils aident les utilisateurs à générer de nouvelles légendes et à évaluer les performances de leurs modèles.
Enfin, l'ensemble de données WIT by Google AI offre des options de licence flexibles qui permettent aux développeurs de personnaliser leurs modèles en vue d'une utilisation commerciale. Il s'agit donc d'un choix idéal pour les développeurs et les chercheurs qui souhaitent créer des modèles d'apprentissage automatique s et s.