Show And Tell: Google Sources Open Son IA sous-titrage d'image dans TensorFlow

Show And Tell: Google Sources Open Son IA sous-titrage d'image dans TensorFlow
Show And Tell: Google Sources Open Son IA sous-titrage d'image dans TensorFlow

Vidéo: Show And Tell: Google Sources Open Son IA sous-titrage d'image dans TensorFlow

Vidéo: Show And Tell: Google Sources Open Son IA sous-titrage d'image dans TensorFlow
Vidéo: Test macOS Sierra Français 2023, Décembre
Anonim
Image
Image

Octets courts: Google a ouvert le code source de son système Show and Tell, qui sera désormais disponible dans la bibliothèque d'apprentissage automatique TensorFlow. Le système Show and Tell peut analyser une image et fournir une légende appropriée décrivant la situation de l'image. Le code du système est disponible sur GitHub.

L’équipe Google Brain développe des systèmes d’intelligence artificielle au sein de la division de recherche de la société. L'équipe Brain se concentre sur l'apprentissage en profondeur, un sous-ensemble de l'apprentissage automatique, qui consiste essentiellement à former un système d'IA en lui fournissant une énorme quantité de données.

En 2014, l'équipe Google Brain a commencé à travailler sur un système capable d'analyser une image et d'enregistrer une légende. Le système pourrait analyser ce qui se passait dans l'image. À cette époque, leur modèle de classification d’image Inception V1 permettait au système d’atteindre une précision de 89,6%. Plusieurs mois ont suivi et le modèle de classification des images a été mis à niveau vers Inception V2 en 2015, offrant une précision de 91,8%.

Le modèle actuel Inception V3 permet au système d’analyser les images avec une précision de 93,9%. Le système amélioré peut détecter plusieurs objets dans une image avec leurs caractéristiques et écrire une légende plus pertinente. "Un modèle de classification d'image vous dira qu'un chien, une herbe et un frisbee sont dans l'image, mais une description naturelle devrait également vous indiquer la couleur de l'herbe et le rapport entre le chien et le frisbee."
Le modèle actuel Inception V3 permet au système d’analyser les images avec une précision de 93,9%. Le système amélioré peut détecter plusieurs objets dans une image avec leurs caractéristiques et écrire une légende plus pertinente. "Un modèle de classification d'image vous dira qu'un chien, une herbe et un frisbee sont dans l'image, mais une description naturelle devrait également vous indiquer la couleur de l'herbe et le rapport entre le chien et le frisbee."
Google a annoncé que son système de sous-titrage d'images basé sur Show and Tell AI était désormais disponible en tant que modèle open source dans le cadre de TensorFlow."Cette version contient des améliorations significatives du composant de vision par ordinateur du système de sous-titrage, est beaucoup plus rapide à former et produit des descriptions plus détaillées et plus précises que le système d'origine."
Google a annoncé que son système de sous-titrage d'images basé sur Show and Tell AI était désormais disponible en tant que modèle open source dans le cadre de TensorFlow."Cette version contient des améliorations significatives du composant de vision par ordinateur du système de sous-titrage, est beaucoup plus rapide à former et produit des descriptions plus détaillées et plus précises que le système d'origine."

TensorFlow, successeur de DistBelief et initialement développé par l'équipe de Google Brain, est une bibliothèque d'apprentissage automatique composée de logiciels open source. La bibliothèque open source est utilisée par de nombreuses équipes de différentes sociétés appartenant à Alphabet, notamment Google.

Source: blog de recherche Google

Si vous avez quelque chose à ajouter, dites-le-nous dans les commentaires ci-dessous.

En savoir plus sur Google:

  • Cet algorithme vieux de 280 ans alimente les nouvelles applications Google Trips
  • 5 raisons pour lesquelles Google Allo est mieux que WhatsApp, vraiment?
  • Combien de lignes de code existe-t-il dans Google, Facebook et Windows?

Conseillé: