Partigenerator De Google Utilise 20 Milliards D’entrées Pour Créer Des Images Photoréalistes

Google a publié jeudi un modèle informatique de Party Text to Image, qui apprend des dizaines de milliards d’entrées pour créer de vraies images.

Pathways autoregressive text-to-image (party) Google examine une série d’images nommées ‘image token’ et les utilise pour créer une nouvelle image, qui Aux États-Unis, le géant de la recherche parle sur son site Web d’enquête. L’image de la fête est plus réaliste et il y a plus de paramètres à revoir (jetons et autre matériel pédagogique). Le modèle examine 20 milliards de paramètres avant de créer l’image finale.

Parti diffère d’Imagen, qui génère des images à partir de texte conçu par Google pour utiliser Diffusion Learning. Dans ce cours, vous entraînez un modèle informatique en ajoutant du ‘bruit’ à une image, la rendant floue comme une image fixe sur un écran de télévision. Le modèle apprend alors à décoder le statique pour reconstruire l’image d’origine. Au fur et à mesure que le modèle s’améliore, ce qui ressemble à une série aléatoire de points peut être transformé en une seule image.

Étant donné que les ensembles de données AI comportent un risque de biais, Google ne fait généralement pas la fête ni ne publie d’images. Étant donné que les ensembles de données sont créés par des humains, ils peuvent par inadvertance déformer les stéréotypes ou déformer certains groupes. Google affirme que le parti et Imagine ont un parti pris contre les stéréotypes occidentaux.

Après avoir reçu des commentaires sur cette histoire, Google s’est référé au blog de l’entreprise.

Le géant de la recherche a investi massivement dans l’intelligence artificielle comme moyen d’améliorer les services et d’étendre l’informatique ambiante. C’est une technique très intuitive qui fait partie de l’arrière-plan. Lors de la conférence I/O Developers en mai, le PDG Sundar Pichai a déclaré que l’IA est utilisée pour ajouter une langue à Google Traduction, créer des images 3D à partir de cartes et résumer des documents. Raconté.

Party et Imagine ne sont pas les seuls modèles du texte à l’image. Dall-E, VQ-GAN+ CLIP et les modèles de diffusion secrète sont d’autres modèles de texte-image autres que Google qui ont récemment fait l’objet d’une attention particulière. Dell-E Mini est une IA open source text-to-image accessible au public, mais formée sur de petits ensembles de données.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan.

Close

Adblock Detected

Please consider supporting us by disabling your ad blocker