Aller au contenu
Accueil » Blog » Omni d’OpenAi

Omni d’OpenAi

Au-delà du buzz : que penser d'Omni ?

Omni c’est le petit nom du nouveau modèle d’IA Générative d’OpenAi. Son vrai nom est Chat-GPT 4o. Avec leur présentation en live, OpenAi a initié un débat dans la communauté iA.

OpenAi a fait le buzz ! Mais au-delà de leur effet démo que retenir de la présentation d’Omni leur nouveau modèle d’IA générative ? On décrypte à chaud !

Une chose est sûre les avis sont partagés. A lire les réseaux sociaux ce matin je trouve que les réactions se focalisent essentiellement sur des points superficiels alors qu’il y a des innovations formidables.

Omni est performant !

Tout d’abord GPT-4o est un nouveau modèle performant. Son nom n’est pas super marketing, mais comme ils l’appellent aussi « omni » on dira que son prénom est cool.

– Niveau de complexité : niveau GPT-4

– Vitesse : plus rapide en partie via une tokenisation améliorée. Une même requête consomme moins de tokens en français (de 31 à 28 tokens pour la phrase modèle). Pour certaines langues indiennes c’est un saut énorme Gujarati (de 145 à 33), Telegu (de 159 à 45) ou Tamil (de 116 à 35) !

– Pour l’API le coût est abaissé (-50% encore mieux que les Tesla quand les ventes patinent) avec une limites 5 fois plus élevées par rapport à GPT-4-Turbo.

– Niveau performance mesurée par le benchmarking : la performance est réellement améliorée. A ce sujet, il faut aller voir le blog d’OpenAI. On y trouve un paquet d’informations détaillées disponibles, très utile pour se faire une opinion.

– Un seul modèle pour gérer texte, vision et audio, contre trois auparavant. Cette fois OpenAi n’a pas juste joué avec les pièces du mécano et fait un meilleur assemblage. Avec GPT-4o il y a un seul modèle entrainé pour gérer texte, vision et audio. Tout passe donc par un unique réseau neuronal. C’est un gros plus car avant OpenAi utilisait trois réseaux : un chargé de l’audio vers le texte, puis GPT 4 et enfin un troisième pour faire du texte to speech. Non seulement cela signifie un gain de temps immédiat et visible, mais comme c’est la v1 d’un nouveau réseau on peut s’attendre à des améliorations futures.

Améliorations de la voix avec des interactions plus naturelles

– Temps de latence : réduit à 320 millisecondes, comparable à une conversation avec un collègue. A titre de comparaison, GPT4 était à 5.4 secondes (et 2.8 secondes pour la version 3.5).

– Interruption : possible en cours de phrase, c’est cool cette fonction on va pouvoir couper la parole à notre assistant !

– Détection des nuances de la parole. OpenAi met en avant la capacité à percevoir des éléments comme la respiration rapide. A voir à l’usage si cela est utile.

– Traduction multilingue rapide. Là je dois avouer que c’est potentiellement une avancée réelle avec une performance améliorée pour 20 langues. Reste à voir l’importance de la connexion internet.

Cette utilisation “voice-first” ira bien aux personnes seules dans leur pièce en full remote. Je crains aussi de voir des piétons se mettre à discuter avec « omni » en pleine rue. Mais dans un bureau ? Chez soi avec des enfants et un conjoint qui travaille à côté ? Allons-nous repasser de l’Open space à des bureaux fermés ?

C’est que j’ai trouvé lors de la démo que l’américanisation est très très marquée pour ce qui est du style qu’OpenAi a choisi de donner aux intonations de la voix. Le côté comment ça va mon poto GPT suivi d’un terrific ! c’est très bien dans les séries US mais pour un usage pro en Europe va falloir demander à “omni” de rester un peu plus calme. A suivre !


Capacité de vision en temps réel

La version de bureau (Mac uniquement si j’ai bien compris) peut “voir” l’écran avec permission. Cela ouvre des pistes.

Omni a la possibilité de décrire un graphique ou de répondre à des questions sur un texte à l’écran.

Alors en France va falloir penser infos personnelles, RGPD sans oublier les infos confidentielles. Sur le papier c’est un assistant qui peut comme le collègue sympa venir regarder mon écran et me donner son avis. Cependant, la qualité des analyses graphiques reste à vérifier. Au-delà de la démo va falloir que des ENSAE testent la capacité d’omni à voir les tendances et la saisonnalité sur des graphiques. En revanche, son avis sur le design d’une brochure ou d’une slide PowerPoint pourrait être très précieux, la transformant en un “stagiaire graphiste” avec un œil critique. A suivre donc !

En conclusion

Ces nouveautés d’OpenAI, bien que variées et parfois polarisantes, apportent des améliorations significatives aux outils existants. La réduction des coûts, l’amélioration des performances, et l’accessibilité accrue des GPTs et des fonctionnalités vocales et visuelles offrent des perspectives prometteuses pour une utilisation professionnelle et personnelle. Restons attentifs aux évolutions futures et à l’impact de ces innovations sur nos méthodes de travail et de communication.

    Les réponses aux questions posées dans ce questionnaire sont nécessaires et seront utilisées uniquement pour répondre à votre demande de contact. Les informations recueillies sont destinées exclusivement à la société Absilis (propriétaire du site iaenaction.fr), responsable du traitement de ces données. Conformément au Règlement Général sur la Protection des Données (RGPD), vous disposez des droits d’accès, de rectification, et de suppression des informations qui vous concernent. Vous avez également le droit de retirer votre consentement au traitement de vos données à tout moment, ce qui inclut le droit de demander que nous cessions de vous contacter si vous avez opté pour cette possibilité. Pour exercer ces droits ou pour toute question sur le traitement de vos données, vous pouvez contacter Absilis par email à contact @ absilis.fr. Nous nous engageons à garantir la sécurité et la confidentialité de vos données personnelles. Aucune information n’est publiée, échangée, transférée, cédée ou vendue à des tiers sans votre autorisation explicite. Seule l’hypothèse du rachat d’Absilis et de ses droits autoriserait la transmission de ces informations à l’éventuel acquéreur qui serait également tenu de la même obligation de conservation et de modification des données. Nous vous remercions pour votre confiance.