Mods Are Asleep. Quick, Everyone Release AI Products

La tourmente à Openai au cours des cinq derniers jours a captivé l'industrie de la technologie et a gardé les entrepreneurs, les journalistes et toute personne qui a encore un compte X collé à ses délais pour les dernières mises à jour en emoji et missives inférieures. En attendant, certaines des sociétés d'IA les plus importantes – y compris OpenAI – ont continué à faire ce que la Silicon Valley est connue pour: laisser tomber de nouveaux produits.

Le licenciement inattendu de Sam Altman, PDG d'Openai, a été suivi d'une avalanche de nouvelles fonctionnalités d'IA de concurrents, notamment une diffusion anthropique et stable. Mardi après-midi, au milieu de l'agitation, Openai a déployé le chatppt avec des capacités vocales gratuitement pour tous les utilisateurs. OpenAI avait prélevé cela fin septembre, mais uniquement pour les utilisateurs payants. Maintenant, la mise à jour est plus répandue.

Même si Openai a dominé la conversation dans la Silicon Valley tout au long de 2023 avec ses produits de capture de zeitgeist, comme Dall-E 3 et Chatgpt propulsé par GPT-4, le chaos infligé par la décision du conseil d'administration de saper Altman et de Speedrun par le biais de nouveaux PDG a peut-être créé une fenêtre d'opportunité pour d'autres sociétés d'IA. (Malgré le fait qu'Altman soit finalement revenu pour continuer à diriger OpenAI.) Et bien que ces mises à jour de produit soient des mois en cours, le timing n'aurait pas pu être meilleur pour les concurrents d'Openai. De nombreux clients d'entreprise d'outils d'Openai, effrayés par la sortie d'Altman, a envisagé de faire un changement à Anthropic ou à un autre fournisseur pendant qu'il était absent.

«On dirait que chaque semaine, il y a quelque chose de nouveau lancé ou annoncé à partir de l'un des principaux acteurs. Je suppose donc que les lancements de la diffusion vidéo stable et de Claude 2.1 n'étaient probablement qu'une coïncidence », explique Dharmesh Shah, qui est le CTO et le cofondateur de Hubspot ainsi qu'un actionnaire d'Openai.

Claude dit la vérité

Après la sortie soudaine d'Altman, alors que le sort du leadership d'Openai est resté en flux, Anthropic a annoncé une version plus puissante de son Claude chatbotet Stabilité AI a publié un générateur de texte à vidéo appelé Diffusion vidéo stable.

Le dernier modèle d'Anthropic, Claude 2.1, a reçu deux mises à jour clés. L'une est la possibilité de télécharger plus de données à la fois sur le chatbot et moins de mensonges. La limite de jetons pour Claude est désormais fixée à 200 000 jetons, ce qui est approximativement la longueur d'un livre de 500 pages. (Désolé les fans de Tolstoy, vous devrez attendre les futures mises à jour pour analyser tout Guerre et paix Dans une seule invite.) Pour comparer, la limite de taux pour le modèle Turbo GPT-4, annoncé par Altman Pre-Firing, est plafonnée à 128 000.

Anthropic affirme également que le nouveau Claude est plus susceptible d'admettre quand il n'est pas sûr d'une réponse, plutôt que de fibre avec la plus grande confiance. «Nous avons testé l'honnêteté de Claude 2.1 en organisant un large ensemble de questions factuelles complexes qui ont sondé les faiblesses connues dans les modèles actuels», lit le billet de blog de l'entreprise. Un manque de véracité, souvent décrit comme hallucinationscontinue d'être un problème majeur pour les chatbots.

Pivot to IA Video

Bien que vous puissiez accéder à Claude 2.1 aujourd'hui, la nouvelle diffusion vidéo stable de la stabilité AI est ouverte juste aux chercheurs pour l'instant, avant que le grand public ne soit autorisé à l'essayer. Contrairement aux outils d'IA publiés par OpenAI, la stabilité AI se concentre sur le lancement de logiciels open source. Le nouvel outil d'IA de l'entreprise est similaire à Runway, un autre modèle de texte à vidéo.

Lorsque vous saisissez une invite dans un modèle de texte à video, l'IA casse des animations de type GIF qui peuvent aller de très belles à carrément dérangeantes. En plus des capacités de texte à vidéo, la diffusion vidéo stable peut transformer vos images fixes en vidéos en ajoutant un mouvement.

Parler, chatppt

Bien que ce ne soit pas techniquement une nouvelle fonctionnalité d'Openai, le L'entreprise déployée Chatgpt avec des capacités vocales à tout le monde dans la courte période tandis qu'Altman était en tant que PDG. La fonctionnalité était auparavant limitée uniquement aux utilisateurs qui ont payé le service d'abonnement à 20 $ par mois d'OpenAI, Chatgpt Plus.

Ça ne donne pas encore à Spike Jonze's Sonmais les développeurs de logiciels d'Openai ont fait un autre grand pas vers leur objectif de «multimodalité» en donnant au chatbot la possibilité de tenir une conversation avec vous. L'idée est qu'un chatbot peut être encore plus puissant s'il peut accepter les entrées et fournir des sorties dans plusieurs supports, comme la voix, le texte et les images. Qui sait quand cela apprendra à sentir.

Alors que l'année se termine, le rythme rapide de l'innovation de l'IA ne montre aucun signe de décélération. Peu de temps après que la nouvelle a annoncé qu'Altman reviendrait en tant que PDG d'Openai, Inflexion AI, un autre concurrent, a annoncé un modèle amélioré pour son chat PI. Si vous espériez une pause dans le coup de pouce des nouvelles de l'IA, ne retenez pas votre souffle.