OpenAI Slashes the Cost of Using Its AI With a ‘Mini’ Model
Openai aujourd'hui annoncé Un modèle «mini» à prix réduit qui, selon lui, permettra à plus d'entreprises et de programmes de puiser dans son intelligence artificielle. Le nouveau modèle, appelé GPT-4O Mini et disponible à partir d'aujourd'hui, est 60% moins cher que le modèle existant d'Openai le plus bon marché tout en offrant des performances plus élevées, selon la société.
OpenAI caractérise le mouvement dans le cadre d'un effort pour rendre l'IA «aussi largement accessible que possible», mais il reflète également une concurrence croissante entre les fournisseurs de cloud AI ainsi que l'intérêt croissant pour les modèles d'IA open source gratuits et gratuits. Meta devrait débuter la plus grande version de son offre gratuite très capable, Llama 3, la semaine prochaine.
“L'intérêt d'Openai est de construire et de distribuer l'IA en toute sécurité et de le rendre largement accessible”, a déclaré à Wired Olivier Godment, chef de produit à Openai, responsable du nouveau modèle. «La mise à disposition de l'intelligence à moindre coût est l'un des moyens les plus efficaces pour nous de le faire.»
La divination dit que la société a développé une offre moins chère en améliorant l'architecture modèle et en affiner les données de formation et le régime de formation. GPT-4O Mini surpasse d'autres «petits» modèles sur le marché dans plusieurs repères communs, explique Openai.
OpenAI a pris un pied important sur le marché de l'IA cloud grâce aux capacités remarquables de son chatbot, Chatgpt, qui a fait ses débuts fin 2022. La société permet aux étrangers d'accéder au modèle grand langage qui alimente Chatgpt, appelé GPT-4O, moyennant des frais. Il propose également un modèle moins puissant, appelé GPT-3.5 Turbo, pour environ un dixième du coût de GPT-4O.
L'intérêt pour les modèles de langue déclenchés par le succès sauvage de Chatgpt a incité les concurrents à développer des offres similaires. Google, un pionnier de l'IA, a fait une poussée majeure pour construire et commercialiser un grand modèle de langue et un chatbot sous la marque Gemini. Des startups telles que Anthropic, Cohere et AI21 ont augmenté des millions pour développer et commercialiser leurs propres modèles de langues importants auprès des clients et des développeurs.
La construction des modèles de grande langue les plus performants nécessite d'énormes ressources financières, mais certaines entreprises ont choisi d'ouvrir leurs créations afin d'attirer des développeurs dans leurs écosystèmes. Le modèle d'IA open source le plus important est le lama de Meta; Il peut être téléchargé et utilisé gratuitement, mais sa licence impose certaines limites à l'utilisation commerciale.
En avril, Meta a annoncé Llama 3, son modèle gratuit le plus puissant. La société a publié une petite version du modèle avec 8 milliards de paramètres – une mesure approximative de la portabilité et de la complexité d'un modèle – ainsi qu'une version plus puissante et de taille moyenne de 70 milliards de dollars. Le modèle de taille moyenne est proche de la meilleure offre d'Openai sur plusieurs scores de référence.
Plusieurs sources ont confirmé à Wired que Meta prévoit de publier la plus grande version de Llama 3, avec 400 milliards de paramètres, le 23 juillet, bien qu'ils disent que la date de sortie pourrait changer. On ne sait pas à quel point cette version de Llama 3 sera capable, mais certaines entreprises ont tourné leur attention vers des modèles d'IA open source car ils sont moins chers et personnalisables, et offrent un plus grand contrôle sur un modèle et les données qu'elle est alimentées.
La divination concède que les besoins des clients évoluent. «Ce que nous voyons de plus en plus sur le marché, ce sont les développeurs et les entreprises combinant de petits et grands modèles pour créer la meilleure expérience de produit au prix et à la latence qui leur ont du sens», dit-il.
Godment dit que les offres cloud d'Openai offrent aux clients des modèles qui ont subi plus de tests de sécurité que celui des concurrents. Il ajoute qu'Openai pourrait éventuellement développer des modèles que les clients peuvent exécuter sur leurs propres appareils. «Si nous voyons une demande massive, nous pouvons ouvrir cette porte», dit-il.