Microsoft ha annunciato il lancio dei suoi primi modelli di AI sviluppati internamente: MAI-Voice-1 AI e MAI-1-preview. Questo rappresenta un passo significativo per l'azienda, che mira a consolidare la propria posizione nel campo dell'intelligenza artificiale.
MAI-Voice-1 è un modello vocale che, secondo Microsoft, è in grado di generare un minuto di audio in meno di un secondo utilizzando una singola GPU. Questa efficienza lo rende particolarmente adatto per applicazioni che richiedono la sintesi vocale rapida e realistica. Microsoft sta già sfruttando questo modello per alcune funzionalità, come Copilot Daily, dove un host AI legge le principali notizie del giorno, e per generare discussioni in stile podcast per spiegare vari argomenti. Gli utenti possono provare MAI-Voice-1 su Copilot Labs, dove possono personalizzare il testo, la voce e lo stile di pronuncia del modello. Oltre a questo, Microsoft ha presentato MAI-1-preview, un modello addestrato su circa 15.000 GPU Nvidia H100, progettato per seguire istruzioni e fornire risposte utili alle domande di tutti i giorni.
Secondo Mustafa Suleyman, responsabile di Microsoft AI, lo sviluppo di questi modelli interni è focalizzato sul creare qualcosa che funzioni estremamente bene per il consumatore, con l'intento di costruire modelli che fungano da veri e propri assistenti personali. Microsoft prevede di integrare MAI-1-preview in Copilot e ha anche iniziato a testarlo pubblicamente sulla piattaforma di benchmarking AI LMArena.
Tuttavia, l'ambizione dell'azienda va ben oltre i singoli modelli e si inserisce in una strategia molto più ampia. Il CEO di Microsoft, Satya Nadella, ha incaricato Jay Parikh, ex dirigente di Meta, di guidare una profonda trasformazione aziendale incentrata sull'AI. La visione di Parikh è quella di costruire una "fabbrica di agenti AI" per i clienti di Microsoft. Questo concetto ridefinisce la piattaforma Microsoft, sfruttando GitHub, Copilot e Azure AI per consentire alle aziende di "costruire la propria fabbrica per creare agenti". Si tratta di un cambiamento fondamentale rispetto al passato, quando l'AI veniva semplicemente aggiunta ad applicazioni esistenti. Ora, l'obiettivo è partire dal modello di AI come elemento centrale dello sviluppo.
Questa trasformazione interna sta avvenendo a un ritmo serrato, con Parikh che spinge i team di sviluppo a riorientare il modo in cui creano i prodotti per supportare questa nuova visione. L'idea è superare la fase dei semplici chatbot, che spesso non hanno generato un ritorno sull'investimento, per passare a modelli molto più avanzati e integrati.
Questo sforzo colloca Microsoft al centro di una competizione serrata per dominare quella che è considerata la prossima ondata dell'informatica. Aziende come Google, OpenAI e Anthropic stanno tutte correndo verso un futuro in cui gli agenti AI automatizzeranno compiti e gestiranno parti della nostra vita digitale. È una corsa dall'esito incerto, ma come afferma Parikh, l'azienda che imparerà più velocemente sarà quella che offrirà il maggior valore ai propri clienti.