Microsoft ha annunciato il rilascio di due nuovi modelli nella famiglia Phi chiamati Phi-4-multimodal e Phi-4-mini. Si tratta nello specifico di SLM (Small Language Models) che sono stati progettati per offrire capacità di intelligenza artificiale avanzate agli sviluppatori, mantenendo un’elevata efficienza e costi contenuti.
Le caratteristiche dei due nuovi modelli AI di Microsoft
Phi-4-multimodal è il primo modello multimodale di Microsoft. Esso è in grado di elaborare simultaneamente input composti da testo, voce e immagini. Con 5,6 miliardi di parametri, questo SLM utilizza delle tecniche di apprendimento cross-modale per fornire interazioni più naturali e contestualizzate.
Phi-4-multimodal è disponibile su Azure AI Foundry di Microsoft, Hugging Face e nel catalogo API di NVIDIA. Tra le sue capacità vi è quella di interpretare il linguaggio colloquiale come quella di analizzare immagini e processare informazioni testuali in un’unica architettura unificata. Tale approccio consente un’inferenza altamente efficiente e a bassa latenza, ottimizzata per l’esecuzione su dispositivi locali con un ridotto consumo computazionale.
Phi-4-mini, con 3,8 miliardi di parametri, è invece un modello di tipo transformer decoder-only, progettato per compiti legati prioritariamente ai contenuti testuali. Nonostante le dimensioni molto compatte, offre delle prestazioni elevate in attività legate al ragionamento, alla matematica, al coding e alla comprensione delle istruzioni che gli vengono fornite dagli utenti.
Supporta sequenze fino a 128 mila token e garantisce accuratezza e scalabilità. La sua efficienza lo rende ideale per applicazioni AI avanzate sui dispositivi con risorse computazionali limitate.
I principi di base nello sviluppo dei modelli
Entrambi i modelli sono stati sviluppati in conformità con i principi di AI responsabile di Microsoft, che includono accountability, trasparenza, equità, affidabilità e sicurezza, privacy e inclusività.
Sono stati sottoposti inoltre a test di sicurezza e affidabilità da parte di esperti interni ed esterni, utilizzando strategie sviluppate dal Microsoft AI Red Team. Questi metodi, affinati attraverso le versioni precedenti dei modelli Phi, hanno coinvolto tutte le lingue supportate e coprono ambiti come la cybersicurezza, la sicurezza nazionale, l’equità e la violenza.