Skip to playerSkip to main content
  • 10 hours ago
EngGPT2 è un modello basato “sull'architettura Mixture of Experts che è in grado di generare un consumo, in termini di utilizzo (inferenza), molto inferiore rispetto alla media dei modelli esistenti quando il sistema viene chiamato per risolvere un task. Parliamo di un consumo che può ridursi dal 60% all'80% in meno rispetto a quello medio di un modello di grandi dimensioni”. Sono le parole Fabio Momola, Executive Vice President di Engineering Group, all’incontro ‘AI Italia. L’AI tra innovazione e sovranità digitale’, organizzato a Roma da Engineering Group su iniziativa della senatrice Licia Ronzulli, vicepresidente del Senato della Repubblica. L’iniziativa mira a promuovere il confronto tra istituzioni, industria e mondo accademico sulla costruzione di una "via italiana" all'Intelligenza Artificiale, per un Ai sovrana, sicura e sostenibile.

Category

🗞
News
Transcript
00:04Io credo che con la nostra architettura ISIA e con NGPT ci siamo messi nelle condizioni di poter vedere la
00:11normativa, le AI in particolare, come un acceleratore all'innovazione, quindi non come un freno, per noi, per l'Italia
00:17e per l'Europa in generale.
00:18La sostenibilità è effettivamente un problema importantissimo quando parliamo di AI. Se pensiamo che i grandi modelli americani consumano solo
00:27per la fase di training, quindi di addestramento, quanto decine di famiglie europee durante un intero anno, capiamo quanto il
00:35problema sia effettivamente molto importante da affrontare, soprattutto quando le fonti energetiche per approvisionare quell'energia magari arrivano dal carbone
00:46o comunque dai combustibili fossili.
00:48Con NGPT2 abbiamo cercato di risolvere questo problema creando un modello che è basato su un'architettura chiamata Mystery of
00:56Expert, che è in grado di avere un consumo in termini di utilizzo, quindi di inferenza, quando il modello viene
01:03chiamato per risolvere un task, che è molto inferiore rispetto a quello della media dei modelli esistenti.
01:10Parliamo di un consumo che può girarsi tra il 60% e l'80% in meno rispetto al consumo
01:14medio di un modello di grande dimensione.
01:16Quello che stiamo proponendo con Isia è un'architettura aperta che permetta di mettere insieme modelli prevenienti da diverse sorgenti,
01:24ma di governare tutto il flusso di utilizzo delle AI.
01:27Con quel modello la profittabilità può essere raggiunta anche nell'arco di pochi mesi, al massimo 12-18 mesi.
Comments

Recommended