IA GENERATIVA: LLMs VS SLMs

10 octubre 2024 | 09.00h a 10.00h

Una bona part de les aplicacions d’IA generativa es basen en models de llenguatge de gran mida (LLM), com per exemple, les diferents versions del GPT d’Open-AI. Entrenar models d’aquesta naturalesa requereix inversions milionàries que estan a l’abast d’un reduït nombre d’empreses o institucions.

Els models de llenguatge reduïts, o Small Language Models (SLMs), requereixen menys potència computacional tant per al seu entrenament com en la seva operativa i desplegament i, tot i presentar algunes limitacions en la complexitat de les tasques que poden realitzar, en alguns casos d’ús els SLMs estan esdevenint una alternativa als LLMs.

En aquesta sessió veurem exemples reals o casos d’ús d’aplicacions que il·lustren la utilització de LLMs o SLMs i s’analitzen aspectes com l’eficiència, rendiment, desplegament o capacitats de raonament a l’hora de triar una opció o l’altra.

Presenta:

  • José Perona, Data and analytics Manager – Generative AI, NTT DATA

Participen:

  • Oriol Alàs, Researcher Applied Artificial Intelligence (AAI), Eurecat

  • Karina Gibert, Catedràtica, Directora d’IDEAI- UPC i Degana del COEINF

  • Ramon Serrallonga,CTO & Chief AI Scientist, InnoAnalytiX

Ponents

ORIOL ALÀS

Researcher Applied Artificial Intelligence (AAI), Eurecat

És investigador a la unitat d’Intel·ligència Artificial Aplicada (AAI) d’Eurecat. És graduat en Enginyeria Informàtica amb especialitat en computació i màster en Enginyeria Informàtica, tots dos per la Universitat de Lleida (UdL). Des de la seva arribada a Eurecat, ha estat involucrat en projectes d’analítica de dades, intel·ligència artificial i enginyeria de dades. Actualment treballa en projectes de visió artificial i processament de llenguatge natural aplicant models i algorismes d’última generació per abordar reptes com ara la detecció d’objectes, la detecció d’anomalies o la generació de dades.

Adaptació dinàmica de text amb fRAGments: un enfocament modular per a la generació augmentada per la recuperació

Presentem fRAGments, una arquitectura modular de generació augmentada amb recuperació (RAG) que aprofita els SLM per adaptar de manera flexible les bases de dades locals de text a assistents de text desplegats localment. Aquesta arquitectura pretén superar dos grans reptes: permet la configuració automàtica d’aquests sistemes independentment dels fitxers locals emmagatzemats, i mitiga els inconvenients associats als sistemes basats en núvol.

KARINA GIBERT

Catedràtica, directora d’IDEAI i degana del COEINF

Catedràtica de la Universitat Politècnica de Catalunya-BarcelonaTech (UPC).  Llicenciada i doctora en Enginyeria Informàtica amb especialitats en Estadística Computacional i intel·ligència artificial. Postgrau en Docència Universitària. Membre de l’equip de treball governamental Catalonia.AI (oct 2018-) i membre del grup d’experts que escriuen el Pla estratègic d’IA de Catalunya (Gencat, aprovat el 28/2/2020). Degana del Col·legi Oficial d’Enginyeria Informàtica de Catalunya (COEINF) i exvicedegana de Big Data, Ciència de Dades i intel·ligència artificial (2017-2020-). Secretària i cofundadora del centre de recerca en Ciència intel·ligent de dades i intel·ligència artificial (IDEAI) (cot 2017-). Fundadora de la Comissió dones COEINF per a l’escletxa de gènere en Enginyeria Informàtica (maig 2018-), membre de la comissió de gènere de la Intercol.legial (2019-) i altres comissions de gènere. Membre electe de la junta directiva de l’Intl Environmental Modeling and Software Society (iEMSs, a partir de juliol de 2016). Assessora del High Level Expert Group d’intel·ligència artificial de la Comissió Europea (setembre de 2019-) en temes d’ètica de la intel·ligència artificial i del Senat Espanyol.

La tensió entre Big Data i el Small Data en els models de llenguatge

Tradicionalment, l’explosió que hem viscut en l’àmbit de la IA en els últims anys està basada en l’existència del Big Data, els models de llenguatge no són una excepció. El desplegament de la IA generativa descansa sobre bases de dades enormes per a poder entrenar els models de llenguatge- Però ens trobem que en realitat el món no és tant Big Data com voldríem i sovint hi ha entorns sense Big Data disponible on la IA hi té molt a dir. I també hi ha aplicacions de la lingüística computacional en llengües més petites. El català en realitat estaria a mig camí i estabilitzar els algorismes de llenguatge per a llengües minoritàries o més petites o mitjanes com és el català, presenta els seus reptes. En aquesta xerrada es reflexionarà sobre les limitacions per a les llengües més petites, de la IA generativa dels models de llenguatge i les alternatives que la IA ofereix en aquestes circumstàncies.

RAMON SERRALLONGA

CTO & Chief AI Scientist, InnoAnalytiX

És llicenciat en economia per la Universitat Autònoma de Barcelona i MBA per ESADE Business School. La seva carrera professional internacional s’ha desenvolupat en el sector tecnològic en diferents indústries, centrant-se en la intel·ligència artificial durant els últims 9 anys, i exercint responsabilitats tant directives com tècniques. És cofundador d’InnoAnalytiX i actualment exerceix com a CTO i Chief AI Scientist.

Revolucionant el Management amb només un SLM

Moltes empreses pateixen per extreure el poder de la IA generativa quan intenten resoldre tasques concretes pel seu negoci. Descobrirem la recepta per obtenir el que vols de la IA generativa i dins del teu pressupost, utilitzant un cas d’èxit en consultoria de gestió. Responent a preguntes habituals com: hem d’utilitzar un model propietari o un de codi obert? Hem d’utilitzar RAG o fine-tuning? Hem d’utilitzar un LLM o un SLM? I molt més.

Presenta

JOSÉ PERONA

Data and analytics Manager – Generative AI, NTT DATA

José Perona es va graduar com a enginyer de telecomunicacions a la Universitat Carlos III de Madrid, amb més de 8 anys d’experiència dedicats a la intel·ligència artificial. Ha treballat en robòtica social, participant en projectes juntament amb el MIT Media Lab, i la seva carrera ha estat especialitzada en processament de llenguatge natural (NLP) i computer vision amb una trajectòria enfocada a adoptar la tecnologia més disruptiva. Entre les seves responsabilitats actuals destaquen el lideratge de projectes relacionats amb la IA Generativa i la coordinació del centre d’innovació en models de llenguatge (LLMs) per a la regió dEMEAL.