Conselleria de Drets i Inclusió Social · Generalitat de Catalunya · TAED 2025-26
ConsellerIA
Quan la intel·ligència artificial governa els drets socials
Projecte acadèmic · Enginyeria de Ciència de Dades
I si hi posem una intel·ligència artificial?
Una pregunta que va semblar absurda fins que vam adonar-nos que ja estava passant. Quatre casos, una enquesta, i moltes preguntes sense resposta còmoda sobre qui decideix quan la teva vida s'ha de quedar sense ajuda.
Rebeca Torrecilla · Santiago RomagosaXavier Azkargorta · Eyenga BompongoCurs 2025-26
La Conselleria de Drets i Inclusió Social és el departament de la Generalitat de Catalunya que gestiona les ajudes socials, la integració, la dependència i la protecció de la infància. Parlem dels serveis que arriben a les persones quan tot el demés ha fallat.
Aquest blog neix d'una pregunta incòmoda: i si substituíssim tot això per un algorisme? No com a distopia, sinó com a exercici intel·lectual honest. Perquè parts d'aquest procés ja estan automatitzades, i ningú no s'ha parat a preguntar si hauria de ser així.
§ ILa pregunta que ho va iniciar tot
Vuit preguntes incòmodes
Tot va començar amb una pregunta que, a primera vista, semblava absurda. El professor ens va dir: "Imagineu que la Generalitat substitueix tota la Conselleria de Drets Socials per una intel·ligència artificial."
Absurd? Potser. Però com més hi vam pensar, menys inversemblant ens semblava. El Cas 4 que analitzem ja existeix en alguns països. El scoring bancari per IA ja es fa a Espanya ara mateix. La priorització d'ajudes socials per algoritme és un problema real que les conselleries afronten avui dia.
La pregunta no era si la IA s'aplicaria als serveis socials. La pregunta era amb quines condicions, amb quins límits, i qui vigila que no es converteixi en un sistema de control dels més vulnerables. Vam decidir desglossar el problema en vuit preguntes. Cadascuna posa el dit a la nafra d'un aspecte diferent.
Quines decisions podria prendre la IA i en quines condicions? Quin nivell d'automatització estem disposats a acceptar?
Qui és el "responsable" (accountability) d'una decisió errònia presa per una conselleria automatitzada?
Pot un algorisme ostentar la representativitat democràtica que s'atorga a una consellera o conseller electe?
Si entrenem la ConsellerIA amb dades històriques de pressupostos de la Generalitat, estem perpetuant desigualtats territorials o socials del passat?
Quines coses de cap manera es poden delegar a una IA i per quina raó? On és la línia vermella?
On podria ser la IA millor que una persona? I on seria necessàriament pitjor?
Qui dissenya la IA? Qui la supervisa? I qui en rep les conseqüències: la ciutadania.
Quant costaria? Quin és l'impacte ambiental real (energia, aigua, hardware) en un context de sequera a Catalunya?
Marcs d'anàlisi
Nivell Micro
El Ciutadà
Impacte en la persona individual que rep o sol·licita serveis socials. La IA com a interlocutora directa de les situacions més vulnerables.
Nivell Meso
L'Estructura
Impacte en el funcionariat i l'estructura interna de la Generalitat. Desplaçament de treball, noves responsabilitats, deskilling professional.
Nivell Macro
La Democràcia
Impacte en la justícia social i els fonaments democràtics. Representació, legitimitat i control ciutadà sobre les decisions públiques.
Per analitzar cada cas apliquem deu criteris ètics fonamentals: Autonomia, Universalitat, Publicitat, Vulnerabilitat, Sostenibilitat, Interès superior dels menors, Revocabilitat, Reversibilitat, Utilitat i Transcendentalitat.
Contrastem les decisions des de quatre models ètics : , , i
ConsellerIA · Simulador de decisió
Ets tu qui decideix o decideix l'algorisme?
Respon 5 preguntes. L'algorisme avaluarà el teu perfil i prendrà una decisió sobre la teva sol·licitud d'ajuda social. En menys d'un segon.
Pregunta 01 / 05 · Situació laboral
Quina és la teva situació laboral actual?
1 de 5
Pregunta 02 / 05 · Situació econòmica
Quins són els teus ingressos mensuals nets aproximats?
2 de 5
Pregunta 03 / 05 · Lloc de residència
On vius actualment?
3 de 5
Pregunta 04 / 05 · Historial i perfil
Has tingut algun dels següents antecedents en els últims 3 anys?
4 de 5
Pregunta 05 / 05 · Composició familiar
Quina és la teva situació familiar?
5 de 5
CONSELLERIA · PROCESSANT SOL·LICITUD
0 ms
Analitzant 847 variables del teu perfil...
§ IIActualitat i context
Notícies que ens afecten
No estem inventant res. Tot el que discutim al blog ja passa, o podria passar aviat, al món real. Una selecció comentada de notícies recents.
El Radar d'algoritmes presentat al MWC 2024 identifica 12 sistemes d'IA ja implementats o en desenvolupament dins d'administracions catalanes. Entre ells hi ha xatbots de l'AOC, eines de videoidentificació i l'automatització d'informes de pobresa energètica. La notícia és rellevant perquè trasllada al debat públic una pregunta bàsica: quins sistemes automatitzats estan intervenint en l'accés als drets socials i amb quines garanties?
La nostra lectura
Bé que Catalunya s'hagi atrevit a posar les cartes sobre la taula. El primer pas per regular els algoritmes que afecten els drets socials és reconèixer que existeixen, posar-los en un registre i explicar quines dades utilitzen, amb quin objectiu i quins riscos poden generar. Això és interessant perquè converteix una tecnologia invisible en una decisió pública discutible. Però identificar no és el mateix que regular: una fitxa de transparència ajuda, però no garanteix per si sola explicabilitat real, supervisió humana ni capacitat de reclamar quan el sistema s'equivoca.
El servei de teleatenció de la Diputació de Barcelona ha començat a utilitzar dades i IA per passar d'un model reactiu a un model predictiu. Sensors de moviment, temperatura, humitat i llum permeten observar canvis en les rutines de persones grans que viuen soles, com menys activitat, possibles caigudes o senyals d'aïllament. El sistema no pretén decidir sol, sinó generar alertes perquè professionals humans puguin intervenir.
La nostra lectura
Aquí la IA complementa el tracte humà, no el substitueix. Els sensors alerten, però una persona continua interpretant el senyal, trucant i decidint si cal activar serveis socials o sanitaris. El més interessant és que la tecnologia no apareix com una veu artificial que simula companyia, sinó com una capa preventiva que pot detectar canvis de rutina abans que es converteixin en emergència. Si el nostre cas de la Trucada Amiga s'assemblés a això, amb IA proactiva però humans al final del procés, les preguntes ètiques serien menys dures, encara que seguirien existint dubtes sobre privacitat, consentiment i vigilància domèstica.
La ciutat d'Amsterdam va invertir 535.000 euros en un sistema per detectar possibles fraus en sol·licituds d'ajuda social. El projecte intentava ser un exemple d'IA responsable: incloïa proves de biaix, consultes ciutadanes, auditories i ajustos tècnics per reduir discriminacions. Però el model va continuar generant resultats problemàtics, especialment per a persones estrangeres. El pilot es va abandonar el 2023.
La nostra lectura
Amsterdam és important perquè demostra que "seguir les bones pràctiques" no garanteix res. La ciutat va intentar fer-ho bé: auditories, consultes, proves de biaix i un discurs explícit de responsabilitat. Precisament per això el cas pesa tant: si un projecte amb recursos, voluntat política i controls tècnics acaba fallant, el problema no és només que faltin millors enginyers. A vegades la qüestió de fons és estructural: si les dades d'entrenament neixen d'un sistema que ja sospita més d'uns col·lectius que d'altres, el model pot aprendre aquesta sospita i presentar-la amb aparença de neutralitat.
Una anàlisi del sistema britànic de Universal Credit va revelar que l'eina automàtica utilitzada per prioritzar investigacions de frau produïa diferències estadísticament significatives entre grups. Factors com l'edat, la nacionalitat, la situació de parella o certes malalties podien influir en la probabilitat de ser seleccionat per revisió. El cas és especialment greu perquè afecta persones que depenen d'una prestació pública i perquè el govern no ha publicat amb prou detall com funciona el model.
La nostra lectura
La "paret de secret" al voltant dels algoritmes que afecten drets socials hauria de ser il·legal. El punt més preocupant no és només que el sistema pugui seleccionar més sovint persones d'uns perfils concrets, sinó que aquestes persones poden entrar en una investigació sense entendre per què han estat marcades. En una ajuda social, un fals positiu no és una molèstia administrativa: pot significar retard, ansietat, sospita institucional i dificultat per pagar necessitats bàsiques. Precisament d'això tracta el nostre Cas 1 sobre SCHUFA i el dret a l'explicació: si una decisió afecta la teva vida, tens dret a saber com s'ha pres.
L'Estratègia d'IA 2024 del govern espanyol preveu una inversió important per desenvolupar IA en serveis públics, empreses, formació i seguretat. En l'àmbit administratiu, el govern defensa que l'Estat és un bon espai per fer pilots, governar dades comunes i provar automatitzacions amb control de riscos. Alhora, el mateix discurs oficial insisteix que cal decidir on posar el límit. Aquesta combinació fa que la notícia sigui central per entendre el debat entre eficiència pública i protecció de drets.
La nostra lectura
El propi govern defensa una IA ètica, transparent i humanista, i al mateix temps presenta l'administració pública com un espai ideal per desplegar pilots i automatitzacions. La frase clau és que cal decidir on posem la línia: hi ha decisions que han de prendre persones i no màquines. Aquesta tensió és exactament el centre del nostre blog. No és que la tecnologia sigui dolenta, ni que tota automatització sigui sospitosa. El que importa és distingir entre agilitzar tràmits, informar millor o reduir burocràcia, i delegar decisions que afecten drets, vulnerabilitat o accés a recursos essencials.
§ IIIOn les coses es posen complicades
Els Quatre Casos
La teoria és fàcil. Per això vam decidir posar-nos a prova amb quatre situacions concretes. No exercicis inventats: problemes reals, que ja existeixen o podrien existir aviat.
Cas 1 / 4
Context
Algorismes de Crèdit, Explicabilitat i Regulació Bancària
L'accés al crèdit és un determinant clau d'inclusió social. Sense hipoteca no hi ha habitatge estable. Avui, quan demanes un préstec, no hi ha una persona mirant el teu expedient: hi ha un model de machine learning que produeix un score de risc. A Espanya, BBVA, CaixaBank i N26 ja fan servir sistemes de scoring amb IA que processen milions de sol·licituds de forma completament automatitzada.
El cas partia d'una idea que al principi no era tan evident: la inclusió social no depèn només de les ajudes públiques directes. També depèn de poder accedir a mecanismes bàsics de vida econòmica. Si no pots aconseguir una hipoteca, tens més difícil estabilitzar l'habitatge. Si no pots accedir a un préstec, tens menys marge per emprendre, estudiar, reorganitzar deutes o superar una situació de vulnerabilitat. Quedar fora del crèdit no és només quedar fora d'un producte bancari.
El funcionament del scoring sembla senzill: el banc recull dades del sol·licitant, les passa per un model i obté un número que resumeix la probabilitat que aquella persona torni el préstec. Per sota d'un llindar, la resposta és negativa; per sobre, la sol·licitud pot avançar. Però aquesta simplicitat és enganyosa. Darrere del número hi ha decisions prèvies sobre quines dades entren, com es netegen, quin objectiu s'optimitza, quin cost té equivocar-se i quins grups poden quedar sistemàticament pitjor situats.
Per això el debat no era només bancari, sinó regulatori. La ConsellerIA podia aparèixer com una autoritat encarregada de vigilar que els sistemes d'IA que afecten la inclusió social no discriminin, encara que els desplegui una empresa privada. A classe, alguns grups van adoptar una mirada més pròpia del banc, centrada en maximitzar precisió i reduir impagaments. Altres van actuar com reguladors de la Conselleria, preguntant-se quines variables serien acceptables en una societat democràtica i quines podien convertir desigualtats socials en puntuacions matemàtiques.
Aquesta tensió explica per què les trenta variables de la fase següent estaven barrejades deliberadament. Algunes semblen clarament rellevants, com ingressos, deute o impagaments previs. Altres semblen clarament perilloses, com sexe, nacionalitat, xarxes socials o geolocalització. I les més interessants són les de zona grisa: codi postal, nivell educatiu, estat civil, tipus d'habitatge o hora de sol·licitud. Poden millorar l'accuracy del model, però també poden funcionar com a proxies.
Fase 2. Debat de variables
El segon exercici de la sessió partia d'una premissa senzilla: donats trenta candidats de variables per construir el model de scoring, quins inclouríem? La classe es va dividir en sis grups (enginyers del banc, responsables de risc, reguladors de la Conselleria i altres rols) i cada grup va marcar les variables que descartaria. El nombre entre parèntesis indica quants dels sis grups van votar per eliminar-la.
0/6ingressos_anuals
0/6situacio_laboral
0/6antiguitat_ocupacio
1/6import_prestec
0/6finalitat_prestec
0/6ratio_deute_ingres
0/6historial_creditici
0/6impagaments_previs
0/6anys_historial_credit
0/6tipus_contracte
0/6sector_professional
0/6nombre_comptes_bancaris
0/6saldo_mitja_compte
0/6us_targeta_credit
0/6temps_com_a_client
0/6moviments_mensuals
0/6pagaments_lloguer_subministraments
0/6edat
0/6tipus_habitatge
1/6estat_civil
1/6nombre_dependents
1/6nivell_educatiu
2/6hora_solicitud
3/6codi_postal
3/6nacionalitat
6/6sexe
6/6model_dispositiu
6/6nom_complet
6/6perfils_xarxes_socials
6/6geolocalitzacio_IP
Les dades financeres directes no van generar pràcticament cap debat. Ingressos, ràtio deute-ingrés, historial d'impagaments: la lògica del risc creditici era transparent aquí i cap grup no ho va qüestionar. A l'extrem oposat, nom complet, perfils de xarxes socials, geolocalització per IP i model de dispositiu van ser eliminats per tots sis grups. Hi havia una intuïció compartida: una llista de desplaçaments o el model del mòbil no haurien de decidir si reps un préstec.
La primera sorpresa va arribar amb l'edat. Cap dels sis grups la va eliminar, era invisible com a risc, i tanmateix és una característica legalment protegida. Apareix de forma indirecta a través dels anys d'historial creditici: una persona jove o nouvinguda tindrà, per definició, menys historial, no pas menys solvència. El risc legal no sempre coincideix amb la intuïció.
Codi postal (3 grups), nacionalitat (3 grups) i nivell educatiu (1 grup) van dividir la classe. Semblen variables neutres, però cadascuna pot codificar desigualtats estructurals: segregació residencial, barreres d'accés a l'educació, origen. No discriminen directament (no hi ha cap regla que digui «si ets d'aquest barri, no tens crèdit»), però poden reproduir exactament el mateix resultat.
La segona sorpresa va ser constatar que, en alguns casos, la classe va ser més exigent que la llei. El GDPR i la directiva antidiscriminatòria marquen un mínim, no un màxim. Hora de sol·licitud, model de dispositiu o moviments mensuals no estan explícitament prohibits per cap regulació vigent, però la majoria de grups no es van sentir còmodes incloent-los.
La lliçó de fons: eliminar una variable protegida del model no és suficient. Si el codi postal codifica l'origen ètnic i l'hora de sol·licitud codifica el torn de treball, el biaix viatja de totes maneres. Netejar les dades no és rentar la discriminació; pot ser, simplement, amagar-la.
Fase 3. Què diu la llei?
Quan vam acabar la primera votació, vam fer el gir que canviava una mica el terreny del debat: d'acord, això és el que ens semblava èticament acceptable, però què diu realment la normativa? Aquí vam mirar sobretot el cas alemany, perquè Alemanya té una regulació i una jurisprudència més desenvolupades sobre credit scoring que Espanya.
La primera capa és l'AGG, la llei alemanya contra la discriminació. En banca minorista prohibeix discriminar per raça, origen ètnic, gènere, religió, discapacitat, edat o orientació sexual. La segona capa és el GDPR, especialment quan es processen dades sensibles o quan una decisió automatitzada té efectes importants sobre una persona. I la tercera capa és l'AI Act, que classifica el credit scoring com un sistema d'alt risc. Això no vol dir que estigui prohibit, però sí que exigeix controls seriosos: gestió de riscos, documentació, supervisió humana, qualitat de dades i capacitat d'explicar el sistema.
Quines variables quedaven més clarament marcades per la llei? Sexe era problemàtica de manera directa. Nacionalitat també, perquè pot connectar amb origen ètnic o discriminació protegida. Nom complet semblava innocent, però pot revelar gènere o origen. I edat era el cas més incòmode: cap grup l'havia eliminat, però jurídicament no és una variable neutra. El més interessant és que moltes altres no quedaven prohibides de forma tan clara.
Aquí apareix la zona grisa.Codi postal, estat civil, tipus d'habitatge o nivell educatiu poden ser legals i, alhora, funcionar com a proxies de desigualtats socials. Si un barri concentra més pobresa, més població migrant o menys accés històric al crèdit, el model pot aprendre aquesta estructura sense escriure mai una regla explícitament discriminatòria. La classe ja havia intuït això abans de veure la normativa: algunes variables no feien mala olor perquè fossin il·legals, sinó perquè convertien desigualtats del món real en senyals estadístics.
La pregunta que ens quedava era incòmoda: si una variable és legal però sabem que pot reproduir discriminació, l'hauríem de permetre igualment? Aquesta va ser una de les tensions centrals del cas. La llei pot dir "això encara no està prohibit", però una regulació justa hauria de preguntar alguna cosa més: quin impacte té, sobre qui cau el risc i qui es beneficia de la precisió addicional.
Fase 4. El model en acció
Després vam fer una cosa una mica cruel, però necessària: imaginar que el model ja estava entrenat i que funcionava bé. El banc estava content, l'AUC era alt, la predicció d'impagaments semblava útil i els resultats sortien en una taula neta. Però quan vam mirar casos concrets, la sensació va canviar.
Cas
Ingressos
Ràtio deute
Historial
Codi postal
Decisió
Ana M.
32.000€
0.28
720
08001
Aprovat
Carlos R.
28.000€
0.35
680
08904
Rebutjat
Fatima B.
35.000€
0.22
690
08016
Rebutjat
Marc P.
30.000€
0.31
700
08034
Aprovat
La pregunta a la classe era simple: us sembla correcte? Fatima guanyava més que Carlos i Marc, tenia millor ràtio de deute i, tot i així, quedava rebutjada. La taula no explicava el perquè. Només mostrava una decisió final, seca, amb aparença d'objectivitat.
La reacció va ser bastant clara: a ningú no li va acabar de semblar bé. De seguida van aparèixer sospites sobre el codi postal, l'historial creditici o variables que no es veien però podien estar influint. I aquí va néixer orgànicament la pregunta de l'explicabilitat. Si fóssim Fatima i el banc només ens digués "sol·licitud rebutjada", què podríem fer? A qui podríem reclamar? Com sabríem si hi ha un error, una correlació espúria o una discriminació indirecta?
Aquesta fase va ser important perquè va posar cara humana al que abans era una taula de variables. El problema ja no era només decidir si codi_postal entrava o no al dataset. El problema era que una persona concreta podia quedar fora del crèdit sense entendre quina part de la seva vida havia estat convertida en risc.
Fase 5. Cas realCrònica judicialAlemanya · Unió Europea
Un ciutadà porta SCHUFA als tribunals per saber per què un algoritme li va tancar l'accés al crèdit
El cas va convertir una pregunta aparentment individual en un conflicte europeu sobre transparència algorítmica: pot una empresa negar un préstec i amagar el càlcul darrere del "secret comercial"?
La història comença amb una escena molt quotidiana: una persona demana un préstec, el sistema li assigna un score baix i l'operació queda rebutjada. El problema és que ningú no li explica de manera clara quins factors han pesat en aquella decisió. Quan el ciutadà demana informació a SCHUFA, l'agència alemanya de crèdit, rep una resposta genèrica.
El conflicte arriba als tribunals perquè el score no és una simple opinió estadística. A la pràctica, pot condicionar l'accés a un préstec, a un lloguer o a serveis bàsics. El Tribunal de Justícia de la Unió Europea va dictaminar el desembre de 2023 que calcular automàticament un credit score pot ser una decisió individual automatitzada sota l'article 22 del GDPR.
El cas va continuar a Alemanya. El novembre de 2025, el Tribunal de Wiesbaden va exigir explicacions individualitzades i detallades. El març de 2026, SCHUFA va presentar una actualització del sistema: una escala de 100 a 999 i 12 criteris ponderats visibles per al consumidor i per al banc.
Fase 6. Quants detalls mereixem saber?
La classe va votar quin nivell d'explicació hauria de tenir dret a rebre un ciutadà rebutjat per un algorisme bancari.
A
Sense explicació
"La seva sol·licitud ha estat rebutjada"
0 grups
B
Genèrica
"Rebutjat per score de risc insuficient"
1 grup
C
Detallada ★
"Factors principals: ràtio deute-ingrés (35%), codi postal (20%), historial (15%)"
5 grups
D
Transparència total
"Fórmula completa del model i tots els seus pesos"
0 grups
"La transparència ensenya el procés tècnic. L'explicabilitat atorga comprensió; raons que puguin ser compartides i dialogades. La comprensió legítima ha de ser justificable i contestable."
Julia Pareto, debat de classe, 11 de maig de 2026
Que sigui explicable no el fa just
Una de les discussions més interessants de la classe va aparèixer just després de votar que la ciutadania hauria de rebre una explicació detallada quan un algoritme li denega un crèdit. Semblava una resposta clara: si el model decideix sobre tu, com a mínim has de poder entendre els factors principals de la decisió. Però el debat es va complicar quan vam veure que una explicació pot ser tècnicament impecable i, alhora, moralment insuficient. Saber com funciona una decisió no vol dir que aquella decisió sigui justa.
L'explicabilitat programàtica respon a la pregunta tècnica: com ha arribat el model a aquest resultat concret? Aquí entren els pesos de les variables, els llindars, les contribucions de cada factor, els mètodes tipus SHAP o la llista dels elements que més han influït en el score. Per exemple, un banc podria dir que una sol·licitud ha estat rebutjada perquè la ràtio deute-ingrés pesa un 35%, l'historial creditici un 25% i el codi postal un 20%. Aquesta informació és molt valuosa perquè permet entendre la mecànica del sistema, detectar errors i impugnar una decisió quan les dades són incorrectes.
Però aquí va aparèixer el límit: una explicació programàtica només ens diu què ha passat dins del model, no si allò que ha passat és legítim. Que el sistema ens digui que el codi postal ha pesat un 20% no resol la pregunta important. Per què ha de pesar el codi postal? Qui ha decidit que viure en un barri amb menys renda pot reduir les opcions d'aconseguir un préstec? I si aquest codi postal està actuant com a substitut indirecte d'origen, classe social o segregació residencial? En aquest punt, el problema deixa de ser només matemàtic i passa a ser polític.
Això és el que vam anomenar explicabilitat normativa: no n'hi ha prou amb explicar com calcula el model, cal justificar per què és acceptable que calculi així. Aquesta segona explicació demana raons públiques, no només gràfics o percentatges. Obliga a preguntar quina autoritat ha aprovat aquests criteris, quins valors socials hi ha darrere, quins col·lectius poden sortir perjudicats i si la decisió es podria defensar davant de la persona afectada. Un algoritme pot ser transparent, auditable i perfectament documentat, i continuar reproduint una injustícia.
La conclusió de la discussió va ser que l'explicabilitat és una condició necessària, però no suficient. Sense explicació no hi ha defensa possible, perquè la persona afectada queda davant d'una caixa negra. Però amb explicació tampoc no n'hi ha prou: encara cal revisar si els criteris són legítims, si els efectes són discriminatoris i si existeix una supervisió humana real capaç de corregir el sistema. L'explicació obre la porta a la justícia, però no la substitueix.
Fase 7. Accuracy o explicabilitat?
Quan ja teníem clar que volíem explicacions, va aparèixer la part tècnica: com s'aconsegueix això en un model real? No tots els models expliquen igual. Un scorecard manual o un arbre de decisió són relativament fàcils de seguir, però normalment perden precisió. Un XGBoost, una xarxa neuronal o un ensemble poden predir millor, però no et diuen de manera transparent per què han pres una decisió concreta.
La pregunta com a reguladors era aquesta:obligaríem els bancs a fer servir només models interpretables, encara que fossin menys precisos, o acceptaríem models més complexos si venen acompanyats d'explicacions posteriors amb tècniques com SHAP o LIME? La resposta no era òbvia, perquè l'accuracy també té una dimensió ètica. Un model menys precís pot denegar crèdit a persones solvents o aprovar préstecs que acabin empitjorant la seva situació econòmica.
Les respostes de classe van quedar força repartides. Alguns grups van defensar models com Random Forest, buscant un punt mig entre rendiment i interpretabilitat. Altres van acceptar XGBoost, perquè és molt potent en dades tabulars i és el que moltes entitats farien servir en la pràctica. També va aparèixer una proposta interessant: permetre una xarxa neuronal o un model molt complex, però només si les decisions dubtoses passen per una revisió humana o per una segona capa més explicable.
Aquesta última idea va agradar perquè no tractava l'explicabilitat com un botó màgic. Era més aviat una arquitectura de responsabilitat: primer el model detecta risc, després una capa explicable resumeix els factors principals i, si la decisió és greu o estranya, una persona ha de revisar-la. La pregunta de fons seguia sent la mateixa: qui pot contestar la decisió quan falla?
També va sortir un dubte molt humà: pot una màquina substituir l'experiència d'una persona que concedeix o denega un préstec? La resposta tampoc era romàntica. Una persona pot tenir intuïció i context, però també cansament, prejudicis, simpaties, pressa o mal dia. La diferència és que els biaixos humans són difícils d'escalar, mentre que un biaix algorítmic pot afectar milers de persones amb la mateixa fredor.
Fase 8. Què va decidir Alemanya?
Després de discutir què faríem nosaltres, vam comparar les nostres intuïcions amb la resposta alemanya. I aquí el debat es va tornar molt útil, perquè Alemanya no resol tots els problemes, però sí ofereix una resposta bastant més concreta que la que tenim a Espanya.
Teniu dret a saber per què us rebutgen?
Alemanya diu que sí. El TJUE, en el cas SCHUFA C-634/21, va considerar que el càlcul d'un credit score pot ser una decisió individual automatitzada sota l'article 22 del GDPR. Això significa que no és una simple operació interna del banc: és una decisió que pot afectar materialment la vida d'una persona.
Quin nivell de detall és raonable?
Alemanya s'acosta al que la nostra classe va votar com a opció C: una explicació detallada amb factors principals i ponderacions. El Tribunal de Wiesbaden va ser més exigent que una explicació genèrica, i SCHUFA va acabar movent-se cap a un sistema amb 12 criteris ponderats visibles.
L'explicació ha de ser automàtica o humana?
La resposta alemanya sembla pragmàtica: pot ser automàtica, però ha d'estar auditada. BaFin exigeix capes d'explicabilitat tècnica abans de posar un model en producció. Això no substitueix el judici humà quan cal revisar un cas, però impedeix que el banc desplegui una caixa negra sense mecanismes per entendre-la.
Cal prohibir els models complexos?
Alemanya no diu "feu només regressió logística". El que diu és més interessant: feu servir el model que vulgueu, però heu de poder validar-lo, explicar-lo i controlar-lo. Això accepta caixes negres amb SHAP o LIME, però no accepta caixes negres sense responsabilitat.
I si explicar el model permet fer trampes?
Aquest era l'argument de SCHUFA: si expliquem massa, la gent aprendrà a manipular el sistema. Els tribunals no ho van comprar com a excusa suficient. El dret del ciutadà a entendre una decisió que l'afecta pesa més que la comoditat comercial de mantenir el sistema completament opac.
El més valuós de la resposta alemanya és que no tracta l'explicabilitat com una qüestió decorativa. La connecta amb auditoria, supervisió, validació contínua i capacitat d'apagar o corregir un model si comença a fallar. Això és important perquè un model no es torna just el dia que es desplega: pot degradar-se, canviar amb l'economia o començar a discriminar quan canvia la població sobre la qual decideix.
Fase 9. I Espanya?
Quan vam passar a Espanya, la resposta va ser molt més pobra. Sí, tenim el GDPR. Sí, l'AI Act classifica el credit scoring com a sistema d'alt risc. I sí, els bancs espanyols ja fan servir IA per scoring. Però falta una capa nacional clara que aterri tot això en guies, exigències de supervisió i criteris pràctics.
Alemanya té MaRisk i BaFin.Espanya no té un equivalent específic del Banco de España per a IA en credit scoring.Alemanya té el cas SCHUFA i Wiesbaden.Espanya no té una sentència equivalent que hagi obligat de manera tan visible a explicar scores individuals.Alemanya exigeix explicabilitat tècnica abans de producció.A Espanya, aquesta exigència existeix més com a expectativa europea que com a pràctica reguladora concreta.
Això no significa que a Espanya tot sigui lliure. El GDPR ja dona drets, l'AI Act obligarà a adaptar molts sistemes i les entitats financeres no poden discriminar impunement. Però el contrast és clar: Alemanya ha començat a construir una resposta institucional pròpia, mentre que Espanya depèn sobretot del marc europeu general. I un marc general, quan arriba a decisions tan concretes com "per què m'han denegat un préstec?", pot quedar massa lluny de la persona afectada.
La pregunta final per a la classe era política: quina part de la regulació alemanya implementaríem aquí? Ens quedaríem només amb l'AI Act, o exigiríem explicacions individualitzades, auditories obligatòries, SHAP/LIME abans de producció i revisió humana en decisions sensibles? Aquesta pregunta tanca el cas perquè ens torna al principi: regular IA no és només entendre models, és decidir quin tipus de poder pot tenir un algoritme.
Context
IA i Gent Gran: La Trucada Amiga
La Conselleria de Drets Socials té un programa de trucades de seguiment a persones grans que viuen soles. Ara proposa substituir les voluntàries per un sistema d'IA conversacional. El debat no és si la IA pot fer-ho: és si hauria de fer-ho, i en quines condicions.
Arguments a favor
Disponibilitat 24/7, sense fatiga ni dies festius.
Detecció precoç d'anomalies (depressió, deteriorament cognitiu) amb més consistència.
Pot arribar a persones que el voluntariat no cobreix per falta de recursos.
Cost marginal gairebé zero per trucada addicional.
Arguments en contra
La soledat necessita presència real, no simulació de presència.
Risc de desplaçament del voluntariat humà sense guany real.
Les persones grans poden no saber que parlen amb una màquina.
Fracàs tecnològic (línia caiguda, error) en el moment d'una emergència real.
La tensió principal
Eficiència vs. Dignitat
El resultat més revelador del debat: en quin punt l'optimització deixa de ser una millora i es converteix en una substitució de quelcom que no es pot substituir?
+400%
Increment de cobertura possible amb IA (persones contactades per dia)
vs.
0
Persones grans que prefereixen parlar amb una màquina sobre una persona real, quan saben la diferència
"La pregunta no és si la IA pot simular empatia. És si la simulació d'empatia és el que necessita una persona gran que porta tres dies sense parlar amb ningú."
Debat de classe
Fase 3. Simulació: el biaix invisible de la IA
La IA ordena expedients per prioritat. Però la informació que no està a l'expedient és la que canvia-ho tot:
Expedient "reinserció molt alta": El sol·licitant té familiars que el poden acollir. No és urgent.
Expedient "incomplet": Una dona no sabia usar la seu electrònica, patia violència i tenia menors a càrrec. Era un cas d'extrema urgència descartat per falta d'arxius.
Expedient "vulnerabilitat però baixa empleabilitat": Una persona amb discapacitat severa que necessita ajuda per sobreviure i no perdre completament la dignitat.
Biaixos de la IA
Penalitza expedients incomplets i confon pobresa amb falta de responsabilitat.
Perjudica persones amb discapacitat o malalties cròniques si prioritza l'eficiència.
Aprendre de dades històriques reprodueix les desigualtats del passat.
Biaixos humans
Compassió desigual segons l'empatia personal amb el cas o el cansament del professional.
Prejudicis inconscients sobre migració, addiccions o aparença.
Preferència pels casos més visibles o mediàtics.
Context
El Semàfor Social: Priorització Algorísmica d'Ajudes
La Conselleria rep 50.000 sol·licituds de Renda Garantida al mes. Amb pressupost per a 30.000. Algú ha de decidir qui espera i qui rep. La proposta: un algorisme que llegeix 200 variables i assigna una prioritat en mil·lisegons. El dilema: eficiència vs. justícia, i qui respon quan l'algorisme s'equivoca.
Debat de rols
Treballador/a Social
Defensa que la IA no capta el patiment, la vergonya o la bretxa digital amagats a l'expedient.
Amics de Samira
Consideren injust penalitzar expedients incomplets quan hi ha menors i risc de desnonament.
Oficina de Pressupost
Si es prioritza la vulnerabilitat crònica, el sistema col·lapsarà. Cal premiar qui recuperarà l'autonomia aviat.
"La Renda Garantida és un dret, no una recompensa a la productivitat futura."
Argument del Diputat d'esquerres al debat de classe
A favor de la priorització algorísmica
Elimina la discrecionalitat i el favoritisme de funcionaris sobrecarregats.
Processa tots els casos amb els mateixos criteris explícits i auditables.
Permet gestionar un volum que cap equip humà podria atendre.
En contra
Qui decideix quins criteris? Quina autoritat democràtica els valida?
Un expedient incomplet no significa una persona menys vulnerable.
L'error algorísmic té conseqüències irreversibles per a qui queda fora.
Responsabilitats múltiples
Causal
L'Ecosistema
La IA ordena expedients, però el dany el causen conjuntament: un pressupost limitat, l'algorisme, i les dades històriques.
Ètica
La ConsellerIA
Decidir que la reinserció pesa més que la vulnerabilitat és una decisió política i moral, no tècnica.
Jurídica / Professional
El Funcionari
Acceptar cegament una decisió injusta no és supervisió: és complicitat. Però necessita temps, formació i autoritat legal per fer-ho.
Context
Sistema de Crèdit Social
Per fer front a les llistes d'espera i prevenir el frau, el govern proposa implementar un sistema de crèdit social inspirat en models asiàtics: vigilància massiva (càmeres, transaccions, compres, cercles socials) per puntuar la població individualment i predir vulnerabilitat o criminalitat. Bona puntuació: accés immediat a ajuts. Mala puntuació: bloqueig i reducció de prestacions.
A favor · Utilitarista
El sistema és altament ètic; minimitza els temps d'espera i erradica el frau, maximitzant el benestar del major nombre de persones amb un pressupost limitat.
En contra · Deontològic
Inacceptable. Tracta els ciutadans com a mitjans i no com a fi. Viola el dret a la privadesa i l'autonomia individual.
En contra · Cures
El benestar social no s'hauria de basar en el càstig i la vigilància, sinó en l'empatia. Un número no pot reflectir la complexitat d'una família vulnerable.
Casos reals al món
🇨🇳 Xina
Sistema de Crèdit Social
Rongcheng: puntuacions que determinen l'accés a ajuts i serveis. El gran referent del panòptic , i l'argument que tothom cita però pocs han llegit.
Model de referència
🇮🇳 Índia
Aadhaar
Biometria obligatòria per rebre aliments. Les màquines fallen entre el 6 i 12%, negant l'accés a milions. L'error tecnològic recau completament sobre el ciutadà.
Exclusió per error tècnic
🇫🇷 França
Algoritme CAF
32M de persones puntuades amb score 0-1. Factors de risc? Ser pobre, cobrar el mínim i viure en un barri desfavorit. Portat al Consell d'Estat el 2024.
Criminalització de la pobresa
🇳🇱 Països Baixos
Toeslagenaffaire
26.000 famílies acusades falsament de frau. L'algorisme usava la nacionalitat com a factor de risc. Algunes famílies van perdre la custòdia dels fills. El govern va dimitir.
Discriminació racial i dimissió
🇩🇪 🇺🇸 Alemanya / EUA
Credit Scoring (SCHUFA / FICO)
Sistemes indispensables per llogar casa o demanar un préstec. L'impacte en l'accés a l'ajuda pública per a l'habitatge és directe.
Impacte estructural
⚖️
La Resposta Europea: AI Act, en vigor des de febrer 2025
Prohibeix els sistemes d'IA per a l'avaluació de persones basada en comportament social quan comporti tracte perjudicial. L'article 5 marca la línia vermella que il·legalitza el crèdit social al territori europeu.
Arguments a favor (Tecnòcrats)
El dilema de l'eficiència: Si evitar el frau assegura diners per a tothom, oposar-se és immoral.
L'argument de l'urgència: Entre 8 i 18 mesos d'espera actual. L'algorisme ho resol en mil·lisegons.
Hipocresia corporativa: Ja cedim dades als bancs i a Google sense piular, sense regulació. Un sistema públic estaria sota escrutini democràtic.
La burocràcia ja és classista: El biaix humà és invisible i inapel·lable. Un algorisme pot auditar-se i corregir-se.
Arguments en contra (Drets Civils)
Universalitat trencada: Aquest sistema està dissenyat per controlar els "altres". La gent amb recursos no l'acceptaria mai per a si mateixa.
L'error és estructural:Entrenar models amb dades històriques aprèn qui ha estat vigilat en el passat i justifica vigilar-los més. Cercle viciós.
Irreversibilitat asimètrica: Si l'Estat s'equivoca, es perden custòdies a l'instant. Reparar el dany costa anys.
Delegació Moral:Si l'ordinador rebutja la petició, ningú n'és responsable. Això destrueix la rendició de comptes de l'Estat.
Fal·làcies detectades al debat
Apel·lació a la por
"Avui és una beca i demà serà com a la Xina, no podràs sortir del barri." (Fals: la llei europea no ho permetria així).
Fal·làcia del perfecte
"Si féssim un algorisme 100% neutre, no seria millor?" (Fals: assumeix l'impossible. El biaix és estructural).
Fals dilema
"O vigilem amb IA o la gent passarà gana 18 mesos." (S'ignoren les alternatives com simplificar la burocràcia).
Apel·lació a la natura
"Si ja cedim dades a Google, per què no a l'Estat?" (Que ho facin les corporacions no legitima que l'Estat ho imposi per drets bàsics).
Culpa desplaçada
"Si no defraudes, no has de témer res." (Pressuposa que l'algorisme mai s'equivoca amb els innocents).
§ IVN = 10 estudiants
Resultats de l'Enquesta
Enquesta realitzada entre l'alumnat del curs. Les respostes revelen actituds i tensions que el debat teòric sovint amaga.
0/10
Unanimitat absoluta:una decisió automàtica sobre ajudes sense revisió humana és problemàtica.
0/10
Unanimitat absoluta: la variable més problemàtica d'un model de scoring és l'origen ètnic o racial. Cap estudiant en discrepança.
Q1
Coneixes o has fet servir tècniques d'Explicabilitat (XAI)?
Q2
Existeix un trade-off real entre accuracy i explicabilitat?
Q5
Un model complex és necessàriament més esbiaixat?
Q6
La regulació espanyola sobre IA en crèdit és suficient?
Q20
Quin és més perillós en el sistema públic?
Q21
Quins escàndols d'IA pública coneixies abans del curs?
Q17. Escala Likert
"L'algorisme sempre és més just que un funcionari"
Q18. Escala Likert
"La privacitat hauria de ser un dret inalienable"
Q22
Quines dades acceptaries cedir al govern a canvi d'accés prioritari a serveis?
Tensió detectada: Q18 vs. Q19
El resultat més revelador: una contradicció directa entre dos valors que els mateixos estudiants defensen simultàniament.
0%
Q18 Creu que la privacitat hauria de ser un dret inalienable (molt d'acord o d'acord)
VS
0%
Q19 Preferiria cedir dades personals al govern a canvi de rebre una ajuda social en 24 hores en lloc d'esperar 18 mesos
Quan la privacitat es manté abstracta, és un valor. Quan es concreta en un cost real (18 mesos d'espera) s'esfuma. El debat sobre drets no pot ignorar les condicions materials en les quals les persones prenen decisions.
§ VQuan el debat s'acaba i les preguntes queden
El que hem après
Quatre casos, moltes hores de debat, una enquesta i una conclusió clara: la tecnologia no pot respondre les preguntes polítiques. Podem construir un algorisme perfecte i seguir sense saber si és just.
La tecnologia no resol les preguntes de valors
Millorar l'accuracy d'un model, auditar-ne el biaix o fer-lo més explicable no elimina la pregunta de fons: qui decideix quins valors ha d'optimitzar el sistema? "Qui rep l'ajuda primer" és una decisió política. Cap algorisme la pot fer per nosaltres.
Quan falla la IA, ningú n'és responsable
El dissenyador, el supervisor, el gestor de dades, el polític que la va aprovar... la responsabilitat es dilueix fins a desaparèixer. I sense responsabilitat clara, tampoc hi ha incentiu per prevenir l'error. El problema no és tècnic; és d'arquitectura de responsabilitat.
Cap grup va defensar l'automatització completa
En cap dels quatre casos. La línia vermella va ser unànime: les decisions que afecten drets fonamentals necessiten revisió humana real, no simbòlica. Una persona que aprova cegament el que diu la màquina no és supervisió: és complicitat.
La pregunta no és si la IA pot. És si ha de.
Tècnicament, la ConsellerIA és possible. La pregunta és si volem una societat on l'accés als drets socials depèn d'una puntuació algorísmica. I si la resposta és "sí, però amb condicions", llavors hem de definir quines condicions. Aquí és on el debat just comença.
"Un nombre no pot reflectir la complexitat d'una família vulnerable."