Rubati 4 TB di registrazioni vocali da Mercor: cosa rischia chi lavora con l'AI

Quarantamila persone che guadagnano addestrando modelli di intelligenza artificiale si sono svegliate con una brutta sorpresa: i loro campioni vocali, le loro interviste video e i loro documenti d'identità sono stati rubati. È accaduto a Mercor, una startup da 10 miliardi di dollari che funge da intermediaria tra aziende tech e contractor che forniscono dati per addestrare sistemi AI. Secondo quanto riportato da State of Surveillance, l'attacco ha compromesso 4 terabyte di materiale sensibile attraverso una vulnerabilità in una libreria open source molto utilizzata nel settore.

Chi è Mercor e come è avvenuto l'attacco

Mercor è una piattaforma che connette aziende che sviluppano sistemi AI con contractor sparsi nel mondo. Questi ultimi svolgono compiti come registrare campioni vocali, rispondere a interviste video, o fornire dati per migliorare modelli di linguaggio. È un mercato del lavoro parallelo, cresciuto insieme all'esplosione dell'AI negli ultimi anni.

L'attacco non è stato un furto diretto dei server Mercor, bensì un attacco alla supply chain. I criminali hanno sfruttato una vulnerabilità in LiteLLM, una libreria open source molto popolare tra gli sviluppatori che lavorano con modelli linguistici. Compromettendo questa libreria, gli attaccanti hanno ottenuto accesso ai sistemi di Mercor e a quelli di altri clienti che la utilizzavano. Una volta dentro, hanno scaricato 4 TB di dati: non solo file audio, ma anche video di interviste, numeri di previdenza sociale (SSN) e documenti d'identità.

Cosa rende questo breach particolarmente grave

A differenza di un furto di password o indirizzi email, questi dati sono biometrici e identificativi. Una registrazione vocale può essere usata per creare un deepfake vocale convincente, utile per attacchi di social engineering o frodi telefoniche. I video delle interviste, combinati con SSN e documenti, offrono tutto ciò che serve per un furto d'identità sofisticato.

Il fatto che riguardi contractor che lavorano nel settore AI aggiunge un ulteriore livello di rischio: molti di loro potrebbero avere accesso a informazioni su progetti in corso, modelli in sviluppo, o roadmap aziendali. Un criminale potrebbe usare questi dati per fingersi uno di loro e ottenere accesso a sistemi più sensibili.

La risposta delle grandi aziende è stata rapida e drastica. Meta, uno dei principali clienti di Mercor, ha congelato tutti i contratti di data labeling con la piattaforma. È un segnale chiaro: il fiducia è rotta, e le conseguenze economiche potrebbero essere significative.

Perché questo riguarda anche chi non lavora per Mercor

Questo breach illumina un problema strutturale nel settore AI: la fragilità della supply chain. LiteLLM è una libreria open source mantenuta da volontari e usata da migliaia di aziende. Una vulnerabilità in uno strumento così centrale può avere effetti a cascata su decine di servizi.

Per gli utenti finali di servizi AI, il rischio diretto è basso: i vostri dati personali non erano su Mercor. Ma il breach evidenzia quanto sia fragile l'infrastruttura su cui poggiano molti sistemi moderni. Se una libreria open source usata da startup e aziende tech può essere compromessa così facilmente, cosa protegge i vostri dati quando li caricate su un servizio cloud o un'app AI?

Il precedente più vicino è l'attacco a SolarWinds del 2020, quando una vulnerabilità in un software di gestione IT usato da migliaia di aziende ha permesso ai criminali di accedere a reti governative e aziendali. Anche allora, il danno è stato amplificato dalla posizione centrale dello strumento compromesso.

Cosa aspettarsi nei prossimi mesi

Mercor dovrà affrontare indagini legali, probabilmente in più paesi. I contractor coinvolti avranno diritto a servizi di monitoraggio del credito e protezione dall'identità. Ma la domanda più grande è: come cambierà il settore?

È probabile che le aziende tech intensifichino i controlli sulla sicurezza delle loro dipendenze software. GitHub e altre piattaforme di hosting di codice stanno già spingendo per migliori pratiche di verifica dei manutentori open source. Potrebbero emergere standard più rigidi per chi gestisce librerie critiche.

Per i contractor, il messaggio è semplice: i vostri dati biometrici e identificativi sono preziosi. Se li fornite a una piattaforma, assicuratevi che abbia standard di sicurezza solidi. E se ricevete offerte di lavoro da persone che dicono di essere contractor di Mercor, verificate due volte: potrebbero essere criminali che usano i dati rubati per fingersi qualcun altro.

Il settore AI continuerà a crescere, e con esso cresceranno anche i dati sensibili in circolazione. Questo breach è un promemoria che la sicurezza non è un optional, ma un prerequisito.

📰 Fonti

  1. Hacker News4TB of voice samples just stolen from 40k AI contractors at Mercor
  2. news.ycombinator.com4TB of voice samples just stolen from 40k AI contractors at Mercor
  3. reddit.comInflux of AI generated content and its harmful effects on legitimate ...
  4. stateofsurveillance.orgYour AI Job Interview Got Stolen: $10 Billion Startup Mercor Breached ...
  5. reddit.comWarhammer Maker Games Workshop Bans Its Staff From Using AI in Its ...
  6. facebook.comGames Workshop caught using AI generated art and Warhammer fans