I repository GitHub privati sono ancora raggiungibili tramite Copilot dopo essere stati resi privati
I ricercatori di sicurezza hanno scoperto che migliaia di repository GitHub, che una volta erano accessibili pubblicamente ma da allora sono stati resi privati, rimangono accessibili tramite strumenti basati sull’intelligenza artificiale come GitHub Copilot. Questo problema evidenzia la natura persistente dell’esposizione dei dati su Internet, dove le informazioni, anche se pubbliche per un breve periodo, possono essere conservate e utilizzate dai sistemi di intelligenza artificiale generativa molto tempo dopo essere state limitate.
GitHub Copilot, sviluppato da GitHub in collaborazione con OpenAI e Microsoft , è un assistente di codifica basato sull'intelligenza artificiale che suggerisce frammenti di codice e completamenti agli sviluppatori. È stato addestrato su un vasto corpus di codice disponibile al pubblico, consentendogli di fornire suggerimenti contestualmente rilevanti. Tuttavia, questi dati di training includono codice proveniente da repository che erano pubblici al momento del training ma che da allora sono stati resi privati. Di conseguenza, Copilot potrebbe comunque generare suggerimenti di codice basati sul contenuto di questi repository ora privati.
Questa situazione solleva notevoli preoccupazioni circa la privacy e la sicurezza dei dati. Gli sviluppatori che hanno inavvertitamente esposto informazioni sensibili in archivi pubblici, anche per un breve periodo, potrebbero scoprire che questi dati sono stati acquisiti da modelli di intelligenza artificiale ed è ancora possibile accedervi indirettamente tramite strumenti come Copilot. Ciò sottolinea l’importanza di prestare attenzione quando si condivide il codice pubblicamente e le sfide legate alla completa ritrattazione delle informazioni una volta che sono state esposte online.
In risposta a queste preoccupazioni, GitHub ha implementato funzionalità per migliorare la trasparenza e il controllo sui suggerimenti di codice generati dall’intelligenza artificiale. Ad esempio, Visual Studio ora supporta il riferimento al codice per i completamenti di GitHub Copilot, consentendo agli sviluppatori di verificare se i suggerimenti sono basati su codice pubblico, il che potrebbe avere implicazioni sulla licenza. Questa funzionalità fornisce informazioni dettagliate su eventuali corrispondenze di codice pubblico trovate, consentendo agli sviluppatori di prendere decisioni informate sull'incorporazione del codice suggerito nei loro progetti.
Nonostante queste misure, l’incidente serve a ricordare la natura duratura dei dati una volta resi pubblici. Si consiglia agli sviluppatori di rivedere attentamente il proprio codice per verificare la presenza di informazioni sensibili prima di renderlo pubblico e di essere consapevoli che, anche dopo aver reso privato un repository, i dati precedentemente esposti potrebbero essere ancora accessibili tramite strumenti di intelligenza artificiale addestrati su dati pubblici precedenti.
Fonte: Techcrunch
Grazie per essere un lettore di Ghacks. Il post I repository GitHub privati sono ancora raggiungibili tramite Copilot dopo essere stati resi privati è apparso per la prima volta su gHacks Technology News .