Tutto Internet ora appartiene all’intelligenza artificiale di Google

Google Bard viene mostrato al Google I/O 2023.

L’ultimo aggiornamento di Google alla sua politica sulla privacy farà in modo che l’azienda abbia campo libero per raschiare il web per qualsiasi contenuto che possa trarre vantaggio dalla costruzione e dal miglioramento dei suoi strumenti di intelligenza artificiale.

“Google utilizza le informazioni per migliorare i nostri servizi e sviluppare nuovi prodotti, funzionalità e tecnologie a vantaggio dei nostri utenti e del pubblico”, afferma la nuova politica di Google. “Ad esempio, utilizziamo le informazioni pubblicamente disponibili per aiutare ad addestrare i modelli di intelligenza artificiale di Google e creare prodotti e funzionalità come Google Translate, Bard e le funzionalità di Cloud AI”.

Gizmodo osserva che la politica è stata aggiornata per dire “modelli AI” quando in precedenza diceva “per i modelli linguistici”. Inoltre, la politica ha aggiunto Bard e Cloud AI, quando in precedenza menzionava solo Google Translate, per il quale raccoglieva dati.

L’informativa sulla privacy, che è stata aggiornata durante il fine settimana, appare particolarmente inquietante perché indica che qualsiasi informazione che produci online è in palio per Google da utilizzare per addestrare i suoi modelli di intelligenza artificiale.

La suddetta formulazione sembra descrivere non solo quelli dell’ecosistema Google in un modo o nell’altro, ma è dettagliata in modo tale che il marchio possa avere accesso alle informazioni da qualsiasi parte del web.

Le questioni principali che circondano lo sviluppo di massa dell’intelligenza artificiale sono questioni sulla privacy, il plagio e se l’IA può dissipare informazioni corrette. Le prime versioni di chatbot come ChatGPT si basano su modelli di linguaggio di grandi dimensioni (LLM) che utilizzavano fonti già pubbliche, come l’archivio Web di scansione comune, WebText2, Books1, Books2 e Wikipedia come dati di addestramento.

Il primo ChatGPT era famigerato per essere rimasto bloccato sulle informazioni oltre il 2021 e successivamente aver riempito le risposte con dati falsi. Questo potrebbe probabilmente essere uno dei motivi per cui Google vorrebbe un accesso illimitato ai dati web a vantaggio di strumenti come Bard, per avere una formazione nel mondo reale e potenzialmente in tempo reale per i suoi modelli di intelligenza artificiale.

Gizmodo ha anche notato che Google potrebbe utilizzare questa nuova politica per raccogliere contenuti vecchi, ma ancora generati dall’uomo, come recensioni o post di blog dimenticati da tempo, per avere ancora un’idea di come il testo e il parlato umani vengono sviluppati e distribuiti. Tuttavia, resta da vedere esattamente come Google utilizzerà i dati che raccoglie.

Diverse piattaforme di social media, tra cui Twitter e Reddit, che sono le principali fonti di informazioni aggiornate, hanno già limitato il loro accesso pubblico sulla scia della popolarità dei chatbot AI , con dispiacere di tutte le loro comunità.

Entrambe le piattaforme hanno chiuso l’accesso gratuito alle loro API, il che impedisce agli utenti di scaricare enormi quantità di post da condividere altrove, con il pretesto di proteggere la loro proprietà intellettuale. Questo invece ha rotto molti degli strumenti di terze parti che fanno funzionare senza problemi sia Twitter che Reddit.

Sia Twitter che Reddit hanno dovuto affrontare altre battute d’arresto e controversie man mano che le preoccupazioni dei loro proprietari aumentano per il fatto che l’IA prenda il sopravvento.