Lo scraping è una tecnica, non necessariamente illegale, che consiste nell’acquisire i dati pubblici contenuti in un sito Web e di memorizzarli all’interno di un database. Tali informazioni possono essere utilizzate per vari scopi, non semple legali, come per esempio la realizzazione di applicazioni per il riconoscimento facciale (si pensi al caso Clearview).
Anche se disponibili pubblicamente, i dati personali degli utenti non possono essere sfruttati senza il loro consenso e per questo motivo le piattaforme che gestiscono grandi quantità di informazioni altrui stanno cercando delle soluzioni per bloccare lo scraping. Tra le aziende coinvolte troviamo anche Meta che ha in Facebook uno dei servizi più colpiti dal fenomeno.
Il gruppo capitanato da Mark Zuckerberg impiega oggi oltre 100 persone che si occupano di tenere a bada lo scraping, tali impiegati sono stati riuniti in un team chiamato External Data Misuse che recentemente ha implementato dei nuovi identificatori per gli utenti (PFBID) che in pratica sostituiscono i "vecchi" FBID pseudonominizzandoli.
I PFBID (Pseudonymized Facebook Identifier) operano in modo simile ai loro predecessori, diventano parte degli URL perché questi ultimi contengano un riferimento univoco agli utenti a cui sono associati. A differenza di quanto avveniva con gli FBID essi però cambiano continuamente nel tempo impedendono il funzionamento delle applicazioni automatizzate per lo scraping.
I PFBID vengono generati tramite la combinazione di un FBID e di un timestamp da cui vengono estratte le informazioni relative a data e ora, ciò consente di modificare continuamente il valore "pfbid" presente nell’URL senza però impedire ai browser Web di bloccare il tracciamento della navigazione nel caso in cui tale impostazione fosse attiva.