Come funziona l’algoritmo di TikTok

Un documento interno all’azienda racconta –nel dettaglio– come funziona  l’algoritmo di TikTok, ossia le scelte che premiano i contenuti diffusi dell’app video di maggior successo al mondo.

Gli obiettivi principali che governano l’algoritmo di TikTok sono quattro:  “user value“, “long-term user value“, “creator value” e “platform value”. Questi quattro punti chiariscono ai dipendenti dell’azienda cinese come questa App video è riuscita a costruire un prodotto così avvincente.

“TikTok Algo 101” è il dossier prodotto dagli ingegneri di Pechino che rivela nel dettaglio il funzionamento dell’algoritmo di TikTok

La portavoce dell’azienda Hilary McQuaide ne ha confermato l’autenticità e ha affermato che è stato scritto per spiegare proprio ai dipendenti meno tecnici come funziona l’algoritmo.

È la prima volta che vengono spiegati i dettagli di quella che attualmente è l’app dominante nel mercato delle app video. Sono messi in luce aspetti del cuore matematico dell’applicazione, ma anche di quanto l’azienda dietro a Tiktok sia arrivata a comprendere riguardo alla natura umana – le nostre tendenze alla noia, la nostra sensibilità rispetto a determinati aspetti culurali – fattori che spiegano perché sia così difficile “staccarsi” dall’app.

Se sei tra i miliardi di persone che ogni mese spendono il loro tempo su Tiktok, saprai già quanto quest’app giochi un ruolo centrale nella diffusione della cultura giovanile e in generale nella cultura digitale.
Tiktok è un flusso senza fine di video e, a differenza della maggior parte degli altri social che sta rimpiazzando, privilegia l’intrattenimento rispetto all’idea di connessione con gli altri.

Tiktok conosce la mia sessualità (molto meglio di me stesso!)

Che tu sia interessato al socialismo, ai trucchi su Excel o al sesso, alle politica nazionalista o alla tua celebrity del cuore, TikTok è terribilmente intelligente nel leggere le tue preferenze e guidarti in uno dei vari meandri del flusso di video creati. È impressionante come TikTok sia capace di svelare i desideri dei propri utenti, anche quelli sconosciuti agli utenti stessi. A questo proposito il sito “The TikTok Algorithm Knew My Sexuality Better Than I Did” raccoglie una serie di reazioni di persone ce si meravigliano della capacità dell’app di mettere ai raggi x la propria vita intima.

TikTok ha condiviso pubblicamente le linee generali del suo sistema di video consigliati, affermando che tiene conto di fattori tra cui “Mi piace” e commenti, nonché informazioni sui video come didascalie, suoni e hashtag. Un recente rapporto del Wall Street Journal ha dimostrato come TikTok faccia molto affidamento su quanto tempo trascorri a guardare ogni video per poi indirizzarti su altri contenuti in grado di catturare la tua attenzione. Questo processo a volte può portare i giovani spettatori in pericolose “tane del coniglio”, in particolare verso contenuti che promuovono il suicidio o l’autolesionismo: problemi che TikTok afferma contrastare eliminando in modo aggressivo i contenuti che violano i suoi termini di servizio.

Il documento spiega in modo schietto che l’obiettivo finale” dell’azienda è quello aggiungere sempre più utenti attivi quotidianamente. Per farlo si è scelto di ottimizzare due metriche strettamente correlate al flusso dei video: la prima è la “retention” ovvero la propensione di un utente a ritornare su un contenuto già visto, la seconda è il “tempo trascorso” sul video.

L’app vuole tenerti lì il più a lungo possibile. L’esperienza è talvolta descritta come una dipendenza, anche se sappiamo che è la stessa critica mossa alla maggior parte della cultura pop. Il drammaturgo David Mamet, scrivendo sarcasticamente su quella che definisce “pseudoarte” nel 1998 osservava che “le persone sono attratte dai film estivi perché non ti soddisfano davvero, e quindi offrono l’opportunità di ripetere la compulsione”.

Per gli analisti che credono che i suggerimenti di un algoritmo rappresentino una minaccia sociale, il documento di TikTok conferma i sospetti.

“Secondo questo approccio il tempo di visualizzazione è fondamentale. L’algoritmo cerca di rendere le persone dipendenti piuttosto che dare loro ciò che vogliono veramente”, ha affermato Guillaume Chaslot, il fondatore di Algo Transparency, un gruppo con sede a Parigi che ha studiato il sistema di contenuti consigliati di YouTube e nello specifico ha una visione pessimistica dell’effetto di questo tipo di prodotto, sui ragazzi in particolare. Chaslot ha esaminato il documento TikTok su richiesta ed ha concluso questo:

“Penso che sia un’idea folle lasciare che l’algoritmo di TikTok guidi la vita dei nostri ragazzi”, ha detto. “Per ogni video che un ragazzo guarda, TikTok ottiene un’informazione su di lui. In poche ore, l’algoritmo può rilevare i suoi gusti musicali, da chi è attratto fisicamente, se è depresso, se è sotto effetto di droghe e molte altre informazioni sensibili. C’è un alto rischio che alcune di queste informazioni vengano usate contro di lui. Potrebbero potenzialmente essere usate per “micro-targettizzarlo” o per renderlo ancora più dipendente dalla piattaforma stessa”.

Il documento afferma che il tempo di visualizzazione non è l’unico fattore considerato da TikTok. Ogni video presente sulla piattaforma ha un punteggio, che viene realizzato tramite un’equazione che si basa sul machine learning applicato al comportamento reale dell’utente, mixando i dati relativi a «Mi piace», commenti e tempo di riproduzione.

Questa la formula: Plike X Vlike + Pcomment X Vcomment + Eplaytime X Vplaytime + Pplay X Vplay.

“Il sistema dei contenuti consigliati assegna punteggi a tutti i video in base a questa equazione e restituisce agli utenti i video con i punteggi più alti”, afferma il documento. “Per brevità, l’equazione mostrata in questo documento è molto semplificata. L’effettiva equazione in uso è molto più complicata, ma la logica alla base è la stessa”.

Il documento illustra in dettaglio come l’azienda dietro TikTok modifica il suo sistema per identificare e sopprimere i “like bait” – ovvero i video progettati per ingannare l’algoritmo chiedendo esplicitamente alle persone di mettere mi piace – e come invece procede attraverso richieste meno dirette.

“Alcuni creator potrebbero produrre di video con determinati riferimenti culturali, di conseguenza gli utenti possono comprendere meglio quei riferimenti solo guardando più video dell’autore stesso. Pertanto, il valore totale acquisito da un utente guarda tutti quei video è superiore alla semplice somma della visione di ognuno dei video”, afferma il documento. “Un altro esempio: se a un utente piace un certo tipo di video e l’app continua a inviargli quello stesso tipo di contenuto, si annoierebbe rapidamente e chiuderebbe l’app. In questo caso, il valore totale creato dall’utente guardando lo stesso tipo di video è inferiore a quello della visione di ogni singolo video, perché la ripetitività porta alla noia”.

“Ci sono due soluzioni a questo problema”, prosegue il documento. “Fai alcune ipotesi e scomponi il valore nell’equazione del valore. Ad esempio, in termini di esposizione ripetuta, potremmo aggiungere un valore “stesso_autore_visto” e, per il problema della noia, potremmo anche aggiungere un valore negativo “stesso_tag_oggi”. Potrebbero funzionare anche altre soluzioni oltre all’equazione del valore, come la raccomandazione forzata negli utenti ‘ per te feed e dispersione ecc. Ad esempio, il problema della noia può essere risolto attraverso la dispersione.

Come funziona il punteggio di qualità attribuito ad un video da TikTok

Un altro grafico nel documento indica che la “monetizzazione dei creatori” è uno degli obiettivi dell’azienda, un suggerimento che TikTok potrebbe favorire in parte i video se sono redditizi, non solo quelli divertenti.

Julian McAuley, professore di informatica all’Università della California di San Diego, che ha anche esaminato il documento, ha affermato in un’e-mail che il documento era poco dettagliato su come esattamente TikTok produce le sue previsioni, ma che la descrizione del suo motore di contenuti consigliati è “Roba totalmente ragionevole, ma tradizionale.” Il vantaggio dell’azienda, ha affermato, deriva dalla combinazione del machine learning con “volumi di dati fantastici, utenti altamente coinvolti e un ambiente digitale in cui gli utenti sono disposti a consumare contenuti consigliati dagli algoritmi (pensa a quante poche altre app o social network hanno tutte queste caratteristiche!). Non una semplice magia algoritmica.

McAuley ha aggiunto di essere un po’ perplesso sul motivo per cui le persone gli chiedano sempre di TikTok.

“Sembra esserci una percezione (da parte dei media? o del pubblico?) Che quelli di TikTok abbiano decifrato un codice magico per i contenuti consigliati, ma la maggior parte di ciò che ho visto sembra abbastanza normale”, ha scritto.

E in effetti, il documento fa molto per demistificare il tipo di sistema di consigli che le aziende tecnologiche spesso presentano come incredibilmente difficile da comprendere per i critici e le autorità di regolamentazione, ma che in genere si concentra su funzionalità che qualsiasi utente ordinario può capire. Quello che è trapelato sul funzionamento del Diario di Facebook, ad esempio, ha dimostrato come la decisione di Facebook di dare più peso ai commenti abbia aiutato a diffondere contenuti divisivi. Sebbene i modelli possano essere complessi, non c’è nulla di intrinsecamente sinistro o incomprensibile nell’algoritmo di raccomandazione di TikTok delineato nel documento.

Ma il documento chiarisce anche che TikTok non ha fatto nulla per recidere i suoi legami con il suo genitore cinese, ByteDance, la cui proprietà è diventata un focus spasmodico alla fine dell’amministrazione del presidente Donald J. Trump nel 2020, quando ha tentato di forzare la vendita di TikTok a una società americana alleata con la sua amministrazione, Oracle.

Nel documento TikTok ci sono anche una serie di domande ad un manager di ingegneria che (da quello che dice la sua biografia su LinkedIn) afferma di lavorare sia su TikTok che sull’app cinese molto simile Douyin dell’azienda ByteDance, offrendo uno sguardo al restante elemento globale di un settore tecnologico sempre più diviso, il talento ingegneristico. Secondo LinkedIn, il manager di ingegneria ha frequentato l’Università di Pechino, ha conseguito un master in informatica alla Columbia University e ha lavorato per Facebook per due anni prima di approdare a ByteDance a Pechino nel 2017. Il documento è scritto in un inglese chiaro, ma non madrelingua, ed è condizionato dal punto di vista dell’industria tecnologica cinese. Non fa riferimento, ad esempio, a rivali con aziende americane come Facebook e Google, ma include una discussione su “se Toutiao/Kuaishou/Weibo hanno fatto qualcosa di simile, possiamo lanciare la stessa strategia che hanno fatto loro?”

Il processo di sviluppo di TikTok, afferma il documento, è strettamente intrecciato con il processo di Douyin. Il documento a un certo punto fa riferimento ai dipendenti di TikTok al “Processo di lancio per la strategia di contenuti consigliati di Douyin” e si collega a un documento aziendale interno che si dice sia “lo stesso documento per TikTok e Douyin”.

I dipendenti di TikTok sono anche profondamente intrecciati nell’ecosistema di ByteDance. Usano un prodotto ByteDance chiamato Lark, un sistema di comunicazione interna aziendale come Slack ma con caratteristiche di gestione delle prestazioni aggressive volte a costringere i dipendenti a utilizzare di più il sistema. C’è, ad esempio, un grafico che ti dice se hai eseguito azioni, come l’apertura di messaggi, in più o in meno rispetto ai tuoi colleghi.

La preoccupazione per la tecnologia di consumo cinese è bipartisan negli Stati Uniti. L’ordine esecutivo del presidente Trump che tentava di vietare l’app nell’agosto 2020 avvertiva che la “raccolta di dati di TikTok minaccia di consentire al Partito Comunista Cinese l’accesso alle informazioni personali e proprietarie degli americani”. Il governo cinese potrebbe “costruire dossier di informazioni personali per ricatti e condurre spionaggio aziendale”, ha affermato. Quel divieto si è bloccato in tribunale ed è svanito dopo le elezioni presidenziali. Il presidente Biden ha revocato l’ordine esecutivo, ma la sua amministrazione ha quindi annunciato la propria indagine sulle minacce alla sicurezza poste da TikTok, con un alto funzionario dell’amministrazione senza nome che ha detto ai giornalisti che la Cina stava “lavorando per sfruttare le tecnologie digitali e i dati americani in modi che presentano rischi inaccettabili per la sicurezza nazionale .”

In una dichiarazione inviata via e-mail, la signora McQuaide ha affermato che “sebbene ci sia qualche elemento in comune nel codice, le app TikTok e Douyin vengono eseguite completamente separatamente, su server separati e nessuno dei due codici contiene dati utente”.

Ha anche affermato: “TikTok non ha mai fornito dati utente al governo cinese, e noi non lo avremmo fatto se richiesto”.

TikTok, il cui amministratore delegato vive a Singapore, ha assunto una serie di dirigenti ed esperti di sicurezza americani ed europei ben collegati mentre la pressione politica si è intensificata sotto Trump. Dice che non ha una sede formale. Ha cercato di lenire le preoccupazioni americane archiviando i dati degli utenti negli Stati Uniti, con un backup a Singapore.

Le preoccupazioni per la sicurezza del governo americano si presentano in due forme. Il primo, come ha suggerito Trump nel suo ordine esecutivo, è se la vasta raccolta di dati in possesso di TikTok – come ad esempio sui desideri sessuali privati dei fan dell’app che potrebbero finire per diventare funzionari pubblici americani – debba essere vista come un questione di sicurezza nazionale. Non ci sono prove che i dati siano mai stati utilizzati in questo modo e TikTok non è certo l’unico posto in cui gli americani condividono i dettagli delle loro vite sui social media. La seconda preoccupazione è se TikTok censura i post politicamente sensibili.

Un rapporto di quest’anno di Citizen Lab, l’organizzazione di controllo della sicurezza informatica di Toronto, ha suggerito che entrambe queste preoccupazioni sono, nella migliore delle ipotesi, latenti: non ha trovato alcuna indicazione che TikTok stesse censurando argomenti sensibili o trasmettendo dati alla Cina.

Ma gli scorci di TikTok sulla vita interiore delle persone sono insoliti. Un altro screenshot condiviso con me indica che i suoi moderatori dei contenuti hanno accesso non solo ai video pubblicati pubblicamente, ma anche ai contenuti inviati agli amici o caricati sul sistema ma non condivisi, a differenza di app come WhatsApp e Signal che forniscono end-to-end crittografia.

La seconda domanda è se il governo cinese potrebbe utilizzare la piattaforma per diffondere propaganda. Dopo essere stato sorpreso a censurare un video che condanna la detenzione di massa di minoranze musulmane in Cina, TikTok ha consentito critiche al governo del Paese. Ad esempio, l’hashtag #whereispengshuai, un riferimento alla star del tennis cinese che ha accusato un importante leader cinese di violenza sessuale, si completa automaticamente nel sistema, anche se i video di TikTok con quell’hashtag hanno poche visualizzazioni. Non esiste un modo indipendente per dire se la società sta sopprimendo la ricerca, che ha molto più coinvolgimento su Twitter ma allo stesso modo poco su Instagram.

Alcuni analisti americani vedono TikTok come una profonda minaccia; altri lo vedono come il tipo di panico inaspettato che gli americani che ora si avvicinano alla mezza età hanno dovuto affrontare quando i loro genitori li hanno avvertiti che se avessero condiviso i dettagli delle loro vite sui social media, non avrebbero mai trovato un lavoro. Molti, moltissimi altri prodotti, dai social network alle banche e alle carte di credito, raccolgono dati più precisi sui propri utenti. Se i servizi di sicurezza stranieri volessero quei dati, probabilmente potrebbero trovare un modo per acquistarli dall’oscura industria dei broker di dati.

“Andare fuori di testa per la sorveglianza o la censura di TikTok è una distrazione dal fatto che questi problemi sono molto più grandi di qualsiasi azienda specifica o della sua proprietà cinese”, ha affermato Samm Sacks, un membro della politica di sicurezza informatica presso l’organizzazione di ricerca New America. “Anche se TikTok fosse di proprietà americana, non esiste alcuna legge o regolamento che impedisca a Pechino di acquistare i suoi dati sul mercato dei broker di dati aperti”.

Una conclusione che viene scrivendo questo articolo: la minaccia che TikTok rappresenta per la sicurezza nazionale americana sembra essere del tutto ipotetica e dipende dalla tua analisi sia delle relazioni USA-Cina che del futuro della tecnologia e della cultura. Ma la comprensione dell’algoritmo su ciò che ci tiene agganciati – tra colpi di tennis, video di cibo turco e tutte le altre cose che ci siamo trovati a guardare in modo ossessivo – ha rappresentato un pericolo chiaro e presente per la nostra capacità di finire di leggere proprio questo articolo.

Correlati

La più grande mostra mai fatta su Bruno Munari

C’era questo signore di Milano che guardava una fotocopiatrice e ci vedeva una macchina fotografica dadaista, guardava un tubo di tessuto industriale …

Intelligenza Artificiale nell'Arte

Nell’era digitale, l’intelligenza artificiale (IA) si è fatta strada in ogni ambito della nostra vita, incluso quello artistico. Se da un lato …

Intelligenza Artificiale e Design: come sopravviveremo a questa imminente pandemia creativa

La nuova frontiera della creatività indaga l’odissea del progetto, nel regno del design potenziato dall’Intelligenza Artificiale. Perché se collaborare con il machine …

This is KreativeHouse

We are creative. We solve problems through creativity and marketing processes. We campaign great contents that address cultural and social issues. We are into art, fashion and nonprofit.

Facebook