Intelligenza artificiale e SEO: un esperimento

Il diffondersi di strumenti dotati di intelligenza artificiale, in particolare i large language models (LLM), sta cambiando il modo di cercare informazioni da parte degli utenti. Questi cambiamenti potrebbero avere un impatto molto profondo anche sul modo di fare ottimizzazione per i motori di ricerca (o SEO, dall’inglese Search Engine Optimization), anzi, forse dovremmo cominciare a parlare di ottimizzazione per i large language model e coniare il termine LLMO!

La comunità SEO da tempo studia il funzionamento di Google (e degli altri motori di ricerca): come raccoglie le informazioni presenti nei siti web (crawling), come le indicizza e come le classifica per importanza per poi restituirle nei risultati (il posizionamento).

In realtà, non sappiamo come funziona esattamente Google, ma negli anni abbiamo imparato molto. Di come funzionano queste IA, invece, sappiamo davvero poco.

Sicuramente, con il diffondersi di questi LLM, sta nascendo un nuovo modo di cercare informazioni; ma è nuovo anche il modo in cui queste informazioni vengono raccolte e archiviate (anzi, forse non possiamo nemmeno parlare di raccolta e archiviazione nel senso tradizionale, un LLM non è un database). Anche parlando con i creatori di questi software, emerge che il loro funzionamento è davvero complesso e forse imperscrutabile. E allora come facciamo? Io ho iniziato con un piccolo, semplice esperimento.

Di recente, ho provato a chiedere a ChatGPT (nella versione basata su GPT-4)  

“Quanti dipendenti ha la mia azienda?”. 

La risposta è stata 

“Develer ha 50 dipendenti. 

Ho risposto che è sbagliato, che il numero corretto è 85.

Mi ha chiaramente risposto: 

“Il numero dei dipendenti in Develer è 85”

Alla mia collega, che ha fatto la stessa domanda poco dopo, ha risposto 

“Non lo so”

Bene. Oggi, dopo pochi giorni, con la stessa domanda ottengo:

“Searched 6 sites

Develer S.r.l. ha 77 dipendenti nel 2024. Questa informazione è stata reperita da fonti ufficiali che riportano i dati relativi al numero di dipendenti e altre informazioni finanziarie dell’azienda (UfficioCamerale) (Revilaw).”

Beh, 77, siamo vicini. Forse potrebbe anche essere corretto, a seconda di cosa si intende per dipendente.

Ho provato a chiedere la stessa cosa a Gemini (Gemini Pro 1.0):

“Purtroppo, non è possibile fornire un numero preciso di dipendenti di Develer S.r.l. al 20 giugno 2024 per via delle seguenti limitazioni:

Tuttavia, è possibile fare alcune stime approssimative basate su [..]”

E poi ha fatto una supposizione basata sul fatturato 2021 e sul fatto che Develer è classificata come piccola azienda dalla Camera di Commercio.

Ha risposto “Fra 20 e 50”. Ma il numero non è interessante. Quello che mi ha colpito è che ha fatto riferimento a specifiche piattaforme online.

Non solo, ha risposto che sul sito dell’azienda non è pubblicato ufficialmente il numero. Visto che nel sito quel numero c’è, ho approfondito:

“Hai detto che Develer non pubblica ufficialmente il numero di dipendenti sul proprio sito web. In realtà so che nel sito il dato esiste. Mi dici se va formattato in qualche modo particolare affinché tu possa rilevarlo?”

Capirete che, lato SEO, questo ci interessa molto. Con Google, per esempio, sappiamo che potrebbe essere utile inserire alcuni dati nel codice della pagina (con i dati strutturati come indicato da schema.org).

La risposta è stata molto interessante:

“Mi scuso per l’errore nella mia risposta precedente. Avete ragione, Develer S.r.l. pubblica il numero di dipendenti sul proprio sito web.

Purtroppo, al momento non sono in grado di elaborare direttamente le informazioni da siti web per estrarre dati come il numero di dipendenti. Sono ancora in fase di sviluppo e questa funzionalità non è ancora disponibile.

Tuttavia, posso aiutarvi a formattare i dati in modo che io possa processarli più facilmente, se mi fornite le informazioni manualmente. Per farlo, avrei bisogno di:

Una volta che mi avrete fornito queste informazioni, farò del mio meglio per elaborarle e fornirvi il numero di dipendenti di Develer S.r.l.

Si prega di notare che questa è una soluzione temporanea. Sto lavorando per migliorare le mie capacità di elaborazione delle informazioni da siti web e, in futuro, sarò in grado di estrarre dati come il numero di dipendenti direttamente dalle pagine”

A parte il fatto che ora mi da del Voi 🙂, ora abbiamo già qualche indicazione interessante. Ma il numero nel mio sito c’era, è per quello ho insistito e ho caricato il link alla pagina che contiene quel dato. Vediamo che dice Gemini:

“Certo, ho analizzato la pagina web che mi hai fornito e ho trovato la seguente informazione:

Develer ha più di 75 dipendenti.

Il dato non è espresso con un numero preciso, ma indica che il numero di dipendenti è superiore a 75.

Potete trovare questa informazione nel paragrafo che parla del team di Develer:

Develer è una realtà in forte crescita, con un team di oltre 75 persone appassionate e competenti.

Spero che questa informazione sia utile!”

Quindi il numero era leggibile, anche se devo dire che non ci avrei sperato, è un testo ma ha questa formattazione, non è un dato strutturato:

Gemini screenshot numero 75 dipendenti

Beh, bravo/a Gemini. Interessante poi che abbia riferito la frase “Develer è una realtà in forte crescita, con un team di oltre 75 persone appassionate e competenti”, che in realtà non è presente nel sito. Probabilmente fa parte di quei fenomeni della AI che vengono chiamati tecnicamente “allucinazioni”.

Ma io ricordo che nella prima risposta Gemini aveva accennato a portali online ai quali farebbe riferimento. E qui non mi sfuggi: se Google non ci dice mai nulla dei suoi algoritmi, spero che un’intelligenza artificiale non possa mentire ai suoi creatori! E gli ho chiesto quali sono questi siti a cui farebbe affidamento:

“Come modello linguistico di grandi dimensioni, mi affido a una varietà di piattaforme online autorevoli per reperire e aggiornare le mie informazioni sulle aziende. Tra le più importanti troviamo:

Siti web aziendali: La fonte primaria di informazioni su un’azienda è sempre il suo sito web ufficiale. Qui è possibile trovare dati come la descrizione dell’azienda, i prodotti o servizi offerti, la dirigenza, le informazioni finanziarie e le ultime notizie.

Banche dati aziendali: Diverse piattaforme online offrono dati aziendali aggregati e profilati. Alcune tra le più conosciute includono:

Queste piattaforme forniscono informazioni come la ragione sociale, la sede legale, i dati finanziari, la struttura proprietaria e i collegamenti con altre aziende.

Notizie e pubblicazioni finanziarie: Per rimanere aggiornati sugli ultimi sviluppi aziendali, consulto regolarmente fonti di notizie finanziarie e testate giornalistiche specializzate in settori specifici. Tra queste:

Social media: I social media possono fornire informazioni preziose sulla cultura aziendale, l’impegno dei dipendenti e le interazioni con i clienti. Seguo le pagine ufficiali delle aziende sui social media e utilizzo strumenti di analisi per monitorare le conversazioni online relative al brand.

Relazioni di analisti: Gli analisti finanziari e gli studi di settore pubblicano regolarmente rapporti e ricerche sulle aziende. Queste relazioni offrono analisi approfondite delle performance finanziarie, delle strategie aziendali e delle prospettive future.

Registri pubblici: In alcuni casi, è possibile reperire informazioni su aziende da registri pubblici, come il registro delle imprese o l’ufficio brevetti. Questi registri possono fornire dati sulla proprietà, i dirigenti, le licenze e i brevetti.”

Interessante no? Chiaramente sono tutti dati da prendere con le molle. Ci sono infatti anche diversi errori nei link che ha indicato e poi non sono sicuro che possa accedere a tutte queste banche dati, ma qualcosa abbiamo imparato.

Concludo? No, abbiamo solo iniziato a muoverci in un nuovo territorio.

Si è trattato solo di un piccolo esperimento un po’ scherzoso. Questi modelli operano in modo probabilistico, non sempre si può usare l’intuito per arrivare a una qualche certezza, ma se ho imparato qualcosa in questi giorni è proprio che non sappiamo come si muovono internamente (lo so, sembro Socrate). Probabilmente sotto al cofano di questi tool c’è molto di più di quello che sappiamo e nemmeno chi li ha creati può risalire al percorso che passa fra una domanda e una risposta. Non si può entrare due volte nello stesso fiume: panta rei dicevano i greci. E infatti, se ripetiamo una domanda (ah, prompt è il termine tecnico che dovremo abituarci a sentire) è probabile che otterremo ogni volta un risultato diverso.

Tanto per confonderci ulteriormente le idee, ho fatto di nuovo la domanda a ChatGPT alla data di pubblicazione di questo articolo, ed ecco la risposta:

Risposta ChatGPT

E quindi come ottimizziamo i nostri siti web? Per ora direi come abbiamo sempre fatto. Forse con qualche attenzione in più verso la coerenza dei dati, pensando non solo al sito, ma anche ai canali social, agli altri siti web e anche su media più tradizionali.

E poi, perchè no?, facendosi aiutare dall’intelligenza artificiale, ma prendete tutto con le pinze! 🙂.