Google Trends. Potenzialità e limiti

Per usare al meglio Google Trends è necessario conoscere lo strumento, le sue potenzialità ma anche i suoi limiti. Di Google Trends ho già scritto in un precedente articolo. Qui presento il suo utilizzo nella ricerca e alcune delle principali problematiche metodologiche connesse al suo utilizzo.

Google Trends

Google Trends[1] è un servizio gratuito di Google che consente di analizzare le tendenze di ricerca online. Dopo l’iniziale lancio dello strumento, il 5 Agosto 2008 vi si è affiancato il più sofisticato Google Insights for Search[2]. I due strumenti sono stati infine integrati in un unico prodotto nel 2012, sempre chiamato Google Trends[3].

Questo “Big Data tool” permette di visualizzare l’andamento storico delle ricerche di una o più parole chiave in una finestra temporale compresa tra il 2004 e il momento presente, consentendo di specificare la lingua e l’area geografica di interesse. Google Trends permette di indagare le zone geografiche in cui le ricerche sono più popolari (a livello sia di nazioni che di città), mostra le ricerche correlate a quelle inserite dall’utente e quelle che mostrano un marcato trend crescente (per le specifiche dello strumento si vedano anzitutto Google Trends[4], la sua sezione Help[5] e gli articoli di Google News Lab[6]).

Non è difficile riconoscere l’attrattività di questo strumento, se solo si guarda all’ammontare delle ricerche svolte su Google, il sito più visitato al mondo[7] (figura 1).

Figura 1. Google Annual Search Statistics[8]

L’accesso alle tendenze di ricerca si presenta all’attenzione del ricercatore come una proxy degli interessi della popolazione degli utenti Internet, che ampliandosi sempre più, va sempre più approssimandosi a quella generale (figura 2), sebbene occorra tenere presente che ancora oggi esistono grandi differenze socioculturali nell’accesso e nell’uso di Internet (figura 3 e 4).

Figura 2. Households with internet access, 2010 and 2016 (as % of all households) – Source: Eurostat[9]

Figura 3. Internet – Attività ed accesso (Istat – Multiscopo sulle famiglie: aspetti della vita quotidiana)

Figura 4. Aspetti della vita quotidiana: Internet – classe di età
(Istat – Multiscopo sulle famiglie: aspetti della vita quotidiana)

L’uso di Google Trends nella ricerca

Le potenzialità di Google Trends sono state presto intuite dai ricercatori di svariate discipline, che lo hanno impiegato in numerose ricerche. I dati di Google Trends sono stati applicati allo studio dell’andamento della disoccupazione (Askitas & Zimmermann, 2009), dei mercati finanziari (Preis, Moat, & Stanley, 2013), dei consumi privati (Vosen & Schmidt, 2011) e della vendita di automobili e della pianificazione dei viaggi (Choi & Varian, 2009), al mercato immobiliare (Wu & Brynjolfsson, 2009), alle epidemie di influenza (Ginsberg et al., 2009) e all’attenzione pubblica per le problematiche ambientali (McCallum & Bury, 2013), per fare solo qualche esempio. Consultando il database di Web of Science relativamente agli articoli che fanno riferimento al “topic” Google Trends si trovano 321 record tra il 2009 e il 2017[10]. Il trend delle pubblicazioni si mostra in crescita (figura 5). Le discipline maggiormente interessate appartengono all’area economica e tecnologica (figura 6).

Figura 5. Web of Science, percentuale dei record per anno (n = 321).
L’anno 2017 è incompleto perché i dati sono stati estratti il 24/04/2017.

Figura 6. Classificazione di Web of Science per “Research Areas” (n = 321).

I dati di Google Trends

Google Trends è uno strumento solo apparentemente intuitivo. Contrariamente a quanto ci si potrebbe forse aspettare, Google Trends non indica i valori assoluti delle ricerche svolte per le keyword inserite dall’utente e neppure le rappresenta in altra scala. Invece, ogni punto della serie storica rappresenta il rapporto tra il volume di ricerca della query e il volume totale delle ricerche su Google nel range temporale e nella zona geografica che quel punto rappresenta. In altri termini, ciascun punto della serie rappresenta il rapporto tra il volume di ricerca della query e il volume di ricerca di tutte le query, ovverosia la prevalenza della query di interesse. Questi valori relativi sono poi indicizzati su una scala 0-100 dividendoli per il valore maggiore e moltiplicandoli per 100[11]. Il valore di ogni indice di Google Trends è pertanto così calcolato (equazione presa e riadattata da Stephens-Davidowitz, 2012):

Non solo i valori non hanno alcun significato quantitativo (100 può corrispondere tanto a un milione di ricerche quanto a diecimila), ma è teoricamente possibile visualizzare un trend decrescente anche se il volume assoluto di ricerca per la keyword considerata stesse aumentando: «Una linea verso il basso indica che la popolarità relativa del termine di ricerca si sta riducendo: non necessariamente, però, il numero totale di ricerche a esso relative si è ridotto, è solo la sua popolarità rispetto ad altre ricerche a essere diminuita»[12]. Se il numero di ricerche per una keyword avessero un grado di incremento minore di quello delle ricerche globali il trend della query risulterebbe calante, essendo gli indici di Google Trends il risultato del rapporto con le ricerche globali effettuate su Google. Si tratta di un aspetto che è essenziale tenere in considerazione. Puntando l’attenzione anche su questa caratteristica dei dati di Google Trends, per esempio, sono stati messi in discussione i risultati di una ricerca i quali suggerivano che il pubblico interesse per l’ambiente andasse diminuendo (Ficetola, 2013; McCallum & Bury, 2013, 2014).

Abbiamo detto che i volumi di ricerca dei termini inseriti dall’utente di Google Trends vengono rapportati al numero di ricerche globali su Google. Occorre specificare che i dati su cui Google Trends elabora i suoi calcoli non corrispondono a tutti i dati delle ricerche, ma ad un campione casuale delle stesse[13]. Inoltre, esiste la possibilità – ed anzi l’opportunità – di circoscrivere i contesti in cui effettuare la propria interrogazione scegliendo tra le svariate categorie e sottocategorie messe a disposizione da Google, così da evitare il rischio di includere termini confondenti. È inoltre possibile circoscrivere la ricerca per area geografica, lingua e periodo temporale. Applicando questi filtri, si restringono congruentemente i volumi di ricerca cui viene rapportata l’interrogazione effettuata dall’utente.

Validità dei dati di Google Trends

Circoscrivere attentamente la query è di fondamentale importanza: è facile includere volumi di ricerca che non si riferiscono al fenomeno di proprio interesse, minando la validità dello strumento, che non misurerebbe quanto ci si prefigge di misurare. Se per esempio si cercasse “carta”, intendendo così misurare la popolarità delle ricerche per questo particolare supporto per la scrittura, potrebbero essere inclusi i volumi delle ricerche relative a “carta per fotocopiatrice”, “museo della carta” e anche “Marco Carta”, il nome di un cantante italiano. Se si volesse restringere la ricerca alla carta intesa come “cellulosa per la scrittura”, potrebbe dunque essere opportuno escludere anzitutto il cantante, noto tra i giovani e probabilmente oggetto di molte ricerche su Google, tramite l’operatore “-”, facendo diventare la ricerca “carta -Marco”. Se si volessero invece sommare tra loro i volumi di ricerca di un gruppo di termini che si ritenessero correlati al fenomeno di interesse, sarà possibile connetterli tra loro tramite l’operatore “+”. Google Trends permette di connettere al massimo 25 termini, e di confrontare tra loro fino a 5 gruppi composti da 1 a 25 termini.

Non è sempre facile né possibile circoscrivere le query per far sì che esse riflettano il fenomeno di interesse. Forse il più famoso caso di utilizzo scientifico dei volumi delle query di ricerca è quello del progetto “Google Flu Trends”, strumento con cui Google ha cercato di predire la diffusione delle epidemie di influenza attraverso i dati delle ricerche online a sua disposizione[14]. L’iniziale entusiasmo per questi dati (Ginsberg et al., 2009) è stato successivamente frenato dalla constatazione che l’algoritmo non funzionava sempre bene, arrivando a sbagliare nettamente le previsioni dell’epidemia dell’inverno 2012/2013, secondo alcuni ricercatori proprio perché la copertura mediatica del tema aveva prodotto un incremento di ricerche confondenti: «Google Flu Trends has continued to perform remarkably well, and researchers in many countries have confirmed that its ILI estimates are accurate. But the latest US flu season seems to have confounded its algorithms. […] Google would not comment on this year’s difficulties. But several researchers suggest that the problems may be due to widespread media coverage of this year’s severe US flu season, including the declaration of a public-health emergency by New York state last month. The press reports may have triggered many flu-related searches by people who were not ill» (Butler, 2013).

Figura 7. Immagine tratta da Nature, “When Google got flu wrong”, (Butler, 2013).

Si è così parlato di “Big Data Hubris”, «the often implicit assumption that big data are a substitute for, rather than a supplement to, traditional data collection and analysis» (Lazer, Kennedy, King, & Vespignani, 2014).

I dati di Google Trends sono dunque interessanti ma da usare con cautela. Uno studio sulla validità di facciata, di contenuto e di criterio di Google Trends quale strumento per la misurazione dei temi di salienza pubblica, svolta confrontando i dati prodotti da quest’ultimo con i “Most Important Problem” di Gallup[15], ha dovuto scartare 28 dei 33 indici di partenza, in quanto non avevano superato uno dei diversi livelli del processo metodologico di validazione. Ciò nonostante si sono dimostrati validi indicatori di salienza pubblica cinque indici che coprivano 4 aree tematiche: macroeconomia, terrorismo, immigrazione e prezzo del carburante (Mellon, 2014). Nonostante occorra procedere con cautela nel considerare la validità dello strumento applicato ai temi di ricerca di proprio interesse, e il rischio di sbagliare incomba, Google Trends può essere un valido strumento per l’analisi di diversi temi. Sebbene non si possano enunciare regole di validità generale, alcuni studi sembrerebbero suggerire che i risultati più validi si possano riscontrare quando si indagano tematiche che vedono gli utenti di Google fare ricerche online per risolvere problemi pratici (Mellon, 2013, p. 287). Quest’ultima indicazione, come evidente, è di notevole interesse per l’uso di Google Trends per il marketing online.

Note

[1] https://trends.google.it/trends/ [Accessed: 24 April 2017].

[2] “Announcing Google Insights for Search”, https://adwords.googleblog.com/2008/08/announcing-google-insights-for-search.html, Google Inside AdWords – Google’s official blog for news, tips and information on AdWords, Tuesday, August 05, 2008 [Accessed: 24 April 2017].

[3] “Insights into what the world is searching for – the new Google Trends”, https://search.googleblog.com/2012/09/insights-into-what-world-is-searching.html, Google Inside Search – The official Google Search blog, September 27, 2012 [Accessed: 24 April 2017].

[4] Google Trends, https://trends.google.com/trends/ [Accessed: 25 April 2017].

[5] Trends Help, https://support.google.com/trends/?hl=en#topic [Accessed: 25 April 2017].

[6] Google News Lab, https://newslab.withgoogle.com/process/research [Accessed: 25 April 2017].

[7] Google figura al primo posto nel ranking Alexa “The top 500 sites on the web”, http://www.alexa.com/topsites [Accessed: 24 April 2017].

[8] Google Annual Search Statistics by Statistic Brain, http://www.statisticbrain.com/google-searches/ [Accessed: 24 April 2017].

[9] http://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=isoc_ci_in_h&lang=en [Accessed: 26 April 2017].

[10] Web of Science – Basic Search – keyword: “Google Trends” (ricerca esatta) in Topic [Accessed: 24 April 2017]. Una ricerca più estesa, modificando il parametro della keyword (keyword: Google Trends, senza virgolette) risulta in 1228 record [Accessed: 26 April 2017].

[11] Trends Help, “How Trends data is adjusted”, https://support.google.com/trends/answer/4365533?hl=en [Accessed: 25 April 2017].

[12] Google News Lab, https://newslab.withgoogle.com/lesson/6507480104304640 [Accessed: 25 April 2017].

[13] “Google Trends data is an unbiased sample of Google search data. Only a percentage of searches are used to compile Trends data”, Google Trends Help, https://support.google.com/trends/answer/4355213?hl=en [Accessed: 26 April 2017].

[14] Il progetto Google Flu Trends non è più attivo ma è possibile consultare i dati raccolti fino al momento della sospensione. Google Flu Trends, https://www.google.org/flutrends/about/ [Accessed: 26 April 2017].

[15] Gallup Most Important Problem, http://www.gallup.com/poll/1675/most-important-problem.aspx [Accessed: 26 April 2017].

Bibliografia

Askitas, N., & Zimmermann, K. F. (2009). Google Econometrics and Unemployment Forecasting. Applied Economics Quarterly, 55(2), 107–120. http://doi.org/10.3790/aeq.55.2.107

Butler, D. (2013). When Google got flu wrong. Nature, 494, 155–156. http://doi.org/10.1038/494155a

Choi, H., & Varian, H. (2009). Predicting the Present with Google Trends.

Ficetola, G. F. (2013). Is interest toward the environment really declining? The complexity of analysing trends using internet search data. Biodiversity and Conservation, 22(12), 2983–2988. http://doi.org/10.1007/s10531-013-0552-y

Ginsberg, J., Mohebbi, M. H., Patel, R. S., Brammer, L., Smolinski, M. S., & Brilliant, L. (2009). Detecting influenza epidemics using search engine query data. Nature, 457(7232), 1012–4. http://doi.org/10.1038/nature07634

Lazer, D., Kennedy, R., King, G., & Vespignani, A. (2014). The parable of Google Flue: traps in big data analysis. Science, 343, 1203–1205. http://doi.org/10.1126/science.1248506

McCallum, M. L., & Bury, G. W. (2013). Google search patterns suggest declining interest in the environment. Biodiversity and Conservation, 22(6–7), 1355–1367. http://doi.org/10.1007/s10531-013-0476-6

McCallum, M. L., & Bury, G. W. (2014). Public interest in the environment is falling: A response to Ficetola (2013). Biodiversity and Conservation, 23(4), 1057–1062. http://doi.org/10.1007/s10531-014-0640-7

Mellon, J. (2013). Where and When Can We Use Google Trends to Measure Issue Salience? PS: Political Science & Politics, 46(2), 280–290. http://doi.org/10.1017/S1049096513000279

Mellon, J. (2014). Internet Search Data and Issue Salience: The Properties of Google Trends as a Measure of Issue Salience. Journal of Elections, Public Opinion and Parties, 24(1), 45–72. http://doi.org/10.1080/17457289.2013.846346

Preis, T., Moat, H. S., & Stanley, H. E. (2013). Quantifying Trading Behavior in Financial Markets Using Google Trends. Scientific Reports, 3, 6. http://doi.org/10.1038/srep01684

Stephens-Davidowitz, S. I. (2012). The Effects of Racial Animus on a Black Presidential Candidate: Using Google Search Data to Find What Surveys Miss. Harvard University Working Paper. http://doi.org/10.2139/ssrn.2050673

Vosen, S., & Schmidt, T. (2011). Forecasting private consumption: Survey-based indicators vs. Google trends. Journal of Forecasting, 30(6), 565–578. http://doi.org/10.1002/for.1213

Wu, L., & Brynjolfsson, E. (2009). The Future of Prediction: How Google Searches Foreshadow Housing Prices and Sales. SSRN Electronic Journal. Retrieved from http://www.ssrn.com/abstract=2022293