nGrams

No, no me he vuelto loco ni he vuelto a liarla con el teclado predictivo del teléfono. He descubierto a través de una de las charlas de TED una aplicación de Google que te indica la presencia a lo largo del tiempo de las palabras o series de palabras que tú elijas. Lo llaman nGrams que es un conjunto de n palabras hasta un máximo de 4. En esta charla, que es donde los descubrí y que es bastante divertida, podéis entender un poco más de qué va el asunto:


El caso es que no he podido resistirme a juguetear y me ha puesto a buscar palabras en español y en inglés y os voy a poner algunos resultados así, a bocajarro. Por ejemplo, he buscado a lo largo del tiempo las palabras cultura, inteligencia, joven, viejo y dinero y lo que se obtiene es algo como esto:


Y se puede ver como la palabra cultura aparece cada vez más en más libros, que dinero se mantiene más o menos constante, que inteligencia baja y que joven y viejo siguen trayectorias parecidas, aunque es un poco más habitual la palabra joven. ¿Qué pasa si busco esas palabras en inglés? Bueno, nada más fácil, busco culture, intelligence, young, old y money y obtengo esto:

No se parecen en nada, ¿eh? Bueno, un poco en lo relativo a cultura que parece que también sube... inteligencia parece que también baja... y joven y viejo tienen la misma forma, pero aquí viejo está mucho más presente que joven.

Que quede claro que yo no le voy a dar a nada de esto ninguna explicación, pero a mí esto de hacer grafiquitas y poner palabras me entretiene mucho. Desde luego que no voy a llegar a ningún descubrimiento exotérico, pero hay cosas curiosas. Por ejemplo, se puede buscar phone y telephone. Lógicamente antes de 1856 no hay datos porque el teléfono no existía, pero luego telephone se mantuvo como líder hasta que en los años 70 empieza a despegar phone que supera a telephone en los 90.
Y ¿qué pasa si aplicamos esta arma poderosa a otras tonterías? Por ejemplo, ¿como han pervivido a lo largo del tiempo escritores? Pongamos por caso Joseph Conrad, Mark Twain, Robert Louis Stevenson o G. K. Chesterton?
Pues parece que Twain ya se iba haciendo un nombre que se disparó cuando se murió (1910), mientras que Stevenson tuvo su momento y va de capa caída, pero ni Chesterton ni Conrad tuvieron siquiera su momento de fama apareciendo en otros libros.

Bueno, vale, sí, yo también ha buscado culo o pornografía o tetas, pero eso ya lo buscáis vosotros si no lo habéis hecho ya. Yo voy de cultureta y me estoy preparando para ir con Bichejo a la Central, así que he buscado en primer lugar poetas: Federico García Lorca, Miguel Hernández, Antonio Machado, Juan Ramón Jiménez y Luis Cernuda y aparecen cosas como estas:
Yo hubiera dicho que Lorca estaría por delante, pero el que gana es Machado y tiene un pico muy grande en el centenario de su nacimiento. De igual manera Juan Ramón Jiménez tiene un pico cuando ganó el Nobel. Miguel Hernández también tiene un pico a los 40 años de su muerte.

Pero vamos a lo importante. ¿Cuál es el equipo de fútbol preferido por los literatos? Pues aquí tenéis la respuesta que, no podía ser de otro modo, es la que esperábais:

He de decir que si ponía F.C. Barcelona casi ni salía y si ya nos vamos a la arena internacional, ni hay color:
Y sí, ya véis, con estas tonterias me he pasado esta tarde. ¿Qué habéis buscado vosotros?

4 comentarios:

  1. Pues voy a confesar que he buscado "caca culo pedo pis"...muy penoso, lo sé, pero me había hecho autogracia. Obviamente no sale casi nada.

    Te pega todo lo de echar la tarde con esa aplicación.

    N ha buscado "galaxia robot" y en los 60 igual estaba muy de moda Asimov o algo porque pega un subidón lo de robot que no veas

    ResponderEliminar
  2. Oye, me parece interesantísimo. Sobre todo, la diferencia de curvas del primero, entre el inglés y el español.

    ResponderEliminar
  3. Genial. Pinta muy bien.
    Yo voy a jugar a esto en cuanto tenga un rato.
    Me gusta mucho eso de las diferentes frecuencias de uso de las palabras para el mismo objeto.

    ResponderEliminar
  4. Pues ya me diréis qué os sale. El límite es la imaginación de cada uno y pueden salir cosas muy chulas.

    Lo de robot es muy friki! :-)

    ResponderEliminar