A través de un programa informático, investigadores estadunidenses de la Universidad de Harvard lograron extraer datos útiles de los libros de las bases de datos de Google.
Sin tener que leer las obras, los expertos analizan la frecuencia, los cambios, el auge y el declive en el uso de palabras o frases a través del tiempo con el fin de establecer una nueva ciencia denominada “Culturomía”, dedicada al análisis cuantitativo de tendencias culturales.
Con el uso del algoritmo “Bookworm” los científicos trabajaron en una base de datos de cinco millones de volúmenes virtuales, lo que representa el 4% de todos los libros publicados en la historia de la humanidad.
Una primera fase del proyecto, liderado por Jean-Baptiste Michele, incluyó la producción literaria en idioma inglés durante los siglos XIX y XX; los resultados mostraron el hallazgo de cerca de 300 mil palabras que no aparecen en ningún diccionario de esa lengua. Asimismo, se rastreó el ascenso y caída de determinadas teorías, de personajes y de periodos de prohibición y censura contra algunas obras o autores.
“Sondeamos el vasto territorio de la culturomía en fenómenos lingüísticos y culturales que fueron reflejados en el idioma inglés entre 1800 y 2000. Mostramos cómo esta aproximación puede proporcionar atisbos en terrenos tan diversos como la lexicografía, la evolución de la gramática, la memoria colectiva, la adopción de tecnología, la persecución de la fama, la censura y la historia de la epidemiología”, se lee en el artículo “Análisis cuantitativo de la cultura a través de millones de libros digitalizados”, difundido en Science.
0 comentarios:
Publicar un comentario