Aproximación cuantitativa al sistema de personajes de La Celestina

El invierno de Lincoln, NE fue duro, y muy largo; tanto que pensé que lo anunciado por George RR Martin había llegado. Pero dicen que “no hay mal que por bien no venga,” y las largas tardes encerrada al calor de la biblioteca me permitieron explorar más allá de los textos teóricos sobre las Humanidades Digitales – o las Digital Humanities para mí- y jugar con distintas herramientas disponibles para nuestro trabajo. Con este post únicamente quiero mostrar la metodología que los nuevos en este campo podemos seguir mientras aprendemos a programar y analizar textos en masa.

En primer lugar, decir que escogí el texto Fernando de Rojas por dos razones: su carácter de novela dialogada hace sencilla la tarea de contabilizar varias instancias a valorar aquí: emisores, receptores, peso del mensaje (medido en nº de palabras) y conexiones; la otra, conocía de antemano el sistema de sus personajes, por lo que aplicar la noción de character space de Woloch no debería resultarme difícil comprobar si los métodos computacionales usados daban respuestas acertadas o no.

Metodología:

Con el texto “crudo” descargado del Proyecto Gutenberg, lo más sencillo de hacer es cuantificar el número de parlamentos que posee cada personaje para comprobar una de las teorías básicas sobre esta obra: el cambio de título de (Tragi)Comedia de Calisto y Melibea (entre 1499 y 1502) al más conocido: La Celestina, desde 1569 aproximadamente. Tabla 1

Si atendemos a la tabla 1, en efecto, Celestina es el personaje que más parlamentos posee en toda la obra. La medianera habla un total de 281 veces (21,85%), seguida de Calisto con 227 parlamentos (17.65%), Sempronio y Pármeno (213 y 162 respectivamente), y Melibea con la mitad de los dos primeros: 117 (9.09%).  Según Moretti (2011), Celestina poseería así gran parte del “espacio del personaje,” atrayendo más atención por parte del lector/espectador; nada nuevo ni muy interesante.

Ahora, si quisiéramos atender al sistema propuesto por Sack (2011), es decir, calcular el espacio presencial de cada personaje por las veces que cada uno es mencionado, veríamos que la atención cambiaría a Calisto con un total de 157 menciones (17.1%),  seguido por Melibea, a quien mencionan 148 veces (16.12%), Sempronio, Celestina, y Pármeno.  Así, por menciones, son efectivamente los amantes los protagonistas de su tragicomedia. Esto no es suficiente.

Y, ¿qué ocurre si sumamos ambos datos?

figura 1

 

 

 

 

 

 

 

 

 

 

 

Ocurre aquí lo que a Sack con la novela Bleak House de Dickens (132): es imposible determinar quien es el personaje principal a primera vista puesto que el descenso de personaje a personaje se da de forma gradual. Sin embargo, en nuestra obra siempre van a ser 5 los personajes que están por encima de la media (98.9 parlamentos) y así los podemos ya considerar como los nodos más importantes de la red que construiremos más tarde.

Pero es mucho más interesante estudiar la evolución de los parlamentos de cada personaje en la obra para saber (sin tener que leer la obra) qué personaje actúa en qué escena.  La herramienta Voyant toma el texto base y calcula el número de veces que el término seleccionado por el usuario aparece en el texto, mostrando una distribución de la frecuencia con que aparece. Vemos que Celestina únicamente ocupa gran parte del espacio narrativo a partir del segundo segmento del texto (que no el Acto Segundo), dominando la esfera de la trama hasta el momento en que desaparece en los dos últimos segmentos; se da el caso de  que cuanto más aumenta su diálogo más desciende el de los demás.

figura 2

Como el primero de Moretti, este estudio carece de mucha más información que la que ya puede obtenerse con la lectura de la obra. Así, lo próximo fue pensar en la medición del número de palabras en cada parlamento para calcular el espacio total que ocupa cada personaje, además de tomar apunte de la dirección de cada parlamento para comprender la forma en que los personajes quedan conectados.

Todavía no sé automatizar el recuento de palabras por parlamento en una obra completa (voy aprendiendo poco a poco con el Dr. Matthew Jockers), así que elegí el Acto Doceno para mi experimento. Lo considero como uno de los más relevantes en el desarrollo de la trama, y uno en el que la verdadera naturaleza de los personajes queda completamente en la superficie (por si había duda de ella durante la primera mitad de la obra).

tabla 3La tabla 3 recoge el total de la suma de palabras de cada parlamento dentro del Acto 12 (incluyendo los monólogos). De este modo, vemos que la dominación del espacio narrativo (entendido aquí como número de palabras y no como número de parlamentos), que hasta ahora venía teniendo Celestina al contabilizar el total de la obra, queda en manos de Calisto al emitir él 1287 palabras en total. Sería quien más atención recibiría por parte del lector según la teoría de Woloch y Moretti (2013). Una vez construida la red social este hecho va a ser de mucha ayuda para entender cómo Calisto logra posicionarse como el nodo central que une a varios de los personajes y que, sin él, quedarían desconectados. De algún modo, se corrobora su centralidad y protagonismo en la obra. Pero sigamos porque esto no es del todo conclusivo.

¿Quiere decir que quien más palabras emite es el protagonista de, en este caso, un acto? Celestina, por ejemplo, resulta ser de nuevo una de las más persistentes en la participación del espacio. Tras leer el acto, saltándonos un poco la idea del distant reading10 acuñada por el mismo Moretti (de todos modos, sólo estamos prestando atención a una obra), sabemos que ninguno puede escapar a su protagonismo.Si de nuevo asistimos al recuento del número de parlamentos fijándonos en este acto únicamente (tabla 4), veremos que los roles se invierten y son los criados de Calisto quienes poseerían un mayor “espacio del personaje,” constituyéndose en los protagonistas: Pármeno 38, Sempronio 34, Calisto 24, Celestina 15, Melibea 13, etc. De aquí surgen nuevas ideas.

Por un lado, podemos pensar en que el hecho de que sean ellos dos quienes actúen de medianeros entre Calisto y Celestina los hace ya más relevantes – sobre todo si sumamos las intervenciones de ambos, que superarían al resto. Esto nos llevaría a categorizar al conjunto de los personajes por tipos especiales, dejando un poco de lado el número de ellos: la medianera, el noble, la dama, el criado, la criada, los padres (el nriado con 375 parlamentos en total y 72 en el Acto 12). De este modo quedaría al descubierto la importancia del criado tanto en la vida como en las obras de esta época, figura que muchas veces es relegado a personaje secundario pero que en muchos casos posee más relevancia (ver a Pierson).

Por último, debemos preguntarnos quién es el personaje que posee mayor centralidad en el acto (y la red social conformada a su alrededor) mediante la contabilización de quién habla a quien o hacia quién va dirigido cada parlamento. Los diálogos van a estar muy distribuidos entre todos los personajes puesto que los Calisto habla a 5 personajes (una interacción es a él mismo), Celestina y Sempronio a 4 y Pármeno a 4 (con su monólogo). ¿Cuánto diálogo se intercambia entre los personajes? Celestina es quien más habla a Sempronio y a Pármeno, aunque ellos le hablen a ella menos de la mitad (1042/875 vs. 412/89); luego, Calisto dedica mucho de su espacio de diálogo para Melibea (797), respondiéndole ella con 531 palabras –claramente es Calisto quien dirige la acción en su hacer con la muchacha tanto cuantitativamente como en la lectura tradicional.

En la última figura, generada con Raw, puede verse todo lo arriba señalado en una sola imagen. El emisor y su espacio, el número de mensajes que emite y la cantidad de palabras en los mensajes a cada receptor:

conexiones

Finalmente, con todos los ratos recabados hasta ahora, y sobre todo los utilizados en la última figura, es posible generar la red social del Acto Doceno gracias al programa Gephi (generador de visualizaciones y muchos dolores de cabeza):

red

El protagonista masculino de la tragicomedia se sitúa como conector o elemento (nodo) unificador de los dos grupos de personajes de la obra: la clase alta o familia de Melibea, y los sirvientes y la alcahueta. Es en este último grupo en el que, gracias al peso de las conexiones entre personajes o el número de palabras intercambiado entre ellos, podemos también ver que la balanza del “espacio del personaje” se inclina hacia ellos, y no los amantes. Entre ellos tres se intercambian gran cantidad de palabras y si recordamos las palabras de Moretti (“the number of words tells us how much meaning the character brings into the play (and is often correlated with a discord with power,…)” (109)) no se nos puede pasar por alto que, efectivamente, son estos tres personajes los que desobedecen las normas sociales exigidas en su entorno, siendo castigados por su mal hacer inmediatamente después.

Conclusiones:

Con este nuevo enfoque es posible poner al descubierto diferentes facetas del texto, como por ejemplo:

 

  1. El hecho de que los criados Sempronio y Pármeno, sumados como prototipo de “criado” hablen más que el resto de tipos;
  2. La función conectora de Calisto en algunos pasajes de la obra (Acto 12 concretamente), y no de Celestina como siempre se la ha calificado.
  3.  A poca relevancia de los padres de Melibea en el desarrollo de los hechos al igual que las amantes de los criados. ¿Podrían ser todos estos eliminados? ¿Cuál es su función?
  4. Y la clara evidencia de que, efectivamente, Celestina es el personaje que más veces emite mensajes a lo largo de la obra, posicionándola como protagonista ya no sólo por sus tejemanejes sino también por la cantidad de espacio narrativo que ocupa.

Lo más interesante sería, claro está, y una vez realizada tal minería de datos, crear la red completa de la obra, para tener una visión del conjunto y estudiar la centralizad de ciertos personajes y el peso de sus conexiones, además de la dirección de éstas – para fijarse si las conclusiones obtenidas coinciden, o no, con las lecturas hechas de esta obra durante años.

Os animo a que escojáis algún texto que os guste y juguéis con las herramientas que están a vuestro alcance. Son sencillas, fáciles de usar o intuitivas.

Bibliografía:

 

Bostock, Mike. “Sankey Diagrams.” Mike Bostock. May 22, 2013. Web. 20 Marzo, 2014.

Condello, M., R. Harrison, J. Isasi, A. Kinnaman, y A. Kumari. “A Character Network Construction for Macroanalysis.” University of Nebraska-Lincoln Literary Lab. (2014).

Elson, David K., Nicolas Dames and Kathleen R. McKeown. “Extracting Social Networks from Literary Fiction.” Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. Uppsala, Sweden (2010): 128-147.

Hockey, Susan. “The History of Humanities Computing.” En A Companion to Digital Humanities. Ed. Susan Schreibman, Ray Siemens, John Unsworth. Oxford: Blackwell, 2004. http://www.digitalhumanities.org/companion/

Moretti, Franco. “Network Theory, Plot Analysis.” Pamphlets of the Stanford Literary Lab. Palo Alto, California, 2011. Web. http://litlab.stanford.edu/LiteraryLabPamphlet2.pdf

–. “Operationalizing: or, the Function of Measurement in Modern Literary Study.” New Left Review, 84 (2013): 103–119.

–. “Conjectures on World Literature.” Distant Reading. London: Verso, 2013: 43-62.

Park, Gyeong-Mi et al. “Structural Analysis on Social Network Constructed from Characters in Literature Texts.” Journal of Computers, 8.9 (2013): 2442-2447.

Pierson, Emma. “Parsing Is Such Sweet Sorrow.” Five Thirty Eight. 17 Mar, 2014. Web. 17 Marzo 2014.

Rojas, Fernando de. La Celestina. Ed. Robert S. Rudder. 1999. E-text.

–. La Celestina. Ed. Dorothy S. Severin. Madrid: Alianza Editorial, 1993.

Sack, Graham Alexander. “Simulating Plot: Towards a Generative Model of Narrative Structure.” Complex Adaptive Systems: Energy, Information and Intelligence Conference. Arlington, Virginia, (2011): 127-136.

–. “Character Networks for Narrative Generation: Structural Balance Theory and the Emergence of Proto-Narratives.” 2013 Workshop on Computational Models of of Narrative. 32. Dagstulh, Germany: Schloss Dagstuhl–Leibniz-Zentrum fuer Informatik, (2013): 183-197.

Woloch, Alex. The One vs. the Many: Minor Characters and the Space of the Protagonist in the Novel. Princeton, New Jersey: Princeton University Press, 2003.

 

Digital Humanities: An Undefined Term

Now and then a (to some extent rhetorical) question is raised in classes, meetings and conferences: “What is Digital Humanities?” Its rhetorical nature lies on the fact that DH, whether as a method, a system or an end on itself, is a plural, interdisciplinary and nonstop evolutionary entity.

Beginning the discussion about the definition of DH the first day of class, the readings for this week has included a lecture by Unsworth, an article by McCarty, the second version of DH Manifesto, a short guide by Burdick, Drucker, Lunenfeld, and Presner, and two debates by Kirschenbaum and Alvarado, all framed on the term Manifestos. What all of them have in common is an effort to describe Humanities Computing or Digital Humanities and its implications towards the Humanities discipline. Besides, all of them seem to argue in favour of the need of using technologies in humanistic projects in our era, arguing against those who think that using computers would be detrimental in a field such a literary analysis. Furthermore, they try to persuade humanists  to have computational knowledge in order to create more useful projects.

Regarding this last note, Unsworth, in his “What is Humanities Computing and what is not?” tries to separate real digital practices from charlatans. For if HC is “a practice of representation […] a way of reason and a set of ontological commitment,” there has to be a clear cut consensus on how to make everyone participate on projects with tools such as search engines. These have to allow interaction between scholars, creators, and users, in order to meet one of the main goals of DH: easy access to sources of the human record, opening up investigations to collaboration between different scholars or anyone interested in the subject. In his opinion, human communication is the basis of DH, especially now that it is so easy to communicate via the Internet.

It is McCarty who addresses the evolution of computing in the humanities and its advantages nowadays by writing an attempted historiography of the field and creating a conceptual map. I say attempted for he points out, again, the difficulty of closing the boundaries of “the role of calculating machines” in humanities since they are “also symbol-manipulation devices.”  His revision through history serves as a good example of the transformation on DH and, hence, its need for a continuos exploration of the question “what is humanities computing?.” It is important to note that the first attempt to leave the traditional annotation of texts was Roberto Busa‘s work on the Index Thomisticus by Thomas Aquinas – as early as 1940s the Jesuit scholar wrote a concordance using computers. Museologists were the next to join the new method, and by 1966 the Computers and the Humanities journal was founded. Thanks to ALLC in 1972 and ACH in 1987, a sense of community began to emerge. The problem of communication was vanquished soon with the World Wide Web and the Internet, email systems, and hypermedia. In his conclusion he addresses the need of focusing analysis on the data rather than the subject itself, creating a brand new laboratory that is inclusive to humanities, and making the specialist take part in conversations about the nature of their research – addressing Unsworth notion.

I believe that the Manifesto 2.0 shows the idea of communication and collaboration quite clearly:

Digital Humanities have a utopian core […] it affirms the value of the open, the infinite, the expansive, the university/museum/archive/library without walls, the democratization of culture and scholarship […] Digital Humanities = Co-creation  […] teamwork […] actively engaged in the task of creating an audience –even a mass audience– for humanistic learning (3-5)

It is interesting how in the introduction to the chapter “Provocations,” Burdick addresses the need of a real shape of DH, with criticism and experimentation in the field, rather than just using digital tools within the Humanities, for the fact that technology is now naturalized on our lives, has made implications about its use “invisible” (102). Also, this text is aware of the danger of leading DH to its fall, if they don’t serve the same models of knowledge as Humanities do: questioning of the world. It also explores the difference between printed and digital texts because DH allows a manipulation of the item that was not possible before. Hand in hand with that manipulation comes the flourishing of a more “fluid, iterative, and distributive” (109) notion of information, changing the way departments or disciplines treat their subjects.

Kirschenbaum’s work is a representative case of what Digital Humanities can offer if they are inclusive of all the notions discussed by the authors already mentioned. First of all, the digital edition of the Debates has a nice visual interface that allows the user to interact with the text easily. But its contribution consists on his overview about the social, networking, shared research, and collaborative essence of the field. He writes about the project of the Companion to Digital Humanities, the consolidation of the ACH, ALLC, and ADHO, or events such as the Day of Digital Humanities. Most importantly, he pays attention to the success of DH during the MLA Convention in 2009. Thanks to Twitter, real-time commentaries on the panels through the tag #mla09 allowed many people to engage in a simultaneous conversation and build networks od DHers. To conclude, he points out the significance of using the words “digital humanities” in debates around open-access, since DH is about having research divulged in a public manner, with explicit infrastructures and depending upon online social networks.

Finally, “The Digital Humanities Situation” by Alvarado serves as a conclusion to the discussed articles. His view of DH is that of a social category that is on constant movement since the community encloses traditional and new humanists. This prevents a sole definition since it involves “as many methods and tools as there are intersections between texts and technologies.” Nonetheless, there is a clear awareness of the possibilities that DH offers towards crossing disciplines and the creation of new discourses.

To a student that wants to learn how to use digital tools to analyse literature in the future these Manifests can be both enlightening and subversive. The sustained notion of the third culture (humanism+science) can provide vehicles that are rather convenient as it enables a cross-examination on unstudied objects, even change the way we thought about the familiar ones; or else, it can make a muck of your perception about humanities and their methodologies. In any case, these readings show that Digital Humanities is not going to overtake printed material or traditional criticism of literature. Rather, they are to help in the circulation of information, contributing to, and at the same time changing, the learning of the humanistic disciplines thanks to the many new possibilities they can offer. In sum, is there really a need of a single definition?

Bibliography:

Alvarado, Rafael. “The Digital Humanities Situation,” in Debates in the Digital Humanities. Edited by Matthew K. Gold. Minneapolis, MN: University of Minnesota Press, 2012.

Burdick, Anne, et al., “Short Guide to the Digital Humanities,” in Digital Humanities. Cambridge, MA: The MIT Press, 2012.

Kirschenbaum, Matthew. “What is Digital Humanities and What’s It Doing in English Departments?,” in Debates in the Digital Humanities. Edited by Matthew K. Gold. Minneapolis, MN: University of Minnesota Press, 2012.

Lunenfeld, Peter, et al. “The Digital Humanities Manifesto Version 2.0.” Accessed August 26, 2013.

McCarthy, Willard. “Humanities Computing,” in Encyclopedia of Library and Information Science. New York: Marcel Dekker, Inc., 2003.

Unsworth, John. “What Is Humanities Computing and What Is Not?.” University of Munich, 2002. Lecture. Accessed August 27, 2013.