#Columna: Perreando tipos de datos (¡duro!)

#Columna: Perreando tipos de datos (¡duro!)

Perreando tipos de datos (¡duro!)

Camila tiene una discusión con su profesora. Según ella, la juventud de ahora es muy vulgar y hasta pornográfica comparada con cómo era la juventud cuando ella tenía su misma edad. Camila argumenta que todas las generaciones dicen eso de la generación que le sigue, empezando por Sócrates, pero su profe no da su brazo a torcer. Por eso acuerdan hacer un experimento usando una canción de cada generación como parámetro para determinar cuál era más pornográfica.

La maestra escoge “Dame Algo” de Bad Bunny, Wisin y Yandel como representante de la juventud actual. Camila escoge “Voy a llenarte toda” de José José como muestra de lo que escuchaban los jóvenes de la generación anterior.  ¿Pero cómo se pueden usar para hacer una comparación medianamente objetiva ante algo tan subjetivo como “el contenido sexual” de una canción?

Poniendo manos a la obra, Camila y su profesora se encuentran con que de cada canción se pueden sacar muchos datos de diferentes tipos. Por ejemplo, el conteo de palabras más frecuentes de cada canción es un ejemplo de datos cuantitativos, es decir, que se pueden medir de manera objetiva. En el caso de José José, las palabras más frecuentes de su canción son “toda” y “voy” con 8 apariciones cada una, “amarte”, “mis” y “sin” con 6. Como estos son números enteros (sin decimales) corresponden a los datos cuantitativos discretos.

Haciendo el mismo ejercicio con Bad Bunny, “hoy” representa el 4,3% de las palabras, “algo” y “tú” el 3,05% cada una, “dame” y “quiero” el 2,29% cada una. A diferencia del conteo de palabras, el porcentaje del total que representa el conteo de cada palabra es otro tipo de dato cuantitativo, pero como no es entero (tiene cifras decimales) corresponde al tipo de datos cuantitativos continuos. Además, como en este caso la proporción (porcentaje) que ocupa una palabra dentro del conteo total no puede ser menor de 0% ni mayor que 100%, también se dice que es un dato cuantitativo de rango porque no puede haber valores por fuera de esos límites.

Pero a pesar de que expresiones ‘controversiales’ como “perreo”, “jodió” y “bellaqueo” estaban poniendo en aprietos a Camila porque están entre las 20 palabras más frecuentes (cada una es el 1,5% del conteo total), la profesora estuvo de acuerdo en que lo vulgar no son las palabras sino cómo se combinan. Así que dejaron de lado los datos cuantitativos y empezaron a buscar datos cualitativos, es decir que se puedan observar pero no medir o cuantificar con un número. Intentaron clasificar las palabras por tipo (como sustantivo, verbo, artículo, pronombre, conector). Estos valores corresponden a un dato categórico nominal, ya que representan categorías sueltas sin relación entre ellas, por lo que no eran de utilidad en este experimento.

Decidieron entonces clasificar expresiones de cada canción en tres categorías de “contenido sexual”: explícita, implícita y neutra. Estos valores corresponden también a un dato cualitativo. Y aunque no se puedan hacer operaciones numéricas con datos cualitativos, en este caso sí es evidente que hay un “orden” entre los valores: “explícita” denota más contenido sexual que “implícita”, y ésta menos que la primera pero un poco más que “neutra”. Por eso el dato de contenido sexual sería uno cualitativo ordinal. Tablas de Excel en mano, usaron un dato cualitativo (la clasificación) para obtener un dato cuantitativo (el conteo), concluyendo que “Dame algo” tiene 3 expresiones diferentes de nivel “explícito”, mientras que “Voy a llenarte toda” tiene 5.

Fuente: elaboración propia

Como las canciones no tienen la misma extensión (“Dame algo” tiene muchas más expresiones únicas que “Voy a llenarte toda”), para poder comparar los datos entre ellas las llevaron a una medida común: la proporción que ocupa cada categoría dentro del total de expresiones en cada canción. Tomaron entonces los datos para crear tablas de pivote en Excel, de las cuales sacaron un gráfico:

Fuente: elaboración propia

Concluyeron dos cosas del experimento: la primera, que las expresiones con contenido sexual explícito de “Dame algo” son mucho más “coloridas” que las de la otra canción; la segunda, que “Voy a llenarte toda” es proporcionalmente mucho más explícita teniendo en cuenta la extensión de la letra.

Después de unos segundos de silencio, Camila y su profesora  estallaron en carcajadas y más bien se pusieron a buscar más canciones en YouTube.

 

Escrita por:

 Andrés Meza Escallón

@ApoloDuvalis

https://elclavo.com/columnas-en-el-clavo/columnistas/andres-meza/

https://elclavo.com/author/ameza/

Comentarios

comentarios

Leave a Reply