Abierto el Call For Participation para COSET, un proyecto de Mediaflows y PRHLT (UPV) para clasificar Tweets integrado en el Congreso SEPLN 2017

Mediaflows organiza en colaboración con el Pattern Recognition and Human Language Technology research center (PRHLT) una de las tareas que tendrán lugar en el próximo Congreso Nacional de la Sociedad Española de Procesamiento de Lenguaje Natural (SEPLN). En concreto, se trata de la tarea Classification Of Spanish Election Tweets (COSET), en la que los participantes tendrán que desarrollar un sistema de clasificación automatizado de tweets de contenido político. Esta tarea forma parte del workshop IberEval 2017 (Evaluation of Human Language Technologies for Iberian languages), integrado en el Congreso de la SEPLN 2017. Está reunión científica tendrá lugar en Murcia, y los talleres y tutoriales se celebrarán el día 19 de septiembre de 2017. 

COSET tiene como objetivo la clasificación temática de un corpus de tweets escritos en castellano correspondientes a la precampaña y campaña de las Elecciones Generales de 2015 en España. De acuerdo con la metodología establecida en el grupo Mediaflows, esta clasificación seguirá la propuesta por el profesor de la Harvard Kennedy School Thomas Patterson en su libro The Mass Media Election: How Americans Choose Their President (1980). Se distinguirán cinco categorías: political issues, temas relacionados con la confrontación política más abstracta; policy issues, temas sobre políticas sectoriales; personal issues, temas relacionados con la vida y las actividades de los candidatos; campaign issues, temas sobre la evolución de la campaña; y otros temas.

La fase de entrenamiento de COSET comienza el 20 de marzo. En ella, se proporcionará a los investigadores que deseen participar una tabla con los identificadores de tweets y su clasificación según la tipología de Patterson. Este corpus proviene de una codificación manual llevada a cabo por un equipo de tres investigadores. Únicamente se proporcionarán aquellos id cuya clasificación temática tuvo pleno acuerdo entre el equipo de codificadores.

Este proyecto se integra dentro del principal objetivo de investigación en Mediaflows: el análisis de la influencia en la campaña electoral. En concreto, la creciente esfera pública de Twitter requiere metodologías innovadoras que permitan conocer mejor el flujo de la agenda temática discutida entre usuarios. Mediante este proyecto, Mediaflows pretende contribuir a encauzar el esfuerzo de los investigadores del área de Procesamiento de Lenguaje Natural (PLN) hacia un campo tan crucial en comunicación política como son las redes sociales.

Para el proyecto COSET, Mediaflows cuenta con la colaboración del centro de investigación PRHLT. Esta institución forma parte de la Universitat Politècnica de València. Sus investigadores trabajan, entre otras, en las áreas de Procesamiento del Lenguaje Natural, Procesamiento de Imágenes, Aprendizaje Automático y Aprendizaje Profundo.

Los coordinadores de este proyecto son, por parte de Mediaflows, Tomás Baviera (Universidad Internacional de Valencia), Germán Llorca, José Gámir (Universitat de València) y Dafne Calvo (Universidad de Valladolid); y por parte de PRHLT, Maite Giménez, Paolo Rosso y Roberto Paredes (Universitat Politècnica de València).

Enlaces de interés

COSET http://mediaflows.es/coset/

PRHLT https://www.prhlt.upv.es/wp/

IberEval 2017 http://sepln2017.um.es/ibereval.html

SEPLN 2017 http://sepln2017.um.es/index.html