Se trabajó con cerca de 7.000 comentarios realizados por estudiantes a cursos y docentes durante un año. De estos, se marcaron manualmente 2.000 registros indicando su polaridad (positivo-negativo en una escala de 0 a 3) y se clasificaron los comentarios en 20 categorías predefinidas no mutuamente excluyentes, correspondientes a los aspectos de la enseñanza tratados en cada uno. Esto se relizó en conjunto con la Facultad de Educación de la Universidad.
Los textos fueron preprocesados y los modelos de tópicos fueron construidos utilizando Latent Dirichlet Allocation (LDA). Se vectorizaron los textos usando Bag of Words y LDA, y se entrenaron metodologías de aprendizaje de máquinas (Naive Bayes, Logit, SVM, Boosting de árboles) evaluando su capacidad predictiva para escoger el mejor modelo.