Introducción práctica al Text Mining: procesamiento de textos con herramientas digitales

Este curso tiene como objetivo introducir en el análisis de datos no estructurados en formato textual. A lo largo de las semanas, aprenderás a aplicar herramientas en R de Text Mining, combinando metodologías cualitativas y análisis estadístico para procesar grandes volúmenes…

Modalidad:

100% online

Modalidad:

100% online

Duración:

4 semanas

Cursada:

Miércoles 18hs

Inicio:

11 de Marzo

Arancel:

Beneficios:

Cuotas sin interés

Seleccioná los cursos de la ruta:

Módulo 1:

  • Conceptos básicos: texto estructurado vs. no estructurado.
  • Expresiones regulares en R.

Módulo 2:

  • Limpieza y normalización de texto.
  • Tokenización y construcción de corpus.
  • Stemming y lematización.
  • POS Tagging.
  • Named Entity Recognition (NER).

Módulo 3:

  • TF-IDF y matriz documento-término.
  • Embeddings (Word2Vec / GloVe – introducción conceptual y aplicación).

Módulo 4:

  • Análisis de sentimiento.
  • Medidas de similitud y distancia.
  • Modelado de tópicos (LDA).

Equipo docente

Ariana Bardauil
Licenciada en ciencia política por la Universidad Nacional de La Matanza (UNLaM) y candidata a magíster en Generación y Análisis de la Información Estadística en la Universidad Nacional de Tres de Febrero (UNTREF). Docente de minería de texto en la UFLO Universidad y de demografía social en la UNLaM. Se desempeña como Data scientist en el Ministerio de Salud (GCBA), Co-organizadora de R en Buenos Aires y coordinadora del Núcleo de Innovación Social.

Público objetivo

Estudiantes, docentes e investigadoras/es de ciencias sociales, comunicación, salud y áreas afines interesadas en incorporar herramientas básicas de minería de texto con R.

Requisitos

Conocimientos básicos de R (uso de scripts, objetos y funciones) y contar con R y RStudio instalados en la computadora para realizar los ejercicios prácticos.

Cursos relacionados