Tema 04 - Análisis Exploratorio de Datos

Ejercicio Práctico 1

Autores/as
Afiliación

Pedro Albarrán

Dpto. de Fundamentos del Análisis Económico. Universidad de Alicante

Alberto Pérez

Contexto del Ejercicio

  • Una firma de capital riesgo está evaluando startups fintech europeas para identificar oportunidades de inversión. Los datos contienen información financiera, operativa y de riesgo de 350 startups fundadas entre 2014-2023.

  • Los datos están disponibles en el archivo startups_fintech.csv; una descripción detallada de las variables en diccionario_startups.csv

IMPORTANTE:

  • Muestra tu análisis manual (aunque uses herramientas automatizadas como punto de partida), justificando tus decisiones.

  • No basta con mostrar gráficos o tablas, explica qué significan y por qué son relevantes.


Pregunta 1. Cargar, Explorar y Limpiar los Datos

Apartado 1.a.

  • Identifica problemas de calidad.

Apartado 1.b.

  • Identifica qué variables tienen tipos incorrectos y corrígelos. Justifica por qué necesitan ser convertidas

Apartado 1.c.

  • Detecta y elimina filas duplicadas.

  • Detecta y elimina variables redundantes.

Apartado 1.d.

  • ¿Qué variables tienen valores ausentes y cuántos en cada variable?

Pregunta 2: Análisis Exploratorio de Datos

Apartado 2.a. Distribución de las variables principales

  • Muestra tablas y/o gráficos de las variables que consideres más relevantes.

    • Pista: en otras, presta atención a subsector, etapa, pais, financiacion_total, valoracion, ltv_cac_ratio, rating_riesgo, tasa_retencion, probabilidad de éxito y empleados.
  • Comenta brevemente las características principales de las variables que se derivan de dichas tablas y/o gráficos.

    Entre otras cosas,

    • ¿Detectas inconsistencias en las categorías de alguna variable? En caso afirmativo, ¿cómo las corriges?

    • ¿Consideras que se pueden agrupar ciertas categorías para mejorar la interpretación?

    • ¿Algunas variables tienen distribuciones sesgadas o asimétricas?

    • ¿Algunas variables tienen valores extremos o “atípicos”?

  • Discute la información útil que se puede extraer de las variables analizadas a través de sus distribuciones o principales estadísticos.

Apartado 2.b. Relación entre variables

  • Estudia las relaciones que consideres más relevantes usando estadísticos y visualizaciones.

  • Discute brevemente cómo es la relación.

    • Por ejemplo, si es lineal o no, fuerte o débil, positiva o negativa, etc.
  • Entre otras, tu análisis debería abordar las siguientes cuestiones:

    1. Financiación por subsector.

    2. Relación financiación-valoración.

    3. ¿Qué características están relacionadas con el riesgo de las startups?

    4. Relación entre tasa_retencion y probabilidad de éxito.

    5. Comparar indicadores clave (financiación, valoración, probabilidad de éxito) entre los principales países.

    6. Patrones de madurez: ¿cómo cambian (o no) las características de las startups con la etapa?


Pregunta 3

Apartado 3.a

  • Comenta brevemente los 5 principales hallazgos (según tu opinión) de tu análisis

Apartado 3.b

  • Basándote en tu análisis, ¿qué recomendarías a la firma de capital riesgo?

    • Dónde buscar oportunidades
    • Qué evitar
    • Señales de alerta
    • Métricas críticas

Entrega del ejercicio

Rellenad este FORMULARIO con vuestros datos y subid

  • vuestro archivo de .qmd

  • el resultado de renderizarlo: bien un archivo autocontenido .html (o .pdf o .docx) o bien un archivo .html y el directorio relacionado con el mismo nombre; en ambos casos, se recomienda comprimir todo para enviarlo.

IMPORTANTE: el nombre de los ficheros que subáis DEBE seguir el siguiente formato que incluye vuestro número de DNI: ej.,

  • Tema04ej1_123456789.qmd

  • Tema04ej1_123456789.html

  • Tema04ej1_123456789.zip