2. Entorno de trabajo e instalacion

2.1 Conocimientos deseables

Antes de adentrarte en el desarrollo de modelos es util contar con algunos conocimientos previos. No son estrictamente obligatorios, pero facilitan la asimilacion de conceptos y el analisis de resultados.

  • Fundamentos de programacion en Python como variables, estructuras de control y funciones. tutorial recomendado
  • Nociones basicas de estadistica descriptiva e inferencial para interpretar distribuciones, dispersion y significancia.
  • Algebra lineal elemental (vectores, matrices) y familiaridad con operaciones matriciales simples.
  • Uso basico de la linea de comandos en tu sistema operativo para ejecutar scripts y administrar paquetes.

2.2 Instalacion de Python

El punto de partida es disponer de una version moderna de Python. Se recomienda trabajar con la rama estable mas reciente (3.13 o superior) para aprovechar las mejoras del lenguaje y la compatibilidad con los paquetes cientificos.

  1. Descarga el instalador correspondiente a tu sistema operativo desde el sitio oficial.
  2. En Windows, marca la opcion Add Python to PATH antes de iniciar la instalacion para evitar configuraciones manuales posteriores.
  3. En macOS y Linux puedes usar los instaladores nativos o un gestor de paquetes como Homebrew o apt.

Verifica que la instalacion sea correcta ejecutando el comando siguiente en una terminal.

python --version

Si tu sistema diferencia entre python y python3, utiliza la segunda opcion. Deberias ver una salida similar a Python 3.13.7.

2.3 Instalacion de las librerias esenciales

Con el interprete listo es momento de instalar el conjunto de librerias base para procesar datos y entrenar modelos.

  • scikit-learn: algoritmos y utilidades para aprendizaje supervisado y no supervisado.
  • NumPy: soporte para arreglos multidimensionales y operaciones vectorizadas de alto rendimiento.
  • Pandas: estructuras de datos tabulares y herramientas para limpieza y transformacion.
  • Matplotlib y Seaborn: graficos personalizables para explorar y comunicar resultados.

Instala todo el conjunto con pip.

pip install --upgrade pip
pip install scikit-learn numpy pandas matplotlib seaborn

Tras la instalacion puedes confirmar que los paquetes estan disponibles ejecutando python -m pip show scikit-learn.

2.4 Instalacion de Visual Studio Code

Da soporte al desarrollo instalando Visual Studio Code, un editor ligero con un ecosistema amplio de extensiones para ciencia de datos.

  1. Descarga el instalador para tu sistema operativo desde el sitio oficial y sigue los pasos guiados.
  2. Al iniciar VS Code por primera vez, instala la extension Python de Microsoft para habilitar autocompletado, depuracion y ejecucion interactiva.
  3. Configura la carpeta del proyecto como espacio de trabajo y selecciona el interprete correspondiente a tu entorno virtual desde la paleta de comandos.
  4. seleccionar interprete

Con esta configuracion podras editar notebooks, scripts y ejecutar tareas directamente desde el editor, manteniendo un flujo de trabajo coherente.