Hola a todos!
Como ya sabeis, este verano estamos colaborando en una iniciativa de Microsoft para hablar de Inteligencia Artificial y acercarla a todos los que tengan interés.
Dentro de todo esto hemos ido dando charlas y asesorando a alumnos en distintos temas y en este caso queremos publicar cuales son los Modelos de Machine Learning más ámpliamente usados.
En este caso vamos a hablar de los 10 modelos más usados según lo que he ido leyendo y la experiencia que tenemos.
Antes de nada, debo decir que el introducir dos variables en este caso, o sea:
- Nuestra experiencia.
- Lo que hemos leido.
Se debe a que estos modelos pueden variar en función de la industria y con esto queremos escapar de los sesgos que puedan darnos nuestras carreras.
Vamos allá:
- Regresión Lineal: Comúnmente usada para la predicción de valores numéricos continuos basados en variables independientes.
- Regresión Logística: Usada para la clasificación binaria, para predecir una de dos categorías posibles.
- Redes Neuronales Artificiales (ANN): Es quizá el más famosos de todos y está inspirado en el funcionamiento del cerebro humano, se usa para tareas muy distintas, aunque todas de aprendizaje automático.
- Redes Neuronales Recurrentes (RNN): Basadas en el anterior, están diseñadas para procesamiento de datos de secuencia (texto, series temporales, …) Muy útiles para el procesamiento de lenguaje natural y predicción de series temporales.
- Redes Neuronales Convolucionales (CNN): Modelo destinado al procesamiento de datos de tipo imagen, ampliamente utilizadas en tareas de clasificación y detección de objetos.
- Árboles de Decisión: Usada para la clasificación y regresión que utilizan una estructura de árbol y se basa en elecciones sobre las características de los datos.
- Random Forest: Utiliza múltiples árboles de decisión lo que le permite unas predicciones más precisas y estables.
- Máquinas de Vectores de Soporte (SVM): Usado para clasificación y regresión, y son especialmente útiles en conjuntos de datos de alta dimensionalidad.
- K-Nearest Neighbors (KNN): Usado para clasificar en base a la similitud de características con los puntos de datos vecinos.
- XGBoost: Es una mejora de la ML de Gradient Boosting y actualmente es extremadamente popular ya que proporciona una gran eficiencia computacional y precisión.
Espero que os resulte útil
Un saludo