🎃 Grandes descuentos en libros en línea, eformaciones y vídeos*. Código CALABAZA30. Pulse aquí
¡Acceso ilimitado 24/7 a todos nuestros libros y vídeos! Descubra la Biblioteca Online ENI. Pulse aquí
  1. Libros
  2. Data Scientist y lenguaje R - Autoformación en los aspectos básicos de la inteligencia artificial en el universo... (2a edición)

Data Scientist y lenguaje R Autoformación en los aspectos básicos de la inteligencia artificial en el universo... (2a edición)

Información adicional

  • 5% de descuento en todos los libros
  • Envío gratis a partir de 25 € de compra
  • Versión online gratis por un año

Características

  • Encuadernación rústica - 17 x 21 cm
  • ISBN: 978-2-409-03574-6
  • EAN: 9782409035746
  • Ref. ENI: EPT3DASR

Información adicional

  • 5% de descuento en todos los libros
  • Versión online digital, no descargable
  • Consultable en línea durante 10 años inmediatamente después de la validación del pago.

Características

  • HTML
  • ISBN: 978-2-409-03575-3
  • EAN: 9782409035753
  • Ref. ENI: LNEPT3DASR
El objetivo de este libro, que tiene dos enfoques diferentes de lectura, es ofrecer una formación completa y operacional en las data sciences. El primer enfoque permite al lector aprender a generar soluciones completas usando el lenguaje R y su ecosistema y el segundo, le permite adquirir un conocimiento profundo de las data sciences abstrayéndose del detalle del código R, usando para ello un arsenal de herramientas interactivas que hace que no sea necesario codificar en R...
Consultar extractos del libro Extracto del libro
  • Nivel Medio a Experto
  • Número de páginas 876 páginas
  • Publicación mayo 2022
  • Nivel Medio a Experto
  • Publicación mayo 2022
El objetivo de este libro, que tiene dos enfoques diferentes de lectura, es ofrecer una formación completa y operacional en las data sciences. El primer enfoque permite al lector aprender a generar soluciones completas usando el lenguaje R y su ecosistema y el segundo, le permite adquirir un conocimiento profundo de las data sciences abstrayéndose del detalle del código R, usando para ello un arsenal de herramientas interactivas que hace que no sea necesario codificar en R.

De este modo, el autor plantea un recorrido didáctico y profesional que, sin más requisitos previos que un nivel de enseñanza secundaria en matemáticas y una gran curiosidad, permita al lector:
• integrarse en un equipo de data scientists,
• abordar artículos de investigación en IA o data sciences,
• desarrollar en lenguaje R,
• y poder conversar con un equipo de proyecto que incluya data scientists.

Este libro no se limita a los algoritmos clásicos del Machine Learning (arboles de decisión, redes neuronales, etc.), sino que aborda diversos aspectos importantes como el tratamiento del lenguaje natural, las series temporales, la lógica difusa y la manipulación de imágenes.

No se evitan los aspectos prácticos o complicados. El libro enseña el acceso a las bases de datos, los procesos paralelos, la programación funcional y la orientación a objetos, la creación del API, la compartición de resultados de análisis con R Markdown y los dashboard Shiny, el estudio de las representaciones cartográficas e incluso, la implementación del Deep Learning con TensorFlow-2 y Keras.

Los lectores también demandaban que en esta tercera edición, se presentara un introducción al lenguaje Python y su interfaz con R, así como la instalación de una aplicación R/shiny que fuera accesible en internet, a través de un servidor Linux alojado en un cloud profesional. Una extensión a la utilización de R para los cálculos numéricos y matemáticos para la ingeniería, con el mismo espíritu que MatLab y el uso básico de una herramienta de prototipado rápido de modelos de Machine Learning (BigML) en «point and click», también permitirán al lector que no quiera utilizar R producir modelos de predicción sin codificar.

La dinámica del libro acompaña al lector paso a paso en la introducción al mundo de las data sciences y la evolución de sus competencias teóricas y prácticas. El manager podrá recorrer el libro después de haber leído atentamente el bestiario de las data sciences de la introducción, que presenta el tema ahorrando notación matemática o formalismos disuasorios, sin vulgarización excesiva.

Los programas R que se describen en el libro, se pueden descargar en el sitio web www.ediciones-eni.com y se pueden ejecutar paso a paso.


¡Nuevo! Rondas de preguntas disponibles con la versión online.

¡Ronda de preguntas
incluida en
la versión online !
  • Ponga a prueba sus conocimientos al final de cada capítulo
  • Evalúe sus competencias

Descargas

Introducción
  1. Data scientist, una profesión de moda
  2. Una nueva profesión: citizen data scientist
    1. 1. Un objetivo realista, convertirse en citizen datascientist
    2. 2. Análisis y valoración
    3. 3. Animación y especificación
    4. 4. Modelado e inferencia
    5. 5. Despliegue y mantenimiento en condiciones operativas
  3. Las data sciences
  4. El Big Data
  5. La dinámica de esta obra
    1. 1. Nuestros objetivos
    2. 2. La estructura del libro
      1. a. Los dos recorridos complementarios
      2. b. Recursos adicionales para utilizar
  6. Pequeño bestiario de los data sciences
    1. 1. Los fundamentos
      1. a. Aprendizaje y clasificación
      2. b. Pequeño vocabulario gráfico de lamachine learning
      3. c. Regresión
      4. d. Regresión lineal generalizada
      5. e. Árboles de decisión, prune, poda
      6. f. Clustering, k-means
      7. g. k-NN
      8. h. Modelos paramétricos
      9. i. Lazy algorithm (algoritmo perezoso)
      10. j. Overfitting: sobre-determinación, sobre-aprendizaje
      11. k. Validación creciente, regularización,bagging
      12. l. Optimización, método del gradiente
      13. m. Algoritmo glotón (greedy algorithm)
      14. n. Programación lineal, simplex, punto interior
      15. o. Estimación a través del métodode Monte-Carlo
      16. p. Entropía, independencia e informaciónmutua
      17. q. Discretización
    2. 2. Métodos «conjunto»
      1. a. Random forest
      2. b. AdaBoost (adaptative boosting)
    3. 3. Leyes de probabilidad y distribución
      1. a. Generalidades
      2. b. Pequeño bestiario de las leys de probabilidad
    4. 4. Los grafos
      1. a. Vocabulario básico
      2. b. Conversión de un array de observaciones engrafo, parecido
  7. Informática profesional y data sciences
    1. 1. La tecnología
    2. 2. Business Intelligence versus Big Data
      1. a. Diferencias en términos de arquitectura
      2. b. Diferencias en términos de uso
      3. c. Síntesis
  8. Notaciones
    1. 1. Notaciones de los argumentos
    2. 2. Otras notaciones
      1. a. Funciones y aplicaciones… f(x), d(x,y) …
      2. b. Algunas posibles confusiones
  9. Ahora le toca a usted
Primeros pasos con R
  1. Instalación de los componentes
    1. 1. Instalación y ejecución de R
    2. 2. Instalación y ejecución de RStudio
    3. 3. Instalación de nuevos paquetes
    4. 4. Instalación de paquetes: complementos
  2. Empezando con R
    1. 1. R, una calculadora eficaz
    2. 2. R, un lenguaje vectorizado
    3. 3. Funciones que actúan sobre vectores
      1. a. Un primer análisis rápido de losdatos
      2. b. Algunas estadísticas simples sobre los vectores
      3. c. Ordenar un vector
      4. d. Diversas funciones con suma, producto, mínimoy máximo
    4. 4. Tipos de datos simples
      1. a. Los booleanos
      2. b. Los conjuntos
      3. c. Las listas
      4. d. Los factores
      5. e. Las tablas
    5. 5. Las funciones
      1. a. Creación y utilización de una funciónsimple
      2. b. Crear un operador a partir de una funciónde dos variables
      3. c. Uso de funciones y ámbito de las variables
      4. d. Aplicaciones de las funciones en las matrices: apply
      5. e. Complementos útiles
    6. 6. Estructuras de control
      1. a. Instrucciones comunes con otros lenguajes
      2. b. Recorrer una matriz con bucles for
    7. 7. Las cadenas de caracteres
    8. 8. Formatear números
    9. 9. Las fechas y las horas
    10. 10. Medida de la duración de un algoritmo
    11. 11. Los números complejos
      1. a. Operaciones básicas de los númeroscomplejos
      2. b. Visualización de números complejos
    12. 12. Programación orientada a objetos
      1. a. Clases y objetos, resumido
      2. b. Constructores
      3. c. Herencia
      4. d. Objetos mutables
      5. e. Gestión de la pila: implementaciónorientada a objetos con RC
  3. Manipulación de los datos
    1. 1. Lectura de los datos: aspectos fundamentales
    2. 2. Manipulación de las columnas de un data.frame
    3. 3. Cálculos simples en un data.frame
      1. a. Cálculos en las columnas y las filas
      2. b. Manipulación de las filas
      3. c. Aplicación: comparación elementosde clases y Khi-2
      4. d. Creación de columnas calculadas
      5. e. Ordenar un data.frame con order()
    4. 4. Análisis visual de los datos
      1. a. Visualización simple de los datos
      2. b. Visualización de las variables numéricas2 a 2, con mención de las clases
      3. c. Correlaciones entre variables numéricas
      4. d. Separación por clase, ggplot2, qplot
      5. e. Visualización 3D, relación entretres variables numéricas
      6. f. Gráficos por parejas
      7. g. Diagrama de caja e intento de eliminaciónde los outliers
      8. h. Creación de un modelo por árbolde decisión
Dominar los conceptos básicos
  1. Estar en armonía con los datos
    1. 1. Algunas nociones principales
      1. a. Fenómeno aleatorio
      2. b. Probabilidad, variable aleatoria y distribución
      3. c. Un poco de matemáticas: notacióny definiciones útiles
      4. d. Momentos de una variable aleatoria discreta X
      5. e. Primeras consideraciones sobre los errores y estimaciones
    2. 2. Familiarizarse con sus datos
      1. a. R Commander
      2. b. Rattle
  2. Matrices y vectores
    1. 1. Convenciones, notaciones, utilización básica
    2. 2. Matrices, vectores: de una introducción hastala noción de aprendizaje supervisado
    3. 3. Más allá en la manipulaciónde las matrices con R
      1. a. Operaciones básicas
      2. b. Algunos conocimientos prácticos útilessobre las matrices de R
      3. c. Normas de vectores y normas de matrices
      4. d. Matrices y vectores: diversas sintaxis útiles
  3. Estimaciones
    1. 1. Posicionamiento del problema de estimación
      1. a. Formulación general del problema
      2. b. Aplicación y reformulación del problemade estimación
    2. 2. Los indicadores de desvío utilizados en machinelearning
      1. a. MSE, RMSE, SSE, SST
      2. b. MAE, ME
      3. c. NRMSE/NRMSD, CV_RMSE
      4. d. SDR
      5. e. Accuracy, R2
  4. Puesta en práctica: aprendizaje supervisado
    1. 1. Preparación
    2. 2. Probar las hipótesis, p_value
      1. a. Análisis gráfico interactivo coniplots
      2. b. Test de Breusch-Pagan y zoom sobre p_value
    3. 3. Creación de un modelo (regresiónlineal múltiple)
    4. 4. Establecimiento de una predicción
    5. 5. Estudio de los resultados y representaciones gráficas
    6. 6. Indicadores actuales - cálculos
    7. 7. Estudio del modelo lineal generado
    8. 8. Conclusión sobre el modelo lineal
    9. 9. Utilización de un modelo «RandomForest»
Técnicas y algoritmos esenciales
  1. Construir su caja de herramientas
  2. Representación gráfica de los datos
    1. 1. Un gráfico «simple»
    2. 2. Histogramas evolucionados
      1. a. Distribución multiclase
      2. b. Mezcla de varias distribuciones por clase
      3. c. Visualización de la densidad de una distribución
      4. d. Otra mezcla por clase
      5. e. Una variable, un histograma para cada clase
      6. f. Gráfico con una densidad por clase
    3. 3. Diagrama de pares y facetas
      1. a. Diagrama de pares, versión simple
      2. b. Clases de configuración XOR
      3. c. Diagrama de pares con «factores»
      4. d. Facetas y escala logarítmica
  3. Machine learning: prácticas habituales
    1. 1. Recorrido teórico acelerado
      1. a. Linealidad
      2. b. Errores in y out, noción de VC dimensión
      3. c. Hiperplanos, separabilidad con márgenes
      4. d. Kernel Trick, núcleos, transformaciones,feature space
      5. e. Problemas de la regresión: introduccióna la regularización
    2. 2. Práctica por práctica
      1. a. Cross validation: k-fold CV
      2. b. Naive Bayes
      3. c. C4.5 y C5.0
      4. d. Support Vector Machines (SVM)
      5. e. Clusterisation, k-means
  4. ¿Dónde estamos en nuestro aprendizaje?
    1. 1. Sus conocimientos adquiridos operativos
    2. 2. Las eventuales lagunas que hay que completar ahora
Marco metodológico del data scientist
  1. El problema de metodología a nivel de proyecto
    1. 1. Expresar la necesidad
    2. 2. La gestión del proyecto
  2. El ciclo interno de las data sciences
    1. 1. Revisión en detalle del problema planteado
    2. 2. Trabajos preliminares sobre los datos
      1. a. Obligaciones sobre los datos
      2. b. Recopilación, limpieza y compresiónde los datos
    3. 3. El ciclo de modelización
      1. a. Feature engineering
      2. b. Modelización y evaluación
      3. c. Elección del mejor modelo
      4. d. Prueba, interpretación y confrontacióncon el negocio
    4. 4. Preparación de la industrializacióny el despliegue
    5. 5. Preparación de las siguientes iteraciones
      1. a. Elementos que se deben tener en cuenta
      2. b. Documentación gestionada por los data scientists
  3. Complementos metodológicos
    1. 1. Clasificar sus objetivos
    2. 2. Trucos
Procesamiento del lenguaje natural
  1. Posicionamiento del problema
  2. Análisis semántico latente y SVD
    1. 1. Aspectos teóricos
      1. a. SVD: generalidades
      2. b. Una justificación de la descomposiciónSVD
      3. c. SVD en el contexto LSA
      4. d. Interpretación
      5. e. Alternativa no lineal, Isomap (MDS, geodésica,variedad, manifold)
    2. 2. Puesta en práctica
      1. a. Inicialización
      2. b. En el corazón de LSA
      3. c. Resultados
      4. d. Manipulaciones, interpretaciones recreativas y nofundadas
Grafos y redes
  1. Introducción
  2. Primeros pasos
    1. 1. Algunas nociones y notaciones adicionales básicas
    2. 2. Manipulaciones sencillas de grafos con R
    3. 3. Estructura de los grafos
  3. Grafos y redes (sociales)
    1. 1. Análisis de las redes sociales: conceptosbásicos
    2. 2. Puesta en práctica
    3. 3. Detección de comunidades
Otros problemas otras soluciones
  1. Series temporales
    1. 1. Introducción
    2. 2. Modelo estacional
      1. a. Procesos estacionales: aspectos básicos
      2. b. Proceso autorregresivo AR: ir más allá
      3. c. Consideraciones (muy) útiles
    3. 3. Procesos no estacionales
      1. a. El modelo ARIMA
      2. b. Procesos estacionales: SARIMA
      3. c. Modelos ARCH y GARCH
      4. d. Convolución y filtros lineales
    4. 4. Puesta en práctica
      1. a. Aspectos básicos de la manipulaciónde las series temporales en R
      2. b. Estudio de series temporales
      3. c. Predicciones sobre ARIMA (AR MA SARIMA)
    5. 5. Minibestiario ARIMA
  2. Sistemas difusos
    1. 1. Introducción
    2. 2. La lógica difusa en la práctica(sistemas expertos)
  3. Enjambre (swarm)
    1. 1. Swarm y optimización: el algoritmo PSO
      1. a. Presentación de PSO
      2. b. Descripción de PSO
    2. 2. Puesta en práctica de PSO
Feature Engineering
  1. Feature Engineering, conceptos básicos
    1. 1. Posicionamiento del problema
    2. 2. A qué hay que prestar atención
      1. a. La calidad de la distribución
      2. b. La naturaleza de las features
    3. 3. Dominar la dimensionalidad
    4. 4. Una solución verificada: la PCA
    5. 5. Un ejemplo sencillo de utilización de laPCA
    6. 6. Los valores desconocidos y las features mal condicionadas
    7. 7. Creación de nuevas features
    8. 8. A modo de conclusión
  2. PCA clásico, elementos matemáticos
  3. Reducción de los datos (data reduction)
  4. Reducción de la dimensionalidad y entropía
    1. 1. Descripción teórica del problema
    2. 2. Implementación en R y discusión
Complementos útiles
  1. GAM: generalización de LM/GLM
  2. Manipulación de imágenes
    1. 1. Creación, visualización, lecturay escritura de imágenes
    2. 2. Transformación de las imágenes
      1. a. Ejemplos de manipulación del color y de lasintensidades
      2. b. Ejemplos de manipulación de la geometríade la imagen
      3. c. Aplicación de filtros sobre las imágenes
  3. Como crear una muestra: LHS (hypercube latin)
  4. Trabajar sobre datos en el espacio
    1. 1. Variograma
      1. a. Campo y variable regionalizada
      2. b. Determinación del variograma
    2. 2. Krigeage (kriging)
      1. a. La teoría, en resumen
      2. b. Implementación en R
  5. Conocimientos prácticos útiles
    1. 1. Trazar una curva ROC
    2. 2. Una red neuronal (primeros pasos hacia el deep learning)
  6. Gradiente Boosting y Generalized Boosted Regression
    1. 1. Los grandes principios
    2. 2. Los argumentos y los usos (paquete GBM)
      1. a. Covarianza
      2. b. Loss
      3. c. Optimización del algoritmo
    3. 3. Puesta en práctica
Full Stack R
  1. ¿Por qué este capítulo?
  2. Programación funcional y/o defensiva
  3. Persistencia, bases de datos y R
  4. Paralelización
  5. Recolectar datos externos
  6. Crear una API con R
Compartir sus análisis
  1. Escribir en Markdown
    1. 1. Introducción
    2. 2. Sintaxis de Markdown
  2. Crear un archivo R Markdown
    1. 1. Encabezado de R Markdown
    2. 2. Formatear el código
    3. 3. Insertar y ejecutar código R
    4. 4. Ejecutar código R
    5. 5. Generar el informe
    6. 6. Publicar su informe con RPubs
  3. Crear su primera aplicación Shiny
    1. 1. Introducción
    2. 2. Instalación en RStudio y preámbulo
    3. 3. Organizar los archivos de la aplicación
    4. 4. Sintaxis de los inputs y outputs
    5. 5. Paginación y organización visualdel contenido
    6. 6. Modificar el tema de la aplicación
    7. 7. Generar la aplicación
    8. 8. Desplegar la aplicación en la Web
    9. 9. Shiny Dashboard
Cartografía
  1. ¿Por qué estudiar las representaciones cartográficas?
  2. Acceder a la información geográfica
  3. Creación de mapas estáticos con R
  4. Creación de mapas dinámicos con R
En torno a los datos
  1. Presentación del capítulo
  2. Captura directa y rápida de un dataset
  3. Análisis de la conformación de las distribuciones respecto a la distribución normal
  4. Dependencia lineal entre variables
  5. Resalte de las diferencias entre las distribuciones
  6. Puntos atípicos
  7. Ordenaciones y agregaciones
    1. 1. Ordenaciones automatizadas
    2. 2. Cálculos sobre las agregaciones
    3. 3. Extracción, pivotado y ordenaciónrápida de datos de un dataframe
    4. 4. Utilización de los joins
      1. a. Enriquecimiento de un dataframe usando joins
      2. b. Joins de decodificación o transformación;ej.: factor to integer
    5. 5. Aplicar funciones variables a los datos
    6. 6. Complementos en materia de metaprogramación
      1. a. Quoting aplicado a los gráficos
      2. b. Definición de una macro
Análisis numérico y matemáticas operativas
  1. Cálculos numéricos del tipo Matlab
    1. 1. Consideraciones prácticas
    2. 2. Visión general de la precisión denuestra máquina
    3. 3. Un paquete que tiene las mismas instrucciones queMatlab
    4. 4. Algunos complementos para los números complejos
    5. 5. Algunos complementos sobre las matrices
      1. a. Creación de matrices básicas
      2. b. Creación de matrices de númerosaleatorios
      3. c. Cálculos sobre las matrices de enteros
  2. Un poco de álgebra lineal
    1. 1. Ejemplo de creación de una base ortonormal
    2. 2. Proyección sobre subespacios vectoriales
  3. Funciones y sistemas de ecuaciones, 1 a n variables
    1. 1. Función de una variable
      1. a. Exploración de varias trazas
      2. b. Sobre las raíces de una función
    2. 2. Función de varias variables
      1. a. Representación de una función realde dos variables reales
      2. b. Búsqueda del mínimo de una funciónde dos dimensiones
    3. 3. Sistema de ecuaciones no diferenciales, lineales ono
      1. a. Sistema de ecuaciones lineales
      2. b. Sistema de ecuaciones no lineales no diferenciales,n = m
  4. Derivación de funciones
    1. 1. Derivada simbólica y numérica conR-base
    2. 2. Derivadas usando paquetes específicos
    3. 3. Derivada de funciones especiales
  5. Sobre la integración
    1. 1. Cálculo de una integral múltiple
    2. 2. Otras integrales, la integral impropia
  6. Funciones especiales y ecuaciones diferenciales
    1. 1. Otras funciones especiales
      1. a. Funciones de Airy y de Bessel
      2. b. La función de error erf
    2. 2. Ecuación diferencial ordinaria normalizadade orden 1
    3. 3. Ecuación diferencial de segundo grado (problemade los límites)
      1. a. EQD lineal (2.º grado)
      2. b. EQD no lineal (2.º grado)
  7. Elementos prácticos de cálculo diferencial
    1. 1. Funciones reales de un real
    2. 2. Funciones reales de un vector
      1. a. Cálculo de las derivadas parciales
      2. b. Cálculos de operadores que usan las derivadasparciales
    3. 3. Funciones vectoriales de un vector
  8. Cálculo simbólico con SymPy
    1. 1. Documentación para consultar
    2. 2. Acceder a los resultados en R Markdown
R y Python
  1. Una polémica estéril, pero real: ¿R o Python?
  2. Ejemplos de códigos R y Python comparables
    1. 1. Códigos triviales
    2. 2. Paquetes
    3. 3. Funciones simples
    4. 4. Estructuras de datos
    5. 5. Booleanos
    6. 6. Programación básica
    7. 7. Creación de funciones
    8. 8. Bloques e indentación
    9. 9. Datasets
  3. Acceder a Python desde R
    1. 1. Instalar e inicializar el contexto técnico
    2. 2. Interacciones R y Python desde el punto de vista deR
      1. a. Compartir variables y ejecución de códigoPython en el biotipo R
      2. b. Librerías Python en el código R,ejemplos NLP
  4. Consideraciones sobre los casos complicados
Deep learning con Tensorflow y Keras
  1. Deep learning según Google
  2. Instalar e inicializar su contexto técnico
  3. Tensores TensorFlow/Keras
    1. 1. Forma de los tensores
    2. 2. Manipular tensores
    3. 3. Otro uso del framework
  4. Puesta a punto de un modelo de referencia usando caret
  5. Crear un modelo con TensorFlow 2 y Keras
    1. 1. Inicializar y preparar los datos
    2. 2. Etapa 1: describir la estructura de red
    3. 3. Etapa 2: compilar el modelo
    4. 4. Etapa 3: training
BigML, machine learning para todos
  1. Introducción
  2. ¿Para quién?
  3. Presentación del enfoque
  4. Manipulación de las fuentes de datos
  5. Creación de proyectos
  6. Manipulación de los datasets
  7. División del juego de datos
  8. Creación de un modelo de machine learning
    1. 1. Argumentos de los modelos
    2. 2. Visualización del modelo
    3. 3. Filtrado y poda
    4. 4. Otras visualizaciones
  9. Evaluación del modelo
  10. Compartir sus modelos
  11. Realizar una primera predicción
  12. Utilización del modelo en R
Despliegue Shiny en su propio Cloud
  1. Introducción
  2. Alquiler de un servidor
  3. Creación de una máquina virtual
  4. Conectarse en remoto a su máquina
    1. 1. Instalación del cliente SSH
      1. a. OpenSSH
      2. b. Git Bash
    2. 2. Generación de las claves públicay privada
    3. 3. Gestión de paquetes
  5. Añadir los componentes de software básicos
  6. Instalación de R y Shiny
  7. Configuración de red y Linux
    1. 1. Configurar la VCN (Virtual Cloud Network)
    2. 2. Gestión del firewall
    3. 3. Obtener una aplicación de monitoring: htop
    4. 4. Obtener un servidor HTTP (Apache)
    5. 5. Instalación de Webmin
Anexos
  1. Utilidad de estos anexos
  2. Fórmulas
  3. Estrategias en función de la naturaleza de los datos
    1. 1. Conteos
    2. 2. Proporciones
    3. 3. Variable de respuesta binaria
    4. 4. Datos que inducen un modelo mixto (mixed effect)
    5. 5. Gráficos
    6. 6. Análisis de supervivencia (survival analysis)
  4. Filtros (sobre imágenes)
  5. Distancias
  6. Trucos y pequeños consejos
    1. 1. Sobre las pruebas
    2. 2. Gestión de las variables
    3. 3. Análisis y manipulación de resultados
      1. a. Residuos
      2. b. Manipulación de los modelos
  7. Paquetes y temas para estudiar
    1. 1. Crear su propio paquete
    2. 2. Reglas de asociación
    3. 3. Exportar un modelo
    4. 4. Tensores
    5. 5. SVM para la detección de novedades (noveltydetection)
  8. Vocabulario y «tricks of the trade»
    1. 1. Complementos sobre las bases del machine learning
    2. 2. Complementos sobre los aspectos bayesianos
    3. 3. Vocabulario (del inglés) de los modelos gaussianos
  9. Algoritmos que se deben estudiar
  10. Algunas formulaciones del álgebra lineal
  11. Bibliografía
Conclusión
  1. Conclusión
Autor : Eva  LAUDE

Eva LAUDE

Eva LAUDE desarrolla sus actividades de consultoría y gestión de proyectos en Data science en diversos sectores, como el INSEE, empresas de biotecnología o ESNs. Además de sus actividades profesionales como desarrolladora de R-Shiny, organiza data-challenges en varias organismos y escuelas donde trabaja como profesora asociada. Geek y apasionada de R, DataViz y Data Journalisme, no duda en compartir sus conocimientos con numerosos tutoriales y participa en la revista académica Management&Data Science.
Más información
Autor : Henri LAUDE

Henri LAUDE

Henri LAUDE es un reconocido profesional de las Computer Sciences. Ha supervisado numerosos trabajos de I+D en data sciences, IA, Fintech, detección de fraude y despliegue de arquitecturas Big Data. Es cofundador de Advanced Research Partners, donde impulsa el diseño de algoritmos altamente innovadores. Premiado en varias ocasiones por sus soluciones innovadoras, como en el Data Intelligence Forum con una IA especializada en inteligencia económica llamada DxM (por Deus eX Machina), está involucrado en proyectos tan variados como el desarrollo de un exoesqueleto inteligente o la IA de ciber protection.
Más información

Novedades

Ver más