CIENCIA DE DATOS DESDE CERO. SEGUNDA EDICIÓN

CIENCIA DE DATOS DESDE CERO. SEGUNDA EDICIÓN

PRINCIPIOS BÁSICOS CON PYTHON

GRUS, JOEL

42,50 €
IVA incluido
Editorial:
ANAYA MULTIMEDIA
Año de edición:
2023
Materia
Informatica
ISBN:
978-84-415-4720-9
Páginas:
416
Colección:
Títulos especiales
42,50 €
IVA incluido
Añadir a favoritos

Agradecimientos
Sobre el autor

Prefacio a la segunda edición
Convenciones empleadas en este libro
Uso del código de ejemplo
Sobre la imagen de cubierta

Prefacio a la primera edición
Ciencia de datos
Partir de cero

1. Introducción
El ascenso de los datos
¿Qué es la ciencia de datos?
Hipótesis motivadora: DataSciencester
Localizar los conectores clave
Científicos de datos que podría conocer
Salarios y experiencia
Cuentas de pago
Temas de interés
Sigamos adelante

2. Un curso acelerado de Python
El zen de Python
Conseguir Python
Entornos virtuales
Formato con espacios en blanco
Módulos
Funciones
Cadenas
Excepciones
Listas
Tuplas
Diccionarios
Contadores
Conjuntos
Flujo de control
Verdadero o falso
Ordenar
Comprensiones de listas
Pruebas automatizadas y assert
Programación orientada a objetos
Iterables y generadores
Aleatoriedad
Expresiones regulares
Programación funcional
Empaquetado y desempaquetado de argumentos
args y kwargs
Anotaciones de tipos
Bienvenido a DataSciencester
Para saber más

3. Visualizar datos
matplotlib
Gráficos de barras
Gráficos de líneas
Gráficos de dispersión
Para saber más

4. Álgebra lineal
Vectores
Matrices
Para saber más

5. Estadística
Describir un solo conjunto de datos
Correlación
La paradoja de Simpson
Otras advertencias sobre la correlación
Correlación y causación
Para saber más

6. Probabilidad
Dependencia e independencia
Probabilidad condicional
Teorema de Bayes
Variables aleatorias
Distribuciones continuas
La distribución normal
El teorema central del límite
Para saber más

7. Hipótesis e inferencia
Comprobación de hipótesis estadísticas
Ejemplo: Lanzar una moneda
Valores p
Intervalos de confianza
p-hacking o dragado de datos
Ejemplo: Realizar una prueba A/B
Inferencia bayesiana
Para saber más

8. Descenso de gradiente
La idea tras el descenso de gradiente
Estimar el gradiente
Utilizar el gradiente
Elegir el tamaño de paso adecuado
Utilizar descenso de gradiente para ajustar modelos
Descenso de gradiente en minilotes y estocástico
Para saber más

9. Obtener datos
stdin y stdout
Leer archivos
Raspado web
Utilizar API
Ejemplo: Utilizar las API de Twitter
Para saber más

10. Trabajar con datos
Explorar los datos
Utilizar NamedTuples
Clases de datos
Limpiar y preparar datos
Manipular datos
Redimensionar
Un inciso: tqdm
Reducción de dimensionalidad
Para saber más

11. Machine learning (aprendizaje automático)
Modelos
¿Qué es el machine learning?
Sobreajuste y subajuste
Exactitud
El término medio entre sesgo y varianza
Extracción y selección de características
Para saber más

12. k vecinos más cercanos
El modelo
Ejemplo: el conjunto de datos iris
La maldición de la dimensionalidad
Para saber más

13. Naive Bayes
Un filtro de spam realmente tonto
Un filtro de spam más sofisticado
Implementación
A probar nuestro modelo
Utilizar nuestro modelo
Para saber más

14. Regresión lineal simple
El modelo
Utilizar descenso de gradiente
Estimación por máxima verosimilitud
Para saber más

15. Regresión múltiple
El modelo
Otros supuestos del modelo de mínimos cuadrados
Ajustar el modelo
Interpretar el modelo
Bondad de ajuste
Digresión: el bootstrap
Errores estándares de coeficientes de regresión
Regularización
Para saber más

16. Regresión logística
El problema
La función logística
Aplicar el modelo
Bondad de ajuste
Máquinas de vectores de soporte
Para saber más

17. Árboles de decisión
¿Qué es un árbol de decisión?
Entropía
La entropía de una partición
Crear un árbol de decisión
Ahora, a combinarlo todo
Bosques aleatorios
Para saber más

18. Redes neuronales
Perceptrones
Redes neuronales prealimentadas
Retropropagación
Ejemplo: Fizz Buzz
Para saber más

19. Deep learning (aprendizaje profundo)
El tensor
La capa de abstracción
La capa lineal
Redes neuronales como una secuencia de capas
Pérdida y optimización
Ejemplo: XOR revisada
Otras funciones de activación
Ejemplo: FizzBuzz revisado
Funciones softmax y entropía cruzada
Ejemplo: MNIST
Guardar y cargar modelos
Para saber más

20. Agrupamiento (clustering)
La idea
El modelo
Ejemplo: Encuentros
Eligiendo k
Ejemplo: agrupando colores
Agrupamiento jerárquico de abajo a arriba
Para saber más

21. Procesamiento del lenguaje natural
Nubes de palabras
Modelos de lenguaje n-Gram
Gramáticas
Un inciso: muestreo de Gibbs
Modelos de temas
Vectores de palabras
Redes neuronales recurrentes
Ejemplo: utilizar una RNN a nivel de carácter
Para saber más

22. Análisis de redes
Centralidad de intermediación
Centralidad de vector propio
Grafos dirigidos y PageRank
Para saber más

23. Sistemas recomendadores
Método manual
Recomendar lo que es popular
Filtrado colaborativo basado en usuarios
Filtrado colaborativo basado en artículos
Factorización de matrices
Para saber más

24. Bases de datos y SQL
CREATE TABLE e INSERT
UPDATE
DELETE
SELECT
GROUP BY
ORDER BY
JOIN373
Subconsultas
Índices
Optimización de consultas
NoSQL
Para saber más

25. MapReduce
Ejemplo: Recuento de palabras
¿Por qué MapReduce?
MapReduce, más general
Ejemplo: Analizar actualizaciones de estado
Ejemplo: Multiplicación de matrices
Un inciso: Combinadores
Para saber más

26. La ética de los datos
¿Qué es la ética de los datos?
No, ahora en serio, ¿qué es la ética de datos?
¿Debo preocuparme de la ética de los datos?
Crear productos de datos de mala calidad
Compromiso entre precisión e imparcialidad
Colaboración
Capacidad de interpretación
Recomendaciones
Datos sesgados
Protección de datos
En resumen
Para saber más

27. Sigamos haciendo ciencia de datos
IPython
Matemáticas
No desde cero
Encontrar datos
Haga ciencia de datos

Índice alfabético

Para aprender de verdad ciencia de datos, no solamente es necesario dominar las herramientas (librerías de ciencia de datos, frameworks, módulos y kits de herramientas), sino también conviene comprender las ideas y principios subyacentes. Actualizada para Python 3.6, esta segunda edición de Ciencia de datos desde cero muestra cómo funcionan estas herramientas y algoritmos implementándolos desde el principio. Si ya tiene aptitudes para las matemáticas y ciertas habilidades de programación, el autor, Joel Grus, le ayudará a familiarizarse con las mates y las estadísticas, que son el núcleo de la ciencia de datos, y con las habilidades informáticas necesarias para iniciarse como científico de datos. Repleto de nueva información sobre deep learning (aprendizaje profundo), estadísticas y procesamiento del lenguaje natural, este libro actualizado le muestra cómo sacar lo mejor de la sobreabundancia de datos que actualmente nos rodea.

Artículos relacionados

  • CÓDIGO. SEGUNDA EDICIÓN
    PETZOLD, CHARLES
    Los ordenadores están en todas partes, de forma más evidente en nuestros portátiles y 'smartphones', pero también en nuestros coches, televisiones, microondas, despertadores, aspiradoras y otros electrodomésticos inteligentes. ¿Alguna vez se ha preguntado qué hay dentro de estos dispositivos que hacen nuestra vida más fácil y, de vez en cuando, más exasperante Durante más de 20...
    Disponible en tienda

    49,95 €

  • CURSO AVANZADO DE MICROSOFT TEAMS
    FERNÁNDEZ GUTIÉRREZ, ISABEL
    Microsoft Teams es una aplicación de colaboración, comunicación y trabajo en equipo, la mejor que existe actualmente en el mercado, es capaz de no solo satisfacer las necesidades de comunicación, sino también las de colaboración y compartición de archivos y aplicaciones.Con este curso vas a aprender cómo sacarle todo el partido a la herramienta; aunque la uses a diario, vas a d...
    Disponible en tienda

    29,95 €

  • CORELDRAW
    LÓPEZ LÓPEZ, ANNA MARÍA
    CorelDRAW es un programa de diseño vectorial líder, con millones de usuarios en todo el mundo desde hace más de 30 años. Con este manual, obtendrá los conocimientos necesarios para sacar el máximo provecho de las posibilidades creativas de CorelDRAW y aprenderá las técnicas para obtener un rendimiento superior con las herramientas que han convertido a CorelDRAW en el programa m...
    Disponible en tienda

    35,95 €

  • PYTHON PARA ANÁLISIS DE DATOS
    MCKINNEY, WES
    Obtén el manual definitivo para manipular, procesar, limpiar y restringir conjuntos de datos en Python. Actualizado para Python 3.10 y pandas 1.4.0, esta tercera edición de Python para análisis de datos. Manipulación de datos con pandas, NyumPy y Jupyter está llena de casos prácticos, que permiten averiguar cómo resolver una amplia variedad de problemas de datos de una manera e...
    Disponible en tienda

    49,95 €

  • APRENDER VISUAL BASIC PARA APLICACIONES EN EXCEL CON 100 EJERCICIOS PRÁCTICOS
    GÓMEZ GUTIÉRREZ, JUAN ANTONIO
    Visual Basic for Applications (VBA) es el lenguaje de programación ideal para automatizar tareas repetitivas con macros y dar una mayor funcionalidad a los libros de Excel. Si quiere descubrir todas las soluciones que pueden aplicarse a los diferentes problemas con los que se puede encontrar como usuario de Excel, ha llegado al libro indicado. VBA ejecuta de forma sencilla y r...
    Disponible en tienda

    21,90 €

  • INTRODUCCIÓN A ARDUINO. 4.ª EDICIÓN
    BANZI, MASSIMO / SHILOH, MICHAEL
    Arduino es la plataforma para prototipos electrónicos de código abierto que se encuentra en el corazón del mundo Maker. Esta introducción exhaustiva, actualizada para el lanzamiento del IDE de Arduino más reciente y las nuevas placas basadas en ARM, le ayudará a empezar a crear prototipos de inmediato. Desde la obtención de los componentes requeridos a la adición de los últimos...
    Disponible en tienda

    29,95 €