Crea una cuenta o inicia sesi贸n

隆Contin煤a aprendiendo sin ning煤n costo! 脷nete y comienza a potenciar tu carrera

Aprende todo un fin de semana sin pagar una suscripci贸n 馃敟

Aprende todo un fin de semana sin pagar una suscripci贸n 馃敟

Reg铆strate

Comienza en:

5D
16H
24M
36S

Framework de ciencia de datos: herramientas para machine learning

3/16
Recursos

Aportes 9

Preguntas 5

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

The data science process


About feature engineering

Feature engineering is extracting relevant information from data regarding to the field it belongs.

I recommend you reading this book: https://www.repath.in/gallery/feature_engineering_for_machine_learning.pdf

I think if you wanna do a course in english, do completly in english and no the video in spanish and the speaker in english.

Data science framework

Terminolog铆a:

Data/Datos: unidades de informaci贸n o 鈥渉echos鈥 de observaciones.
Features: tipos de informaci贸n acerca de tus observaciones.
Filas: observaciones individuales o muestras.
Columnas: features que describen tus observaciones.
Outlier: punto(s) de datos o data point(s) que se comporta de forma extra帽a.
Pre-processing: preparar datos para su uso en un modelo de machine learning.
ETL pipeline: framework de data science para extraer, transformar y cargar.
un dataset com煤nmente viene en forma de tabla y tienen 2 componentes:
fila: es un registro, un datapoint. ejemplo: datos de un paciente en un hopital, datos de una cuenta de banco de un cliente. com煤nmente tienen un ID asignado.
columna: es una caracter铆stica de la informaci贸n, cada columna tiene un nombre. En ML supervisado siempre tendremos una columna target (output), que muestra la variable a predecir. y las dem谩s columnas nos servir谩n como input para poder predecir. ejemplo: input= nivel de az煤car en sangre, presi贸n arterial. output = paciente con o sin diabetes.

Tipos de datos

Num茅ricos: su feature es un n煤mero de tipo entero o flotante.
Categ贸rica: sus features representan una clase o tipo; usualmente se representan como un mapeo de n煤meros o un 鈥渙ne-hot鈥 vector.
Image: su feature representa una imagen.
Texto: su feature es en la forma de texto, sea corto (como Twitter) o largo (como en noticias).
NaN: su feature es desconocido o perdido.
Convertir datos categ贸ricos en etiquetas
los modelos de ML no pueden manejar strings(palabras) solo entienden n煤meros, as铆 que si queremos suministrar una variable categ贸rica a un modelo, primero debemos

transformarla a n煤mero.

podr铆amos asignar un id a cada categoria y listo pero los modelos no manejan bien las relaciones de los datos en esta forma de c贸digo, la forma mas optima de hacer esta conversi贸n es mediante 1-hot encoding el cual asigna a cada categor铆a un vector que se diferencia de los dem谩s por la posici贸n de un 1 en el vector, ejemplo:
鈥淪I鈥 > (1,0,0)
鈥淣O鈥 > (0,1,0)
鈥渢alvez鈥 > (0,0,1)

Pandas

esta librer铆a es la ideal para cargar y entender tus datos. los comandos mas basicos son:
pd.read_csv(): Leer un archivo CSV
df.head(): Muestra las primeras 5 filas
df.dtypes: Muestra el tipo de representaci贸n de los datos (float, int, object)

Visualizando tus datos

los gr谩ficos m谩s famosos para analizar tus datos son:
Histogramas: Te dice qu茅 tan 鈥渇recuentes鈥 y distribuidos son ciertos valores en tus datos.
Gr谩ficas de dispersi贸n: Muestra la relaci贸n entre 2 features grafic谩ndolos como pares ordenados. Te puede ayudar a detectar anomal铆as.

Pandas realmente es Amor a primer c贸digo. Es una verdadera seda para los dedos junto con Seaborn.

these classes is a basic example of how to study in london, usa, canada, australia,

I think this lesson should be two, one for explain data and the other related to Pandas, there is not a trouble about that, but I think is not correct to teach a practical lesson as a theoretical lesson 馃槮

CSV : Comma Separeted Value File (Archivo separado por comas)

I consider necesary to implementing a model to practice in this education videos, but is good, i can understand the concepts because in the last time, i was learn in my college. Greatings.

EXCELENTE INGLES !!!