Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

MINERIA DE BASE DE DATOS, Resúmenes de Programación de Bases de Datos

RESUMEN DE MINERIA DE BASE DE DATOS

Tipo: Resúmenes

2022/2023

Subido el 08/05/2023

elias-ochoa-3
elias-ochoa-3 🇲🇽

1 documento

1 / 9

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
¿Qué es la minería de datos?
La minería de datos es una técnica asistida por computadora que se utiliza en los
análisis para procesar y explorar grandes conjuntos de datos. Gracias a las
herramientas y métodos de minería de datos, las organizaciones pueden descubrir
patrones y relaciones ocultas en sus datos. La minería de datos transforma datos
en bruto en conocimiento práctico. Las compañías utilizan dicho conocimiento para
resolver problemas, analizar las consecuencias en el futuro de decisiones
empresariales y aumentar sus márgenes de beneficio.
¿Qué significa el término minería de datos?
“Minería de datos” es un término erróneo porque el objetivo de esta actividad no es
extraer o minar los datos en sí. Más bien, ya existe una gran cantidad de datos, y la
minería de datos extrae un significado o un conocimiento valioso de estos. A
continuación, se describe el proceso habitual de recopilación, almacenamiento,
análisis y minería de datos.
La recopilación de datos consiste en capturar datos de diferentes orígenes,
como los comentarios de los clientes, los pagos y las órdenes de compra.
El almacenamiento de datos es el proceso de guardar esos datos en una
gran base de datos o almacenamiento de datos.
El análisis de datos consiste en el procesamiento, almacenamiento y análisis
posteriores de los datos por medio de complejos programas de software y
algoritmos.
La minería de datos es una rama de los análisis de datos o una estrategia de
análisis que se utiliza para encontrar patrones ocultos o previamente
desconocidos en los datos.
¿Por qué es importante la minería de datos?
La minería de datos constituye un elemento crucial para cualquier iniciativa de
análisis exitosa. Las empresas pueden utilizar el proceso de descubrimiento de
conocimientos para aumentar la confianza de los clientes, encontrar nuevas fuentes
pf3
pf4
pf5
pf8
pf9

Vista previa parcial del texto

¡Descarga MINERIA DE BASE DE DATOS y más Resúmenes en PDF de Programación de Bases de Datos solo en Docsity!

¿Qué es la minería de datos? La minería de datos es una técnica asistida por computadora que se utiliza en los análisis para procesar y explorar grandes conjuntos de datos. Gracias a las herramientas y métodos de minería de datos, las organizaciones pueden descubrir patrones y relaciones ocultas en sus datos. La minería de datos transforma datos en bruto en conocimiento práctico. Las compañías utilizan dicho conocimiento para resolver problemas, analizar las consecuencias en el futuro de decisiones empresariales y aumentar sus márgenes de beneficio. ¿Qué significa el término minería de datos? “Minería de datos” es un término erróneo porque el objetivo de esta actividad no es extraer o minar los datos en sí. Más bien, ya existe una gran cantidad de datos, y la minería de datos extrae un significado o un conocimiento valioso de estos. A continuación, se describe el proceso habitual de recopilación, almacenamiento, análisis y minería de datos.

  • La recopilación de datos consiste en capturar datos de diferentes orígenes, como los comentarios de los clientes, los pagos y las órdenes de compra.
  • El almacenamiento de datos es el proceso de guardar esos datos en una gran base de datos o almacenamiento de datos.
  • El análisis de datos consiste en el procesamiento, almacenamiento y análisis posteriores de los datos por medio de complejos programas de software y algoritmos.
  • La minería de datos es una rama de los análisis de datos o una estrategia de análisis que se utiliza para encontrar patrones ocultos o previamente desconocidos en los datos. ¿Por qué es importante la minería de datos? La minería de datos constituye un elemento crucial para cualquier iniciativa de análisis exitosa. Las empresas pueden utilizar el proceso de descubrimiento de conocimientos para aumentar la confianza de los clientes, encontrar nuevas fuentes

de ingresos y lograr que los clientes regresen. Una minería de datos eficaz resulta de gran utilidad para diversos aspectos de la planificación empresarial y la administración de las operaciones. A continuación, se presentan algunos ejemplos de cómo diferentes sectores utilizan la minería de datos. Telecomunicaciones, medios y tecnología Los sectores verticales de alta competencia, como las telecomunicaciones, los medios y la tecnología utilizan la minería de datos para mejorar el servicio de atención al cliente mediante la búsqueda de patrones en el comportamiento de estos. Por ejemplo, una empresa podría analizar los patrones de uso del ancho de banda y proporcionar actualizaciones o recomendaciones de servicio personalizadas. Banca y seguros Los servicios financieros pueden utilizar aplicaciones de minería de datos para resolver problemas complejos de fraude, cumplimiento, gestión de riesgos y deserción de clientes. Por ejemplo, las compañías de seguros pueden descubrir el precio óptimo del producto al comparar el rendimiento del producto en el pasado con los precios de la competencia. Educación Los proveedores de educación pueden utilizar algoritmos de minería de datos para evaluar a los estudiantes, personalizar las lecciones y hacer que el aprendizaje sea más lúdico. Una visión unificada y basada en datos del avance de los alumnos puede ayudar a los educadores a determinar qué necesitan estos y a apoyarlos mejor. Fabricación Los servicios de fabricación pueden utilizar técnicas de minería de datos para proporcionar un análisis en tiempo real y predictivo de la eficacia general de los equipos, los niveles de servicio, la calidad de los productos y la eficiencia de la cadena de suministro. Por ejemplo, los fabricantes pueden utilizar datos históricos

El científico de datos o minero de datos comienza por identificar los objetivos y el alcance del proyecto. Trabajan conjuntamente con las partes interesadas de la empresa para identificar cierta información.

  • Problemas que se deben abordar
  • Restricciones o limitaciones del proyecto
  • El impacto empresarial de las posibles soluciones A continuación, utilizan esta información para definir los objetivos de la minería de datos e identificar los recursos necesarios para el descubrimiento de conocimientos. 2. Comprensión de los datos Una vez que comprenden el problema empresarial, los científicos de datos comienzan a realizar un análisis preliminar de los datos. Recopilan conjuntos de datos de diversos orígenes, obtienen los derechos de acceso y elaboran un informe de descripción de datos. El informe incluye los tipos de datos, la cantidad y los requisitos de hardware y software para el procesamiento de datos. En cuanto la empresa aprueba el plan, comienzan a explorar y verificar los datos. Manejan los datos mediante técnicas estadísticas básicas, evalúan la calidad de los datos y eligen un conjunto de datos final para la siguiente fase. 3. Preparación de los datos Los mineros de datos dedican la mayor parte del tiempo a esta fase porque el software de minería de datos requiere datos de alta calidad. Los procesos empresariales recopilan y almacenan datos por razones distintas a la minería. Por ello, los mineros de datos deben perfeccionarlos antes de utilizarlos para el modelado. La preparación de los datos implica los siguientes procesos.
  • Limpiar los datos: Por ejemplo, gestionar los datos que faltan, los errores de datos, los valores predeterminados y las correcciones de datos.
  • Integrar los datos: Por ejemplo, combinar dos conjuntos de datos dispares para obtener el conjunto de datos objetivo final.
  • Dar formato a los datos: Por ejemplo, convertir los tipos de datos o configurar los datos para la tecnología de minería específica que se utiliza. 4. Modelado de datos Los mineros de datos introducen los datos preparados en el software de minería de datos y estudian los resultados. Para ello, pueden elegir entre múltiples técnicas y herramientas de minería de datos. Además, deben escribir pruebas para evaluar la calidad de los resultados de la minería de datos. Para modelar los datos, los científicos de datos cuentan con las siguientes opciones:
  • Entrenar los modelos de machine learning (ML) a partir de conjuntos de datos más pequeños con resultados conocidos
  • Utilizar el modelo para analizar más a fondo conjuntos de datos desconocidos
  • Ajustar y volver a configurar el software de minería de datos hasta que los resultados sean satisfactorios 5. Evaluación Una vez creados los modelos, los mineros de datos comienzan a medirlos con respecto a los objetivos empresariales originales. Comparten los resultados con los analistas de negocio y obtienen comentarios. Es posible que el modelo responda adecuadamente a la pregunta original o que muestre patrones nuevos y desconocidos hasta el momento. Los mineros de datos pueden modificar el modelo, ajustar el objetivo empresarial o volver a revisar los datos, en función de los comentarios empresariales. La evaluación continua, los comentarios y las modificaciones forman parte del proceso de descubrimiento de conocimientos. 6. Implementación Durante la implementación, otras partes interesadas utilizan el modelo de trabajo para generar inteligencia empresarial. El científico de datos planifica el proceso de implementación, que incluye instruir a otros sobre las funciones del modelo, realizar un seguimiento continuo y mantener la aplicación de minería de datos. Los analistas
  • Agrupación en clústeres: La agrupación en clústeres consiste en agrupar varios puntos de datos en función de sus similitudes. Se diferencia de la clasificación porque no puede distinguir los datos por categorías específicas, pero sí es capaz de encontrar patrones en sus similitudes. El resultado de la minería de datos es un conjunto de clústeres en el que cada colección es distinta de otros grupos, pero los objetos de cada clúster son similares de alguna manera. Por ejemplo, el análisis de clústeres puede ser útil para la investigación de mercado cuando se trabaja con datos multivariados procedentes de encuestas. Los investigadores de mercado utilizan el análisis de clústeres para dividir a los consumidores en segmentos de mercado y comprender mejor las relaciones entre los distintos grupos.
  • Análisis de secuencias y trayectorias: El software de minería de datos también puede buscar patrones en los que un conjunto particular de eventos o valores conduce a otros posteriores. Es capaz de reconocer alguna variación en los datos que se produce a intervalos regulares o en el flujo y reflujo de los puntos de datos a lo largo del tiempo. Por ejemplo, una empresa podría utilizar el análisis de trayectorias para descubrir que las ventas de ciertos productos se disparan justo antes de los días festivos o para notar que el clima más cálido atrae a más personas a su sitio web. ¿Qué tipos de minería de datos existen? Según los datos y la finalidad de la minería, esta puede tener varias ramificaciones o especializaciones. A continuación, se presentan algunas.
  • Minería de procesos: La minería de procesos es una rama de la minería de datos cuyo objetivo es detectar, supervisar y mejorar los procesos empresariales. Extrae conocimientos de los registros de eventos que se

encuentran en los sistemas de información. Ayuda a las organizaciones a ver y comprender lo que ocurre en estos procesos día a día. Por ejemplo, las empresas de comercio electrónico realizan numerosos procesos, como adquisiciones, ventas, pagos, cobros y envíos. Al minar los registros de datos de adquisiciones, podrían descubrir que la fiabilidad de las entregas de los proveedores es del 54 % o que el 12 % de los proveedores entregan sistemáticamente antes de tiempo. Pueden utilizar esta información para optimizar sus relaciones con los proveedores.

  • Minería de textos: La minería de textos o minería de datos de textos consiste en utilizar un software de minería de datos para leer y comprender un texto. Los científicos de datos utilizan la minería de textos para automatizar el descubrimiento de conocimientos en recursos escritos, como páginas web, libros, correos electrónicos, reseñas y artículos. Por ejemplo, una empresa de contenidos multimedia digitales podría utilizar la minería de textos para leer automáticamente los comentarios realizados en sus videos en línea y clasificar las opiniones del público como positivas o negativas.
  • Minería predictiva: La minería de datos predictiva utiliza la inteligencia empresarial para predecir tendencias. Ayuda a los líderes empresariales a estudiar el impacto que tienen sus decisiones en el futuro de la empresa y a elegir las opciones más eficaces. Por ejemplo, una empresa puede examinar los datos de las devoluciones de productos en el pasado para diseñar un esquema de garantía que no provoque pérdidas. Mediante la minería predictiva, preverán la cantidad potencial de devoluciones en el próximo año y crearán un plan de garantía de un año que considere la pérdida al determinar el precio del producto. ¿Cómo puede AWS ayudar en la minería de datos?