synthroid taking instructions

Inicio > Base de datos > 5 de los mejores software de minería de datos de Código Libre y Abierto

5 de los mejores software de minería de datos de Código Libre y Abierto

Martes, 15 de noviembre de 2016 Dejar un comentario Ir a comentarios

El proceso de extracción de patrones a partir de datos se llama minería de datos. Es reconocida como una herramienta esencial de los negocios modernos, ya que es capaz de convertir los datos en inteligencia de negocios dando así una ventaja de información. Actualmente, es ampliamente utilizado en las prácticas de perfil, como vigilancia, comercialización, descubrimientos científicos, y detección de fraudes.


Hay cuatro tipos de tareas que normalmente se involucran en la minería de datos:

  • Clasificación – la tarea de generalizar una estructura familiar para utilizarla en los nuevos datos
  • Agrupamiento – la tarea de encontrar grupos y estructuras en los datos que son de alguna manera u otra lo mismo, sin necesidad de utilizar las estructuras observadas en los datos.
  • Aprendizaje de reglas de asociación – Busca relaciones entre las variables.
  • Regresión – Su objetivo es encontrar una función que modele los datos con el menor error.

Para aquellos que están buscando algunas herramientas de minería de datos, aquí están cinco de las mejores herramientas de software de código abierto para minería de datos que puedes obtener de forma gratuita:

Orange

Orange es una suite de software para minería de base de datos y aprendizaje automático basado en componentes que cuenta con un fácil y potente, rápido y versátil front-end de programación visual para el análisis exploratorio de datos y visualización, y librerias para Python y secuencias de comando. Contiene un completo juego de componentes para preprocesamiento de datos, característica de puntuación y filtrado, modelado, evaluación del modelo, y técnicas de exploración. Está escrito en C++ y Python, y su interfaz gráfica de usuario se basa en la plataforma cruzada del framework Qt.

RapidMiner

RapidMiner, antes llamado YALE (Sin embargo, otro ambiente de aprendizaje), es un ambiente de experimentos en aprendizaje automático y minería de datos que se utiliza para tareas de minería de datos tanto en investigación como en el mundo real. Permite a los experimentos componerse de un gran número de operadores anidables arbitrariamente, que se detallan en archivos XML y se hacen con la interfaz gráfica de usuario de RapidMiner. RapidMiner ofrece más de 500 operadores para todos los principales procedimientos de máquina de aprendizaje, y también combina esquemas de aprendizaje y evaluadores de atributos del entorno de aprendizaje Weka. Está disponible como una herramienta stand-alone para el análisis de datos y como motor para minería de datos que puede integrarse en tus propios productos.

WEKA

Escrito en Java, Weka (Entorno Waikato para el Análisis del Conocimiento) es una conocida suite de software para máquinas de aprendizaje que soporta varias tareas típicas de minería de datos, especialmente pre procesamiento de datos, agrupamiento, clasificación, regresión, visualización y características de selección. Sus técnicas se basan en la hipótesis de que los datos están disponibles en un único archivo plano o relación, donde cada punto marcado es etiquetado por un número fijo de atributos. WEKA proporciona acceso a bases de datos SQL utilizando conectividad de bases de datos Java y puede procesar el resultado devuelto como una consulta de base de datos. Su interfaz de usuario principal es el Explorer, pero la misma funcionalidad puede ser accedida desde la línea de comandos o a través de la interfaz de flujo de conocimientos basada en componentes.

JHepWork

Diseñado para los científicos, ingenieros y estudiantes, jHepWork es un framework para análisis de datos libre y de código abierto que fue creado como un intento de hacer un entorno de análisis de datos usando paquetes de código abierto con una interfaz de usuario comprensible y para crear una herramienta competitiva a los programas comerciales. Esto se hace especialmente para las ploteos científicos interactivos en 2D y 3D y contiene bibliotecas científicas numéricas implementadas en Java para funciones matemáticas, números aleatorios, y otros algoritmos de minería de datos. jHepWork se basa en Jython un lenguaje de programación de alto nivel, pero codificación en Java también puede ser usada para llamar librerías jHepWork numéricas y gráficas.

KNIME

KNIME (Konstanz Information Miner) es una plataforma de código abierto de fácil uso y comprensible para integración de datos, procesamiento, análisis, y exploración. Ofrece a los usuarios la capacidad de crear de forma visual flujos o tuberías de datos, ejecutar selectivamente algunos o todos los pasos de análisis, y luego estudiar los resultados, modelos y vistas interactivas. KNIME está escrito en Java y está basado en Eclipse y hace uso de sus métodos de extensión para soportar plugins proporcionando así una funcionalidad adicional. A través de plugins, los usuarios pueden añadir módulos de texto, imagen, procesamiento de series de tiempo y la integración de varios proyectos de código abierto, tales como el lenguaje de programación R, WEKA, el kit de desarrollo de Química y LIBSVM.

Si sabes de otro software de minería de datos de código abierto libre, por favor, compartelo con nosotros a través de comentarios.

Comparte y diviertete:
  • Print
  • Digg
  • StumbleUpon
  • del.icio.us
  • Facebook
  • Yahoo! Buzz
  • Twitter
  • Google Bookmarks
  • BarraPunto
  • Bitacoras.com
  • BlinkList
  • Blogosphere
  • Live
  • Meneame
  • MSN Reporter
  • MySpace
  • RSS
  • Suggest to Techmeme via Twitter
  • Technorati
  • LinkedIn
  • email
  • FriendFeed
  • PDF
  • Reddit
  • Wikio IT
  • Add to favorites
  • blogmarks
  • Daimirelis Cruz Pupo

    hola, necesito ayuda para mi tesis de maestria, voy a aplicar:
    reglas de asociacion, arboles de decision (J.48) y cluster. los datos no
    son numericos ninguno, son 9 atributos y 254 instancias. estoy
    trabajando con weka. la ayuda consiste en saber que significan cada uno
    de los parametros de configuracion en weka de todas esas tecnicas que
    voy a aplicar, saber cuando usar una cosa y no la otra, saber cuando
    estamos en la corrida optima en cada uno de las casos….
    cuando me respondas hazlo con copia a a este correo: libarra@uci.cu
    rositamorenita@zoho.com

  • Marian Valero

    Qué herramienta es la mejor a utilizar para millones de registros en Oracle? aproximadamente 100 millones de datos. Gracias

  • http://jmacoe.com/blog jmacoe

    Buen aporte, gracias Erick.

  • Erick Rodriguez

    Si no me equivoco aquí hay otro: http://www.keel.es/

  • Juan Carlos Alvarado

    En la universidad de Nariño, Colombia desarrollamos Tariy KDD, en Java, el cual implementa nuevos algoritmos de asociación, clasificación y clúster. 
    Para mayor información envío mi correo electrónico: endimeon777@gmail.com

  • Pingback: Bitacoras.com()

Top Footer
Scarpe Tods primavera estate 2017: Foto Collezione Streethogan outlet anche per lestate e molta attenzione alla cura deipeuterey outlet online dettagli pi minimali, senza altri fronzoli. Lopeuterey outlet online spirito Tods per la linea scarpe donna peuterey outlet online primavera estate 2017 ha un mood adatto peuterey outlet online Sandali bassi, mocassini e tacchi comodipeuterey outlet online con un fil rouge preciso: la tomaia woolrich outlet online incrociata sul collo del piede. Massima woolrich outlet online comodit, piede abbracciato dal pellame woolrich outlet online di alta qualit e colori che spaziano woolrich outlet online dal cuoio al verde acido, senza hogan outlet online dimenticare nero e bianco. hogan outlet online Il marchio di Della Valle ci sorprende.SCARPE TODS DONNA PRIMAVERA ESTATE 2017 Per la mezza stagione primaverile,hogan outlet online ecco le loafers Tods! Comode scarpe flathogan outlet online dallallure bon ton ma sempre urban style,hogan outlet online con quegli accenni jungle legati canada goose pas cher Le scarpe del catalogo Tods 2017 varianocanada goose pas cher dai modelli total white in pelle verniciata,canada goose pas cher al pi discreto nude in suede, senzadoudoune moncler pas cher dimenticare i tocchi fashion del blu doudoune moncler pas cher zaffiro e del silver. Tods propone anche ledoudoune moncler pas cher sneakers stringate, ancora un richiamo aldoudoune moncler pas cher Presentata in occasione della Paris Fashiondoudoune moncler pas cher Week, la nuova collezione Christian Diordoudoune moncler pas cher primavera estate 2017 ci incanta con linee woolrich sito ufficiale pulite e rigorose che plasmano un guardarobawoolrich sito ufficiale ai limiti della femminilit con lobiettivo woolrich sito ufficiale di dimostrare che anche un capo storicamente woolrich sito ufficiale maschile pu plasmare a valorizzare alla perfezione una silhouette delicata. Una collezione moda donna diverse dalle altre. woolrich sito ufficiale Una linea contemporanea che non tradisce la filosofia della maison. Dior sulle passerelle ci mostra una femminilit estremante eterogenea che guarda al futurowoolrich sito ufficiale Presentata nella capitale italiana della moda in occasione di Milano Fashion Week, la collezione primavera estate 2017 di Max Mara ispirata a Lina Bo Bardi, architetto e designer di fama internazionale.