Quantcast
Channel: Business Intelligence y Big Data: ¡Aprende Gratis sobre Analytics!
Viewing all 866 articles
Browse latest View live

Paper: Forecasting para predicciones mensuales (Machine Learning)

$
0
0

En este documento se aplicará el método Box and Jenkins para el análisis de una serie temporal, en concreto, para las ventas de comida para llevar (en billones) en Australia durante el periodo abril/1980-abril/2014.  


Descargar paper (40 págs.)

Para ello nos serviremos del software estadístico R. Cabe decir que los modelos SARIMA están recomendados fundamentalmente para las predicciones mensuales, ya que las predicciones mensuales poseen habitualmente una estacionalidad simple y regular (única y sin alteraciones irregulares provocadas por factores añadidos como los festivos). 




Sin embargo, las series diarias o semanales suelen poseer estacionalidad compleja (e.g., semanal y anual) e irregular (más de una y con alteraciones). Por tanto, recomiendo los modelos SARIMA únicamente para los casos en los que se trate una serie de datos mensuales.

Mas contenido interesante sobre Machine Learning:


Por que muchos Data Scientist estan dejando sus trabajos?



Muy revelador lo que nos cuentan en este articulo del Towards Data Science, y que coincide con muchas situaciones y casos reales que conocemos y que se están produciendo. La frustración con el día a día del trabajo de los Data Scientist, respecto a las expectativas es importante (muchos conocéis que es llamado 'el trabajo más atractivo del siglo XXI'). La realidad es que muchos abandonan sus puestos de trabajo en grandes compañías, cuando parecían...


Nueva solucion Machine Intelligence: Pentaho, R, Python y Spark juntos para Machine Learning Analytics



Se acaba de presentar Machine Intelligence: el plugin para Pentaho Data Integration que facilita enormemente la ejecución de algoritmos sobre tecnologías Machine Learning, orquestados desde un completo entorno gráfico ETL Gracias a este plugin puedes convertir algoritmos de machine learning en 'steps' de PDI desde R, Python, Spark y Weka Gracias a este plugin consigues de forma sencilla: Hacer Machine Learning mucho más sencillo de...


Curso gratuito de Machine Learning por Google



Gran curso el que ofrece Google sobre Machine Learning, aprendizaje automático. Os lo recomendamos (Curso) Mas sobre Machine Learning: - Las 53 claves para conocer Machine Learning ...


Guide: Machine Learning for Software Engineers



Based on How I plan to become a machine learning engineer, you can/should follow this course if your are interested on this topics: Table of Contents What is it? Why use it? How to use it Follow me Don't feel you aren't smart enough About Video Resources Prerequisite Knowledge The Daily Plan Motivation Machine learning overview Machine learning mastery Machine learning is fun Inky Machine Learning Machine Learning: An In-Depth Guide Stories...


Los 30 mejores proyectos de Machine Learning Open Source



Como sabéis, el Machine Learning es uno de los temas que más nos interesan en el Portal y, máxime, cuando gran parte de las tecnologías son Open Source. En esta entrada, os indicamos los 30 proyectos más interesantes en en este año. Os dejamos también el material que publicamos con las claves del Machine Learning y una introducción Ver también, VideoTutorial No 1 FastText: Library for fast text representation and classification....



Whitepaper gratuito 'Usos de Machine Learning por sectores'



Ya tenéis disponible un Estudio muy interesante de más de 60 páginas, que os podéis descargar gratuitamente desde el enlace anterior Que podéis encontrar? Más información: Plataforma Online de Soluciones Big Data y Machine Learning (Demos y Aplicaciones) Aplicación práctica de Machine Learning con Bases de Datos Analyticas. Descargar Paper VideoTutorial Machine Learning para Predicción de Ventas VideoTutorial PowerBI con R Aplicación...


Mas de 20 Tecnicas y Tipos de Analisis Machine Learning y Analytics



A continuación, os detallamos las principales técnicas y tipos de análisis que se realizan en Big Data, muchas veces agrupadas bajo nombres como algoritmos, machine learning, etc.... pero que no siempre se explican correctamente Aquí os hemos creado algunos ejemplos online usando algunas de estas técnicas Si quieres saber más, puedes consultar también otros posts relacionados: - Las 53 Claves para conocer Machine Learning - 69 claves...


Como usar Machine Learning para hacer Data Quality



Las empresas cada vez necesitan almacenar y procesar más datos sobre sus clientes, proveedores, personal o pedidos. Sin embargo, a mayor Volumen de datos, mayor es la probabilidad de que existan datos incorrectos, como las direcciones o teléfonos que afecten de forma negativa a nuestro negocio. Por ejemplo, un pedido con una dirección errónea será devuelto, reduciendo el beneficio de la empresa y la confianza del cliente. Teniendo en cuenta...


Las 53 Claves para conocer Machine Learning



Si hace unos días os presentábamos las 69 claves para conocer Big Data, hoy os traemos las 53 Claves para conocer Machine Learning.  Que lo disfrutéis, si quereis conocer más o practicar, tenemos cursos Tambien os recomendamos: Una breve historia del Machine Learning ...


Una 'breve' Historia del Machine Learning



Hoy en día, el concepto de Machine Learning, está muy en boga, pero muchos lo entremezclan con la estadistica, las matemáticas, el Big Data, etc... para ello, que mejora hacer un repaso histórico de su evolución para conocerlo mejor Historia del Machine Learning: 1950 — Alan Turing creates the “Turing Test” to determine if a computer has real intelligence. To pass the test, a computer must be able to fool a human into believing it is also human. 1952...


How to create a Data Mart with reports and dasboards in just 8 minutes (open source)

$
0
0
Really impressive how simple it is to create a Data Mart and be analyzed with reports, OLAP cubes and Dashboards in a matter of minutes using LinceBI

The best thing is that you can do it with a solution based on open source, without cost of licenses and with professional support guaranteed.
A good alternative at no license cost to PowerBI, Tableau, Qliksense...

You can try more in detail in this online demo and check this '8 minutes Data Mart and Analysis ready to go'

Comparacion Azure-Google-Amazon para DW

$
0
0
Muy interesante comparación del coste según performance de las principales soluciones Cloud para Analytics Data Warehouse

- Azure DW
- AWS Redshift
- Google Big Query

También puedes considerar otras opciones como Vertica o Smowflake




11 Consejos sobre Bad Data: el enemigo silencioso en Business Intelligece y Big Data

$
0
0



Para todos los que llevamos un tiempo en esto del Business Intelligence, Big Data, Machine Learning, Analytics... vemos que se dedica mucho tiempo a hablar de las nuevas tecnologías, casos de uso, aplicaciones, etc... pero muy poco del verdadero problema y condicionante para lograr una exitosa implementación de estas tecnologías y proyectos: el Bad Data

Nuestro colaborador Emilio Arias, de Stratebi nos da unas pautas:

Como lo reconoces?

1) Son datos imprecisos, erróneos e incompletos que provocan problemas para lleva a cabo la estrategia de la empresa

2) Implica una mala toma de decisiones y una mala ejecución de las mismas

3) El coste del 'Bad Data', según estudios de IBM, les puede suponer a las empresas, hasta un 30% de los ingresos

4) En tu compañía no usas herramientas ETL (Integración, Transformación y Carga) o las usas mal, para mejorar los procesos de adquisición, depurado y limpieza de datos. Las hay open source (Pentaho Data Integration y Talend). El coste no será problema

5) Tu información está desestructurada, sin maestros (MDM te suena a chino) e información heterogénea no integrada

6) Querrías incluir datos de redes sociales, APIs, logs, IoT, etc... pero no sabes como distinguir el 'Bad Data' del 'Smart Data'

7) Querrías aplicar 'Machine Learning', pero sabes que con datos erróneos, cualquier algoritmo, por muy ajustado que fuera, te daría resultados sin confianza

8) Cada área, departamento o especialista de tu empresa tiene su propia metodología para aplicar criterios en cuanto a identificar el 'Bad Data'. Data Governance es un sueño idealizado para tí


9) 'Si metes basura, obtendrás basura'. Este aforismo ha funcionado muy bien en Analytics durante años. El problema ahora es que no consigues diferenciar la basura del resto. Se hace urgente poner en marcha una 'Planta de tratamiento de Residuos Analíticos' en tu organización. Funciona igual, separar basura de información útil

10) Querrías convertir el 'Bad Data' en 'Smart Data', pero ni siquiera sabes si esto es factible, cómo para saber lo que te costaría (tiempo y dinero)

11) Conoces los '7 magníficos' que puedes reconocer en el  'Bad Data'?

- Te faltan datos. No hay información, donde debería haberla
- Los datos son incorrectos ('no cuadra', seguro que os suena)
- Los datos no están bien ubicados. A veces, tenemos los datos correctos en origen, pero no los ubicamos correctamente
- Errores de entrada de datos: caracteres erróneos, abreviaturas, traducciones, etc...
- Datos duplicados. No siempre tiene que ser un error, a veces es algo tan trivial como una empresa que cambia de CIF y no actualizas
- Datos no revisados o aprobados. Mucha información requiere de la revisión y aprobación por parte de los responables
- Exceso de Datos. Sí, aunque no lo consideréis, si tenéis exceso de datos, se convierten en 'Bad Data'. Querer analizar cambios de estado de un asiento contable realizados en un día concreto... no suele proporcionar 'decisiones estratégicas'

Solución? En este Portal hablamos mucho de aplicar correctamente ETL, Data Quality, AgileBI, etc... pero lo más importante es 'perseverar' en dichas iniciativas 

El Bad Data nunca se va a acabar (que lo sepáis), es como cierta contaminación que siempre aparece, pero hay formas de reducirla, anticiparse y... casi, eliminarla


Curso online de PowerBI (4, 5 de Noviembre)

$
0
0


Los próximos lunes y martes (4 y 5 de Noviembre) tienes un más que interesante curso Online (100% guiado con profesor), compartiendo escritorio y eminentemente práctico, realizado por nuestro compañeros deStratebi. No te lo pierdas!!

Temario y Registro. Solo 95€!!

Apúntate y podrás hacer Dashboards como estos e integrar con Machine Learning y Big Data:

 





Mas info sobre PowerBI:


PowerBI: Arquitectura End to End



En el diagrama superior tenéis de forma actualizada, todo el ecosistema de PowerBI. Muy útil y clarificador Saber más sobre PowerBI: Use Case Big Data “Dashboards with Hadoop and Power BI” septiembre 03, 2019  big data, hadoop, olap, powerBi  3 comments In recent posts, we explained how to fill the gap between Big Data and OLAP, using Tableau, Pentaho and Apache Zeppelin. Now, we´ll show you how...


Como funciona Microsoft Power BI? Todo lo que necesitas saber



Todo lo que necesitas saber sobre la herramienta de Data Discovery que está revolucionando la toma de decisiones en las empresas lo tienes aquí: Para saber más de PowerBI (ver demos online en enlace anterior, cursos e info a continuación): Big Data para PowerBI febrero 19, 2019  big data, lincebi, open source, Pentaho, powerBi  4 comments Power BI es un conjunto de herramientas...


Como integrar Salesforce y PowerBI



Os contamos las posibilidades de integración de las dos soluciones Business Intelligence y CRM más extendidas del mercado: PowerBI y Salesforce Gracias a la posibilidad de integración de las herramientas se abre una gran cantidad de posibilidades Ahora puede obtener información en tiempo real de los datos de Salesforce mediante la conexión a través de Power BI Según los principales estudios, tanto Salesforce como Microsoft PowerBI lideran...


Big Data para PowerBI



Power BI es un conjunto de herramientas Business Intelligence (BI) desarrolladas por Microsoft. De reciente aparición, gracias a su simplicidad y potencia se ha hecho un un hueco entre las grandes del mercado como Tableau, Pentaho o Microstrategy.  Al igual que estas últimas, implementa la filosofía de Autoservicio para el usuario final (Self Service BI) llevada al extremo de la sencillez, pero con un gran número de características...


Usando Python con PowerBI



Muy interesante la nueva funcionalidad que permite el uso de Python en PowerBI, que se añade a la ya conocida capacidad con R, que os comentábamos no hace mucho En este artículo de Tommi Ranta explica paso a paso como preparar un entorno Python, habilitar Python en Power BI, importar datos y aplicar clustering a los datos y crear visualización personalizadas en Power BI utilizando Python.  Todo el material necesario para replicar...


Videotutorial: Usando R para Machine Learning con PowerBI



Si te gusta el Business Intelligence, Machine Learning y conoces algo de R, no te puedes perder este Videotutorial: Temario del Videotutorial: 1º Posibilidades de R dentro de Power BI  2º Instalar R y RStudio  3º Matriz de Correlación para el sector Retail  4º Árbol Decisión Titanic  5º Clustering K-Means Estados Unidos  6º Clustering DBSCAN Estados Unidos para detectar Outliers  7º Forecasting Exponencial Smoothing...


Las 50 claves para aprender y conocer PowerBI



Si tenéis curiosidad por conocer sobre todas las posibilidades de PowerBI, como funciona, integración, costes, etc... no te puedes perder este documento.  Altamente recomendable!!! También te puede interesar: Las 50 claves para conocer Futbol Analytics julio 18, 2018  Analytics, big data, open source, Stratebi, Tablero Futbolero  No comments Os presentamos un estudio muy...

LinceBI, the best Analytics/BigData open source based solution!!

$
0
0

As powerful as an enterprise version, with the advantages of being Open Source based. Discover LinceBI, the most complete Bussines Intelligence platform including all the functionalities you need

A non lincense, open source based, alternative to PowerBI


Dashboards
  • User friendly, templates and wizard
  • Technical skills is not mandatory
  • Link to external content
  • Browse and navigate on cascade dependency graphs
Analytic Reporting
  • PC, Tablet, Smartphone compatibility
  • Syncs your analysis with other users
  • Download information on your device
  • Make better decisions anywhere and anytime
Bursting
  • Different output formats (CSV, Excel, PDF, HTML)
  • Task scheduling to automatic execution
  • Mailing
Balance Scorecard
  • Assign customized weights to your kpis
  • Edit your data on fly or upload an excel template
  • Follow your key performance indicators
  • Visual kpis, traffic lights colours
  • Assign color coding to your threshold
  • Define your own key performance indicators
Accessibility
  • Make calculated fields on the fly
  • Explore your data on chart
  • Drill down and roll up capabilities
  • What if analysis and mailing

Adhoc Reporting
  • Build your reports easily, drag and drop
  • Models and languaje created to Business Users
  • Corporative templates to your company
  • Advanced filters
Alerts
  • Configure your threshold
  • Mapping alerts and business rules
  • Planning actions when an event happen
Check FAQs section for any question


    Internet of Things (Timeline)

    $
    0
    0

    No dejéis de echar un vistazo a esta infografía. Muy útil!!

    Haciendo funcionar un Cluster Hadoop

    $
    0
    0


    Os mostramos un ejemplo de como hacer funcionar un Cluster Hadoop con ejemplos y aplicaciones prácticas:




    Se trata de un clúster Hadoop con la distribución de Hadoop de Hortonworks HDP 2.6.5, la cual es 100% open source e incluye las últimas versiones de Apache Hive, Spark, Kafka, Superset, Zeppelin y Druid. Además hemos instalado la herramienta para OLAP con Big Data Apache Kylin con la que hemos implementado algunas de nuestras demos de Big Data Analytics disponibles en Big Data Demos



    El clúster está compuesto de 3 máquinas de 32 Gb de Ram y 8 cores, es decir, un total de 96 Gb de Ram y 24 cores disponibles para ser usados por los usuarios de las formaciones que imparten nuestros amigos de StrateBI 


    Tutorial de Introduccion a Talend Open Studio

    $
    0
    0



    En este VideoTutorial podréis ver como funciona y conocer las principales características, pasos y  funciones de una de las mejores herramientas de integración de datos




    Además, los próximos 13 y 14 de Noviembre, se celebra en Madrid un Curso sobre Talend, no os lo perdáis



    Data Lakes: Definiciones y Plataformas. Descarga gratuita del White Paper

    $
    0
    0

    Un gran estudio de más de 40 páginas por parte de Philip Russom, que puedes descargar gratuitamente desde aquí




    Os dejo a continuación, un resumen de los contenidos y algunos de los principales hallazgos del estudio. Muy interesante.







    Para saber más de Data Lakes:


    Diferencias entre Data Lake y Data Warehouse



    Let’s briefly take a look at each one: Data. A data warehouse only stores data that has been modeled/structured, while a data lake is no respecter of data. It stores it all—structured, semi-structured, and unstructured. [See my big data is not new graphic. The data warehouse can only store the orange data, while the data lake can store all the orange and blue data.] Processing. Before we can load data into a data warehouse, we first...


    Sabes quién creó el término 'Data Lake'?



    What is a data lake? A data lake is a repository designed to store large amounts of data in native form. This data can be structured, semi-structured or unstructured, and include tables, text files, system logs, and more. The term was coined by James Dixon, CTO of Pentaho, a business intelligence software company, and was meant to evoke a large reservoir into which vast amounts of data can be poured. Business users of all kinds can dip into...


    Predictions: A Cynic’s Guide To BI In 2017



    Genial esta descripción de Timo Elliot (uno de los mayores especialistas en Business Intelligence). No tiene desperdicio!! Businesspeople Businesspeople will be dissatisfied with their BI systems (this is “Timo’s First Law of BI”) Executives will refuse to learn to use any other data tool than Excel (and not even the newer features of that). No matter how good the BI system, businesspeople will make bad decisions based on gut feel. Executives...


    Talend Big Data



    Download whitepaper An enterprise data lake provides the following core benefits to an enterprise: New efficiencies For data architecture through a significantly lower cost of storage, and through optimization of data processing workloads such as datatransformation and integration.  New opportunities For business through flexible “schema-on-read” access to all enterprise data, and through multi-use and multi-workload data processing on...


    OLAP for Big Data. It´s possible?



    Hadoop is a great platform for storing a lot of data, but running OLAP is usually done on smaller datasets in legacy and traditional proprietary platforms.   OLAP workloads are beginning to migrate to the one data lake that is running Hadoop and Spark. Fortunately, there are a number of Apache projects that are starting to make OLAP possible on Hadoop.  Apache Kylin For an introduction to this interesting Hadoop project, check...


    Big Data, casos, tecnologias y aplicaciones reales



    Os mostramos a continuación, una buena selección de ejemplos, tecnologías y casos aplicables de Big Data usando las principales tecnologías, con enfoque Data Lake, de la mano de los especialistas de stratebi ...






    Charla Introduccion Bases de Datos Analiticas (Vertica-MonetDB)

    $
    0
    0
    Si hace unos días, os dejábamos disponibles la charla de los Open Spaces sobre Real Time Big Data con Apache Storm y el de Apache Cassandra-NoSQL, hoy tenéis el video y la presentación del más que interesante de Bases de Datos Analíticas (orientadas a columnas).

    Estas bases de datos nos proporcionan un gran rendimiento en tiempos de consulta para grandes volúmes de datos en entornos analíticos, como son los cubos olap

    Si os es útil y os gusta, no dejéis de darnos feedback para continuar con nuevos materiales



    También disponible en slideshare:


    STAgile, simple, just Dashboards in seconds

    $
    0
    0

    Now, you can create powerful Dashboards from excel for end users, with no single line of code. Just in seconds!! with STAgile, an open source based solution, with no licenses.

    The best tool for non technical end users.



    All the modules you can find in LinceBI are the right solution if you don´t want to pay licenses and you need profesional support

    Besides, you have 'predefined industry oriented solutions', with a lot of KPIs, Dashboards, reports...


    You can use STAgile, standalone or embed in your web application


    STPivot sigue mejorando

    $
    0
    0


    STPivot, el visor OLAP basado en open source que funciona sobre Pentaho en sus últimas versiones y en plataformas como LinceBI sigue avanzando, poco a poco, con todas las sugerencias y mejoras que nos aportan los usuarios

    En este enlace tenéis un entorno de Demo para ir probando. Todo feedback es bienvenido!!


    Las novedades son las siguientes 

    Añadidas descripciones
    • Ahora se permiten cargar descripciones desde el esquema de Mondrian mediante el atributo “description” para métricas, miembros calculados, dimensiones y cubos.
    • Además, también se permiten añadir y guardar descripciones realizadas por el usuario para objetos creados dentro de la vista. Estos se guardan en el fichero xpivot. Para facilitar la introducción de estas descripciones, se ha rediseñado la interfaz referente a dicho campo tanto en el editor de dimensiones como en el editor de fórmulas.





    Ordenación BASC/BDESC
    Se ha introducido este tipo de ordenación que permite romper jerarquías al ordenar.
    Para dar algo de flexibilidad, se puede intercambiar entre ordenación normal (ASC/DESC) y este nuevo tipo de ordenación mediante un botón de la barra superior.







    Filtro por propiedad
    Se ha introducido en el editor de dimensiones una nueva funcionalidad que permite dar soporte al uso de Filter en sets creados:
    SET [] AS Filter([Dimension<.jerarquia>].[].Members, ([Dimension<.jerarquia>].CurrentMember.Properties("") = ""))

    Cuenta con las siguientes características:
    • Respeta el tipo de dato asociado a cada propiedad.
      • En datos numéricos, permite usar una variedad de operadores diversa (>, >=, <, <=).
      • En datos booleanos solo permite alternar entre true o false.
      • En datos tipo fecha, ofrece un selector (datepicker) de fecha, impidiendo la introducción de formatos de fecha no válidos.
    • En caso de que no existan propiedades en el nivel, dicha opción aparecerá deshabilitada.




    Esquema XML
    • Se ha movido la edición del esquema XML del panel OLAP de STPivot a la ventana de selección de esquema y cubo. Este cambio surge de la necesidad de evitar que el usuario edite un esquema con cambios incorrectos que invaliden el mismo. Esto provocaba la salida de STPivot sin dar la posibilidad de editarlo nuevamente para subsanar los errores.


    Asimismo, se ha introducido una validación mediante XSD sobre el esquema, informando al usuario de errores de especificación del XML.




    Corregidos problemas de sincronización entre MDX y la tabla
    • La interacción con la tabla, ya sea para ordenar o hacer un drill, no produce resultados inesperados ni genera discrepancias con la MDX con la que se está trabajando.
    • Se ha recuperado el modo de ordenación natural y el tipo de ordenación aplicado al hacer drill.
    • La correcta sincronización que tiene lugar ahora entre ambos objetos, soluciona todas estas incidencias así como posiblemente otros fallos no detectados y difícilmente reproducibles.
    Corrección de bugs y pequeñas mejoras de cara al usuario

    Explicacion sencilla de arquitecturas Business Intelligence

    $
    0
    0

    En este post muy útil, se hace un repaso a las diferentes alternativas en que la información puede ser consumida por los usuarios y las diferentes formas de almacenamiento de la misma. 

    Habría que decir, que todas ellas son formas de analizar la información y tomar decisiones, esto es, Business Intelligence; aunque en rigor, sólo las más óptimas en cuanto a uso de Data Marts DW y optimización del acceso por los usuarios, se consideran de forma habitual como propias del BI.

    Os muestro los gráficos de las diferentes alternativas y una comparativa. 

    Nuestra opinión, aparte de las buenas prácticas de diseño y arquitectura, es que debemos ser conscientes de los requerimientos, necesidades y condicionantes de las empresas y clientes, puesto que en muchas ocasiones se tratará de 'balancear' entre lo correcto desde el punto de vista teórico y lo factible desde el punto de vista práctico y real, que no siempre coinciden.


    1
    1. Sistema de Información Transaccional



    2
    2. Sistema de Información con transaccional replicado


    3
    3. Sistema de Información con Data Marts



    4
    4. Sistema de Información con un DataWarehouse empresarial



    5
    5. Comparativa de caracteristicas


    Quizás te interese también:



    Metodologias Agiles para Analytics (Business Intelligence, Big Data)



    En este post, os vamos a contar como hacer proyectos ágiles en Analytics (Business Intelligence/Big Data Analytics). Realmente, os vamos a contar unos tips o consejos que cada vez más usamos y que nos cuenta Emilio Arias de Stratebi.   Tradicionalmente, este enfoque se ha aplicado más a proyectos en los que el componente de 'desarrollo' tiene un peso muy importante y se hace muy difícil aplicarlo al BI/DW, donde los requisitos,...

    Las 50 claves para conocer Futbol Analytics

    $
    0
    0



    Os presentamos un estudio muy interesante sobre Fútbol Analytics, un área que está teniendo un crecimiento espectacular, gracias al uso de Big Data, Machine Learning, Internet of Things, etc... 
    Temas que nos apasionan en este Portal. 

    Nuestros compañeros de Stratebi, especialistas en este ámbito y que ya han colaborado con algún club de fútbol de Primera División, os dan las 50 claves para estar al día en Fútbol Analytics



    También os incluimos abajo, información de otros documentos publicados y demos que os pueden ser de interés:


    Aplicando Business Intelligence y Open Source a la analitica de datos en el Futbol



    Para todos los apasionados de las Estadísticas, del Futbol y del Open Source os presentamos la versión actualizada de Tablero Futbolero Incluye las estadísticas de las ultimas 9 temporadas. Algunas caracteristicas: - Creado con Business Intelligence Open Source: Pentaho, PDI Kettle, Mondrian, STPivot, MySQL... - Compatible con dispositivos móviles - Ficha de jugador, equipo, partido, arbitro - 11 ideal (simulación) - Comparativa Real Madrid...


    Fútbol Analytics



    Here you can see a nice sample combining PowerBI with open source based Business Intelligence solutions, like LinceBI, in order to provide the most complete BI solution with an affordable cost - Predefined Dashboards - Adhoc Reporting - OLAP Analysis - Adhoc Dashboarding - Scorecards More info: - PowerBI functionalities - PowerBI traini...


    Las 53 Claves para conocer Machine Learning



    Si hace unos días os presentábamos las 69 claves para conocer Big Data, que ya lleva más de 2.500 visitas, hoy os traemos las 53 Claves para conocer Machine Learning.  Que lo disfrutéis, si quereis conocer más o practicar, tenemos cursos Tambien os recomendamos: Una breve historia del Machine Learning ...


    Mas de 20 Tecnicas y Tipos de Analisis Big Data



    A continuación, os detallamos las principales técnicas y tipos de análisis que se realizan en Big Data, muchas veces agrupadas bajo nombres como algoritmos, machine learning, etc.... pero que no siempre se explican correctamente Aquí os hemos creado algunos ejemplos online usando algunas de estas técnicas Si quieres saber más, puedes consultar también otros posts relacionados: - Las 53 Claves para conocer Machine Learning - 69 claves...



    69 claves para conocer Big Data



    Presentación sencilla, útil y muy clarificadora... Quizás te interese también: Big Data para Dummies y 53 Claves para conocer Machine Learning...


    Descarga Paper gratuito: Funciones avanzadas de Vertica para Machine Learning

    $
    0
    0

    Tenéis a vuestra disposición un paper con funciones avanzadas de Vertica para Machine Learning. Si te interesa, escríbenos y te lo mandamos




    Funciones de Vertica para el Machine Learning. Ya vienen con Vertica, por lo que:

    i), no requieren programación ni instalación, 

    ii), son más eficientes que otras opciones como la integración con Python/Pandas, 

    iii) se aplican sobre tablas o vistas, 

    iv) implementan los algoritmos más conocidos de Machine Learning. Además, son muy sencillas de usar y aprovechan la potencia de ejecución distribuida de un clúster Vertica.


    En el siguiente diagrama se muestran las funciones nativas de Vertica para la analítica avanzada. 



    Estas cubren todas las fases de una aplicación de Machine Learning (Pipeline de una aplicación ML): Análisis de datos origen para entender mejor el negocio, preparación de los datos, Modelado, Evaluación de los modelos generados y puesta en producción para la aplicación del modelo.

    Ejemplo de modelos explicados en el paper:


    Ejercicio practico de Machine Learning con Jupyter Notebooks, Anaconda y Python 3

    $
    0
    0


    Que mejor forma que aprender de Machine Learning, con algunas de las tecnologías mas potentes y completas, que mediante la realización de un buen ejercicio práctico.

    Podéis seguir el tutorial práctico en el video y también utilizar la presentación.












    Esperamos que os sea útil!!



    Las 50 claves para aprender y conocer PowerBI

    $
    0
    0

    Si tenéis curiosidad por conocer sobre todas las posibilidades de PowerBI, como funciona, integración, costes, etc... no te puedes perder este documento. 

    Altamente recomendable!!!



    También te puede interesar:

    Las 50 claves para conocer Futbol Analytics



    Os presentamos un estudio muy interesante sobre Fútbol Analytics, un área que está teniendo un crecimiento espectacular, gracias al uso de Big Data, Machine Learning, Internet of Things, etc...  Temas que nos apasionan en este Portal.  Nuestros compañeros de Stratebi, especialistas en este ámbito y que ya han colaborado con algún club de fútbol de Primera División, os dan las 50 claves para estar al día en Fútbol Analytics También...



    Las 53 Claves para conocer Machine Learning



    Si hace unos días os presentábamos las 69 claves para conocer Big Data, que ya lleva más de 2.500 visitas, hoy os traemos las 53 Claves para conocer Machine Learning.  Que lo disfrutéis, si quereis conocer más o practicar, tenemos cursos Tambien os recomendamos: Una breve historia del Machine Learning ...



    69 claves para conocer Big Data



    Presentación sencilla, útil y muy clarificadora... Quizás te interese también: Big Data para Dummies y 53 Claves para conocer Machine Learning...


    Saber más sobre PowerBI:


    Big Data para PowerBI



    Power BI es un conjunto de herramientas Business Intelligence (BI) desarrolladas por Microsoft. De reciente aparición, gracias a su simplicidad y potencia se ha hecho un un hueco entre las grandes del mercado como Tableau, Pentaho o Microstrategy.  Al igual que estas últimas, implementa la filosofía de Autoservicio para el usuario final (Self Service BI) llevada al extremo de la sencillez, pero con un gran número de características...

    Working together PowerBI with the best open source solutions



    Here you can see a nice sample combining PowerBI with open source based Business Intelligence solutions, like LinceBI, in order to provide the most complete BI solution with an affordable cost - Predefined Dashboards - Adhoc Reporting - OLAP Analysis - Adhoc Dashboarding - Scorecards More info: - PowerBI functionalities - PowerBI traini...


    Comparativa de Costes Tableau vs PowerBI



      Os dejamos un documento listo para descargar, con una comparativa muy completa de costes entre Tableau y PowerBI (hay que decir que el informe ha sido encargado por Tableau, por lo que puede tener cierto sesgo).  Por ejemplo, en cuanto al esfuerzo de este tipo de proyectos, si tenemos en cuenta que ambas son herramientas de Data Discovery (usuario final), no se tiene suficientemente en cuenta la parte más importante, el modelado,...

    Caso Practico: trabajando con APIs y Talend

    $
    0
    0


    En este ejercicio practico, vamos a enriquecer el flujo de datos con API de datos estadísticos.

    Descargar Documento completo


    1      Introducción

    El propósito de este documento es demostrar como con un pequeño ejemplo se puede establecer un flujo de datos continuo entre la API Idescat y la herramienta Talend.

    El Idescat expone parte de sus datos a través de una colección de API de tipo REST. Además, la API del Idescat ofrece métodos (GET principalmente) para que los programas de terceros puedan obtener información del Instituto de Estadística de Cataluña e integrarla en otros servicios.


    Las peticiones sobre la API se componen siempre de un servicio, una versión, una operación, formato y parámetros opcionales.

    Los servicios disponibles son:

    • Indicadores al día: proporciona información básica de una selección de indicadores de Cataluña.
    • Búsqueda de población: proporciona información de la población por sexo de cualquier entidad territorial de Cataluña.
    • Rectificaciones:da acceso a la información del registro de rectificaciones del sitio web del Idescat.
    • Municipio en cifras: acceso a información estadística básica comparativa de municipios, comarcas y Cataluña.
    • Calendario de difusión de resultados: información del calendario del Idescat de difusión de resultados.
    • Días Internacionales: Api desactivada en 2013.
    • Onomástica: información estadística de nombres y apellidos de la población y nombres de los recién nacidos.
    • Incrustaciones:proporciona contenido asociado que puede ser incrustado en páginas de terceros.


    Cada uno de los servicios de la API tienen operaciones comunes y/o propias para la solicitud de las peticiones.
    Para una mayor referencia sobre todo en términos de parametrización de la API suministramos el siguiente enlace: https://www.idescat.cat/dev/api/?lang=es, donde se encontrarán los servicios mencionados y una mayor documentación de la misma.

    Por parte de Talend se dispondrá de un ejercicio que solicitará datos a la API, los cuales serán tratados y comparados con los documentos Excel suministrados.



    Como sacar todo el partido a los mapas en tus visualizaciones

    Viewing all 866 articles
    Browse latest View live