{"id":17441,"date":"2022-02-02T13:24:04","date_gmt":"2022-02-02T13:24:04","guid":{"rendered":"https:\/\/timi.eu\/?p=17441"},"modified":"2022-02-24T15:56:48","modified_gmt":"2022-02-24T15:56:48","slug":"etl-anatella-domina-el-mercado","status":"publish","type":"post","link":"https:\/\/timi.eu\/es\/blog-es\/news-es\/etl-anatella-domina-el-mercado\/","title":{"rendered":"ETL: Anatella domina el mercado"},"content":{"rendered":"\n\n<div\n\t class=\"wpml-ls-statics-shortcode_actions wpml-ls wpml-ls-legacy-dropdown js-wpml-ls-legacy-dropdown\">\n\t<ul>\n\n\t\t<li tabindex=\"0\" class=\"wpml-ls-slot-shortcode_actions wpml-ls-item wpml-ls-item-es wpml-ls-current-language wpml-ls-item-legacy-dropdown\">\n\t\t\t<a href=\"#\" class=\"js-wpml-ls-item-toggle wpml-ls-item-toggle\">\n                                                    <img\n            class=\"wpml-ls-flag\"\n            src=\"https:\/\/timi.eu\/wp-content\/plugins\/sitepress-multilingual-cms\/res\/flags\/es.png\"\n            alt=\"\"\n            width=18\n            height=12\n    \/><span class=\"wpml-ls-native\">Espa\u00f1ol<\/span><\/a>\n\n\t\t\t<ul class=\"wpml-ls-sub-menu\">\n\t\t\t\t\n\t\t\t\t\t<li class=\"wpml-ls-slot-shortcode_actions wpml-ls-item wpml-ls-item-en wpml-ls-first-item\">\n\t\t\t\t\t\t<a href=\"https:\/\/timi.eu\" class=\"wpml-ls-link\">\n                                                                <img\n            class=\"wpml-ls-flag\"\n            src=\"https:\/\/timi.eu\/wp-content\/plugins\/sitepress-multilingual-cms\/res\/flags\/en.png\"\n            alt=\"\"\n            width=18\n            height=12\n    \/><span class=\"wpml-ls-display\">Ingl\u00e9s<\/span><\/a>\n\t\t\t\t\t<\/li>\n\n\t\t\t\t\n\t\t\t\t\t<li class=\"wpml-ls-slot-shortcode_actions wpml-ls-item wpml-ls-item-fr\">\n\t\t\t\t\t\t<a href=\"https:\/\/timi.eu\/fr\/\" class=\"wpml-ls-link\">\n                                                                <img\n            class=\"wpml-ls-flag\"\n            src=\"https:\/\/timi.eu\/wp-content\/plugins\/sitepress-multilingual-cms\/res\/flags\/fr.png\"\n            alt=\"\"\n            width=18\n            height=12\n    \/><span class=\"wpml-ls-display\">Franc\u00e9s<\/span><\/a>\n\t\t\t\t\t<\/li>\n\n\t\t\t\t\n\t\t\t\t\t<li class=\"wpml-ls-slot-shortcode_actions wpml-ls-item wpml-ls-item-nl\">\n\t\t\t\t\t\t<a href=\"https:\/\/timi.eu\/nl\/\" class=\"wpml-ls-link\">\n                                                                <img\n            class=\"wpml-ls-flag\"\n            src=\"https:\/\/timi.eu\/wp-content\/plugins\/sitepress-multilingual-cms\/res\/flags\/nl.png\"\n            alt=\"\"\n            width=18\n            height=12\n    \/><span class=\"wpml-ls-display\">Holand\u00e9s<\/span><\/a>\n\t\t\t\t\t<\/li>\n\n\t\t\t\t\n\t\t\t\t\t<li class=\"wpml-ls-slot-shortcode_actions wpml-ls-item wpml-ls-item-ru wpml-ls-last-item\">\n\t\t\t\t\t\t<a href=\"https:\/\/timi.eu\/ru\/\" class=\"wpml-ls-link\">\n                                                                <img\n            class=\"wpml-ls-flag\"\n            src=\"https:\/\/timi.eu\/wp-content\/plugins\/sitepress-multilingual-cms\/res\/flags\/ru.png\"\n            alt=\"\"\n            width=18\n            height=12\n    \/><span class=\"wpml-ls-display\">Ruso<\/span><\/a>\n\t\t\t\t\t<\/li>\n\n\t\t\t\t\t\t\t<\/ul>\n\n\t\t<\/li>\n\n\t<\/ul>\n<\/div>\n\n\n\n\n<h1 class=\"wp-block-heading\">\u00abInto The Minds\u00bb publica la Gu\u00eda ETL 2022:<br>Anatella domina el mercado<\/h1>\n\n\n\n<h4 class=\"wp-block-heading\"><strong>El mi\u00e9rcoles 26 de enero, \u00abInto The Minds\u00bb public\u00f3 la Gu\u00eda ETL 2022. Esta gu\u00eda ofrece una breve historia de los ETL y un an\u00e1lisis comparativo de tres ETL modernos. Le invitamos a leer la gu\u00eda <a href=\"https:\/\/www.intotheminds.com\/blog\/es\/etl\/\" target=\"_blank\" rel=\"noreferrer noopener\">siguiendo este enlace<\/a>.<\/strong><\/h4>\n\n\n\n<p>El acr\u00f3nimo ETL significa \u00ab<strong>Extract &#8211; Transform &#8211; Load<\/strong>\u00bb (Extraer &#8211; Transformar &#8211; Cargar). Los ETL son herramientas que facilitan el proceso de preparaci\u00f3n de datos. La soluci\u00f3n Anatella pertenece a la categor\u00eda ETL (e incluso a la categor\u00eda \u00abETL+\u00bb, seg\u00fan la taxonom\u00eda utilizada por los investigadores de \u00abInto The Minds\u00bb).<\/p>\n\n\n\n<p>Hist\u00f3ricamente, los ETL se han centrado en la realizaci\u00f3n de <strong>tres tipos de operaciones con los datos<\/strong>: (1) extraerlos de archivos de distinta naturaleza; (2) transformarlos y enriquecerlos para prepararlos para su explotaci\u00f3n; (3) recargarlos en otro sistema para que puedan ser valorados.<\/p>\n\n\n\n<p>Estas operaciones se ven facilitadas por la interfaz gr\u00e1fica de las soluciones ETL. Estas soluciones se basan en \u00abcajas\u00bb que pueden ensamblarse para conseguir el resultado deseado. Es, por tanto, una <strong>soluci\u00f3n \u00absin c\u00f3digo\u00bb<\/strong> que puede ponerse en (casi) cualquier mano.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Historia de los ETL<\/h2>\n\n\n\n<table width=\"100%\">\n  <tr class=\"greyline\">\n    <th scope=\"row\" width=\"125\">1980s<\/th>\n    <td colspan=\"3\">Invenci\u00f3n de los ETL: los ETL se utilizan para gestionar los flujos entre bases de datos \u00absimples\u00bb<\/td>\n  <\/tr>\n  <tr>\n    <th scope=\"row\">1990s<\/th>\n    <td colspan=\"3\">Evoluci\u00f3n de los ETL para gestionar almacenes de datos complejos (DWH)<\/td>\n  <\/tr>\n  <tr class=\"greyline\">\n    <th scope=\"row\"rowspan=\"2\">2000s<\/th>\n    <td colspan=\"3\">Dividir las herramientas ETL en dos categor\u00edas principales:<\/td>\n  <\/tr>\n  <tr>\n    <td><strong>Categor\u00eda 1 ELT<\/strong>: algunos ETL se convierten en ELT y se centran s\u00f3lo en las tareas \u00abE\u00bb y \u00abL\u00bb (Extracci\u00f3n y Carga), dejando la \u00abT\u00bb al motor de la base de datos. Ejemplo: Talend, Matillion, etc.<\/td>\n    <td><strong>Categor\u00eda 2 ETL<\/strong>: se a\u00f1aden m\u00e1s funcionalidades de tipo \u00abT\u00bb: limpieza de datos, uniones algo m\u00e1s complejas. Ejemplo de herramientas ETL de categor\u00eda 2 en 2021: IBM data stage, Ab inito, etc.<\/td>\n    <td>&nbsp;<\/td>\n  <\/tr>\n  <tr class=\"greyline\">\n    <th scope=\"row\">A\u00f1o 2010<\/th>\n    <td colspan=\"3\">Invenci\u00f3n del DataLake: una evoluci\u00f3n de los ETL para manejar una situaci\u00f3n en la que no hay un motor de base de datos \u00abdetr\u00e1s\u00bb para realizar las transformaciones. Dado que los ETL requieren un motor de base de datos \u00abdetr\u00e1s\u00bb de ellos, son un poco anticuados. El lago de datos es un nuevo concepto optimizado para los analistas de negocio\/datos y los cient\u00edficos de datos que tienen necesidades de datos m\u00e1s avanzadas. Debido a la aparici\u00f3n del lago de datos, algunos ETL de \u00abcategor\u00eda 2\u00bb est\u00e1n evolucionando hacia una \u00abcategor\u00eda 3\u00bb, optimizada para las necesidades modernas de los \u00abtrabajadores de datos\u00bb:<\/td>\n  <\/tr>\n  <tr>\n    <th scope=\"row\">A\u00f1o 2015<\/th>\n    <td colspan=\"2\">&nbsp;<\/td>\n    <td><strong>Categor\u00eda 3 \u00abETL+\u00bb: para la preparaci\u00f3n de datos<\/strong>: que permite hacer cosas mucho m\u00e1s complejas: miner\u00eda de textos, miner\u00eda de datos (machine leaning), IA, big data, etc. Ejemplo de herramientas ETL de categor\u00eda 3: anatella, alteryx, etc.<\/td>\n  <\/tr>\n<\/table>\n\n\n\n<h2 class=\"wp-block-heading\"><br>ETL del mercado<\/h2>\n\n\n\n<p>Los investigadores de \u00abInto The Minds\u00bb compararon 3 ETL en la categor\u00eda superior: \u00abCategor\u00eda 3: ETL+\u00bb. La comparaci\u00f3n se realiza en tres ejes principales: operaciones de extracci\u00f3n, transformaci\u00f3n y carga (load). Para cada uno de estos ejes, se informa del n\u00famero de \u00abcajas\u00bb disponibles en cada herramienta. A continuaci\u00f3n se presenta un cuadro resumen de los resultados de este estudio:<\/p>\n\n\n\n<table width=\"100%\">\n  <tr>\n    <th width=\"20%\" rowspan=\"2\" scope=\"col\">Nombre de \u00ab bo\u00eetes \u00bb pour:<\/th>\n    <th colspan=\"4\" scope=\"col\" style=\"text-align: center !important;\">ETL<\/th>\n  <\/tr>\n  <tr>\n    <td width=\"20%\" align=\"center\" class=\"greyline\"><strong>Alteryx 2020.1.5.25447<\/strong><\/td>\n    <td width=\"20%\" align=\"center\" class=\"greyline\"><strong>Tableau Prep<\/strong><\/td>\n    <td width=\"20%\" align=\"center\" class=\"greyline\"><strong>Anatella 2.38<\/strong><\/td>\n    <td width=\"20%\" align=\"center\" class=\"greyline\"><strong>Anatella 2.54<\/strong><\/td>\n  <\/tr>\n  <tr>\n    <th scope=\"row\">Extract<\/th>\n    <td align=\"center\" bgcolor=\"#FF6D6D\" style=\"font-weight: bold; color: #FFF;\">4<\/td>\n    <td align=\"center\" bgcolor=\"#FF9900\" style=\"font-weight: bold; color: #FFF;\">57<\/td>\n    <td align=\"center\" bgcolor=\"#FF9900\" style=\"font-weight: bold; color: #FFF;\">37<\/td>\n    <td align=\"center\" bgcolor=\"#92D050\" style=\"font-weight: bold; color: #FFF;\">78<\/td>\n  <\/tr>\n  <tr>\n    <th scope=\"row\">Transform<\/th>\n    <td align=\"center\" bgcolor=\"#FF9900\" style=\"font-weight: bold; color: #FFF;\">33<\/td>\n    <td align=\"center\" bgcolor=\"#FF6D6D\" style=\"font-weight: bold; color: #FFF;\">5<\/td>\n    <td align=\"center\" bgcolor=\"#92D050\" style=\"font-weight: bold; color: #FFF;\">50<\/td>\n    <td align=\"center\" bgcolor=\"#92D050\" style=\"font-weight: bold; color: #FFF;\">50<\/td>\n  <\/tr>\n  <tr>\n    <th scope=\"row\">Load<\/th>\n    <td align=\"center\" bgcolor=\"#FF9900\" style=\"font-weight: bold; color: #FFF;\">5<\/td>\n    <td align=\"center\" bgcolor=\"#FF6D6D\" style=\"font-weight: bold; color: #FFF;\">3<\/td>\n    <td align=\"center\" bgcolor=\"#92D050\" style=\"font-weight: bold; color: #FFF;\">27<\/td>\n    <td align=\"center\" bgcolor=\"#92D050\" style=\"font-weight: bold; color: #FFF;\">27<\/td>\n  <\/tr>\n<\/table>\n\n\n\n<p><br>Cabe se\u00f1alar que los investigadores de Into The Minds utilizaron una versi\u00f3n relativamente antigua de Anatella (v2.38). Actualmente estamos en la v2.54 y esta \u00faltima versi\u00f3n tiene muchos m\u00e1s conectores para la Extracci\u00f3n.<\/p>\n\n\n\n<p>En Anatella, los 78 conectores de entrada son:<\/p>\n\n\n\n<figure class=\"wp-block-image size-full is-resized is-style-default\"><img decoding=\"async\" loading=\"lazy\" src=\"https:\/\/timi.eu\/wp-content\/uploads\/2022\/01\/2022-01-27_123945.png\" alt=\"\" class=\"wp-image-17219\" width=\"1587\" height=\"885\" srcset=\"https:\/\/timi.eu\/wp-content\/uploads\/2022\/01\/2022-01-27_123945.png 1587w, https:\/\/timi.eu\/wp-content\/uploads\/2022\/01\/2022-01-27_123945-600x335.png 600w, https:\/\/timi.eu\/wp-content\/uploads\/2022\/01\/2022-01-27_123945-300x167.png 300w, https:\/\/timi.eu\/wp-content\/uploads\/2022\/01\/2022-01-27_123945-1024x571.png 1024w, https:\/\/timi.eu\/wp-content\/uploads\/2022\/01\/2022-01-27_123945-768x428.png 768w, https:\/\/timi.eu\/wp-content\/uploads\/2022\/01\/2022-01-27_123945-1536x857.png 1536w\" sizes=\"(max-width: 1587px) 100vw, 1587px\" \/><\/figure>\n\n\n\n<p>En cuanto a la funcionalidad de la categor\u00eda \u00abExtract\u00bb, los investigadores de Into The Minds se\u00f1alan que: \u00ab<em>Anatella tambi\u00e9n maneja formatos de entrada no estructurados<\/em>\u00ab. De hecho, Anatella es la \u00fanica herramienta que permite manipular f\u00e1cilmente archivos XML o JSON de varios niveles (el 99% de los archivos XML o JSON son de varios niveles).<\/p>\n\n\n\n<p>Los investigadores de \u00abInto The Minds\u00bb hacen otras observaciones pertinentes que les invito <a href=\"https:\/\/www.intotheminds.com\/blog\/es\/etl\/\" target=\"_blank\" rel=\"noreferrer noopener\">a leer directamente en su blog<\/a>.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Funciones adicionales<\/h2>\n\n\n\n<p>Como se explica en la secci\u00f3n \u00abHistoria\u00bb, los ETL han evolucionado con el tiempo para incluir ciertas funcionalidades que iban m\u00e1s all\u00e1 del marco espec\u00edfico de Extract &#8211; Transform &#8211; Load. Las ETL de la \u00abCategor\u00eda 3: ETL+\u00bb tambi\u00e9n ofrecen <strong>funciones de an\u00e1lisis o visualizaci\u00f3n<\/strong>. De hecho, lejos de ser artilugios, estas funciones adicionales que ofrece la herramienta ETL son <strong>aceleradores<\/strong>. Permiten evitar el proceso de an\u00e1lisis al anticiparse a ciertos pasos del proceso de preparaci\u00f3n de datos.<\/p>\n\n\n\n<p>A modo de ejemplo, he aqu\u00ed algunas caracter\u00edsticas adicionales exclusivas de Anatella que son muy valoradas por los investigadores de \u00abInto The Minds\u00bb:<\/p>\n\n\n\n<ul><li><strong>NLP<\/strong> (<strong>N<\/strong>atural <strong>L<\/strong>anguage <strong>P<\/strong>rocessing): se trata de determinar el sentimiento de un texto en franc\u00e9s, ingl\u00e9s, holand\u00e9s, etc. (esta caracter\u00edstica se utiliza en su trabajo de investigaci\u00f3n sobre la viralidad en Linkedin)<\/li><li><strong>Detecci\u00f3n de idiomas<\/strong>: muy \u00fatil cuando se trabaja con datos no estructurados<\/li><li><strong>Visualizaciones con R<\/strong>: Anatella tiene un c\u00f3digo R incrustado que le permite realizar r\u00e1pidamente visualizaciones sencillas. Pueden utilizarse para tener una primera idea de los datos, pero tambi\u00e9n para realizar controles de calidad. Muy \u00fatil para comprobar que no se ha perdido ning\u00fan dato en el proceso de preparaci\u00f3n de datos.<\/li><\/ul>\n\n\n\n<h2 class=\"wp-block-heading\">Conclusi\u00f3n de los investigadores de \u00abInto The Minds\u00bb: \u00bfQu\u00e9 herramienta ETL elegir?<\/h2>\n\n\n\n<p>Estas son las conclusiones finales de los investigadores de \u00abInto The Minds\u00bb:<\/p>\n\n\n<div style=\"padding-left: 50px;\">\n<p>Es necesario elegir el ETL que mejor se adapte a sus necesidades espec\u00edficas. &#8230; Cada soluci\u00f3n ETL tiene sus propias especificidades y las comparaciones que he hecho arriba son s\u00f3lo una clave de lectura entre otras.<\/p>\n<p>M\u00e1s all\u00e1 de la gama de funcionalidades, tambi\u00e9n hay que tener en cuenta la velocidad de los procesos de preparaci\u00f3n de datos. Los investigadores de \u00abInto The Minds\u00bb ya han realizado una <a href=\"\/es\/blog-es\/news-es\/prueba-de-referencia-etl-tiempo-de-procesamiento-de-1-000-millones-de-filas\/\" target=\"_blank\" rel=\"noreferrer noopener\">comparativa de 4 herramientas ETL<\/a> y las diferencias en el tiempo de procesamiento eran considerables.<\/p>\n<p>Al final, creo que hay <strong>2 criterios objetivos esenciales a tener en cuenta<\/strong>:<\/p>\n<ul>\n<li>funcionalidad<\/li>\n<li>velocidad<\/li>\n<\/ul>\n<p>Adem\u00e1s, hay aspectos m\u00e1s subjetivos, como la hoja de ruta del producto del editor y su orientaci\u00f3n al cliente. Desde este punto de vista, mi preferencia es claramente por Anatella. La empresa que est\u00e1 detr\u00e1s es muy receptiva y no duda en desarrollar soluciones espec\u00edficas para sus necesidades. Dudo que empresas como Talend o Alteryx hagan lo mismo.<\/p>\n<\/div>\n\n\n<p>Las conclusiones de los investigadores de Into The Minds son claras: sean cuales sean los criterios utilizados para calificar un ETL (alcance de la funcionalidad, velocidad de ejecuci\u00f3n, calidad de la asistencia al cliente, etc.), el ETL dominante es Anatella.<\/p>\n","protected":false},"excerpt":{"rendered":"Sean cuales sean los criterios utilizados para calificar un ETL (alcance de la funcionalidad, velocidad de ejecuci\u00f3n, calidad de la asistencia al cliente, etc.), el ETL dominante es Anatella.","protected":false},"author":1,"featured_media":17240,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[443,251,228],"tags":[441],"_links":{"self":[{"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/posts\/17441"}],"collection":[{"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/comments?post=17441"}],"version-history":[{"count":8,"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/posts\/17441\/revisions"}],"predecessor-version":[{"id":17927,"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/posts\/17441\/revisions\/17927"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/media\/17240"}],"wp:attachment":[{"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/media?parent=17441"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/categories?post=17441"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/timi.eu\/es\/wp-json\/wp\/v2\/tags?post=17441"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}