series for the level 100 watson videos para el nivel 100 watson 2. analytics enablement this first video 2. habilitacin analtica de esta primera series will be all about data so serie de video ser todo acerca de los 3. arguably the most important thing datos para 3. posiblemente lo ms importante antes before you can start using watson de empezar a usar watson analytics es analytics is 4. entender el tipo de datos que va a 4. understanding the type of data that's funcionar y cmo obtenerlo en watson gonna work and how to get it into 5. analtica para que una nota antes de watson entrar a la derecha en los datos son parte 5. analytics so one note before you get de la discusin es right into the data are part of the 6. slo una nota sobre el idioma son discussion is actualmente watson analytics slo soporta 6. just a note about language are Ingls currently watson analytics only 7. hay mucho trabajo que se necesita para supports English entrar en la automatizacin y 8. inteligencia entre bastidores para poder 7. language there's a lot of work that apoyar otros idiomas needs to go into the automation and 9. cosas como anlisis de intenciones en 8. intelligence behind the scenes to be el cuadro de dilogo de idioma nacional no able to support other languages so son 9. things like intent analysis in the 10. trivial actualizar a traducir a otros national language dialog box are are idiomas para localizar as en este not 11. tiempo que slo el deporte Ingls 10. trivial to update to to translate to other Ingls idioma y, aunque es posible languages to localize so at this 12. cargar en un conjunto de datos de 11. time we only sport English English idioma diferente, por ejemplo, si tengo una language and while it is possible to hoja de Excel 13. en francs podra cargarlo en lo que 12. load in a different language data set for no queremos hacer que para una pareja example if I have an excel sheet 14. razones diferentes 13. in French I could load it in however we 15. a Podramos obtener algunos don't want to do that for a couple resultados inesperados de hecho, 14. different reasons probablemente obtendr algunos 15. a we might get some unexpected 16. resultados inesperados porque nuestra results in fact you likely will get some lgica ms antigua est construida en 16. unexpected results because our elder ingls ahora mismo logic is built in English right now so 17. No queremos mostrar a la gente eso y 17. we don't want to show people that and tampoco queremos dar a la gente la also we don't want to give people the 18. impresin de que apoyamos otros idiomas cuando actualmente no lo 18. impression either that we support other hacemos languages when currently we do don't 19. eso es solo una nota sobre el lenguaje so slo para empezar a hablar 19. that's just a note about language just to 20. especficamente sobre el tipo de datos kick things off to talking que funcionarn bien o mejor en watson 20. specifically about the type of data that 21. analtica probablemente la manera will work well or best in watson ms fcil de describirlo sera watson soportes analticos 22. rectngulos de datos para que los 21. analytics probably the easiest way to datos tengan que estar bien estructurados describe it would be watson analytic con filas y supports 23. columnas uniformes de valores 22. rectangles of data so that data has to uniformes cuando la cada columna ms be nicely structured with rows and fcil con pensar en ello 24. sera una tabla de base de datos para 23. columns uniform uniform values when que la tabla de base de datos vuelva a ser the each column easiest with think una columna uniforme cada about it 25. columna tiene tipos de valores 24. would be a database table so database consistentes que seran el tipo de datos table again as uniform columns every que es 25. column has consistent types of values 26. soportado ptimo para Watson that would be the type of data that is analytics 26. supported optimal for Watson analytics 27. as que djeme popover al lado de 27. so let me popover to next to excel and sobresalir y le muestre un ejemplo de un show you an example of a dataset that conjunto de datos que would 28. funcionan bien este va a ser el conjunto de datos que usamos para la 28. work well this is going to be the dataset base de la we use for the basis of the 29. ejercicios de las series de video para 29. exercises of those video series for this este nivel 100 habilitar lo que eres level 100 enablement what you're 30. mirar aqu es una encuesta de 30. looking at here is a satisfaction survey satisfaccin para imaginar una aerolnea y so imagine an airline and this is the este es el 31. type of data set you look at where 31. tipo de conjunto de datos en el que every row represents a different survey mira cada fila representa una encuesta 32. responded and they provided diferente information about their satisfaction 32. respondieron y proporcionaron rating if they informacin sobre su grado de satisfaccin si 33. had status when they flew where they 33. tenan estatus cuando volaban de flew from to what airline they were donde volaban desde a qu aerolnea eran 34. flying a lot of different columns about 34. volando un montn de columnas every every every column represents a diferentes sobre cada cada columna 35. different variable or aspect of the representa un survey the customer responded to a 35. variable o aspecto diferente de la 36. couple things to point out here again encuesta que el cliente respondi a una you've got a nicely structured data set 36. cosas de pareja para sealar aqu otra 37. there is no formatting this new headers vez que usted tiene un conjunto de datos or footers aggregate values again all bien estructurado 38. things that will cause a problem is part 37. no hay formateo de estos nuevos encabezados o pies de pgina agregan of the data import also point out that I valores de nuevo todos 39. see about this dataset is that 38. las cosas que causan un problema es everything in the column titles are nice parte de la importacin de datos tambin 40. and intuitive and concise and that is sealan que yo extremely important as well because 41. that's going to affect the experience of 43. para cambiar o eliminar guiones bajos the user when you're looking at loading eliminar guiones puntos caracteres 42. a dataset of the watson analytics so especiales de nuevo no again make sure that you take the time 44. porque watson analytics no puede 43. to change or remove underscores manejar esas cosas pero slo porque eso remove dashes dots special characters va a again not 45. afectar la experiencia del usuario 44. because watson analytics can't handle cuando usted est mirando los resultados those things but just because that's dentro de Watson 46. analytics as que antes de que incluso going to nos metamos en la carga de datos vamos 45. affect the experience of the user when a tomar un par you're looking at the results inside 47. Momentos para ver algunos de los Watson problemas o problemas que se pueden 46. analytics so before we even get into presentar en la carga de datos uploading data let's just take a couple 48. o usted sabe que los clientes podran 47. moments to look at some of the enfrentar tambin el primero est problems or issues you may run into alrededor en el tipo loading data 49. nos centraremos en las hojas de 48. or you know that customers might face Excel, algunos problemas de formato y la as well the first one is around at the mayora de la mayora de los usuarios 50. cuando piensan en hojas de Excel type normalmente no piensan en datos en 49. of let's focus on Excel sheets, some 51. de esta manera muy limpia y formatting issues and most most users estructurada suelen sobresalir hojas tienen 50. when they think of Excel sheets clculos typically they don't think of data in 52. para los agregados Manning 51. this way very clean and structured 53. etc aqu aqu es un buen ejemplo de lo usually excel sheets have calculations que es 52. for Manning aggregates 54. miramos la hoja formada muy simple 53. etc so here's here's a good example of que usted tiene una cabecera con algunos what that is colores y 54. we look at the very simple formated 55. tienes algunas cabeceras jerarquizadas anidadas as que tienes sheet you've got a header with some algunos totales que se extienden colors and 56. mltiples columnas con algunos 55. you've got some nested nested agregados pero esto sera un muy tpico headers as well you've got some totals tal vez Excel that span 57. hoja de clculo que los usuarios 56. multiple columns with some podran tener e intentara cargar en aggregates but this would be a very Watson typical maybe Excel 58. analytics el problema con este formato 57. spreadsheet that the users might have particular es lo que hace watson analytics and would try to upload into Watson 59. actualmente es que mira a la primera 58. analytics the problem with this fila de datos en elige que sea el 60. los encabezados de columna as que particular format is what watson cuando esta hoja se carga, vera el analytics does informe de ventas es un 59. currently is that it looks at the first row 61. cabecera de columna y no hay otros of data in chooses that to be the encabezados de columna en esto en las 60. column headers so when this sheet hojas as gets loaded it would see sales report is 62. que obviamente no es bueno tambin a mirar toda esta columna y dir que 61. column header and there are no other 63. todos estos valores son ahora column headers in this in the sheets so elementos de la columna de reporte de 62. that is obviously not good it will also ventas para que los productos look at this entire column and say that 64. que es una cabecera que no queremos 63. all of these values are now elements of que el producto ABC sea reconocido pero the sales report column so products 65. los totales en promedio tambin 64. which is a header which we don't want apareceran como un elemento en este reporte de ventas una columna product ABC would be recognized but 66. que otra vez sera incorrecta y los 65. totals in average would also show up desafos que llevara al usuario a obtener as an element in this sales report a 67. algunos resultados muy inesperados column en resultados posiblemente muy confusos 66. which again would be incorrect and the tambin challenges it would lead the user to get 68. tan abajo del da las hojas que utiliz 67. some very unexpected results in in para cargar en watson analytics si usted possibly very confusing results as well 69. El uso de Excel CSV tiene que ser 68. so down the day the sheets you used muy estructurado, no puede tener formato to upload into watson analytics if you 70. y los encabezamientos de lo contrario 69. using Excel CSV have to be very el habitual obtener algunos resultados inesperados structured they cannot have formatting 71. mirar otro ejemplo veamos algo que es 70. and headers otherwise the usual get de nuevo un poco some unexpected results 72. mejor as que aqu sera un muy, muy 71. to look at another example let's look at algunos de conjunto de hoja con algunos something that is again a little de 72. better so here would be a very very 73. que el formato eliminado esto some of set formated sheet with some funcionar mejor, pero todava no ser of ideal y 73. that formatting removed this will work 74. esto es un poco ms de un problema better but it still won't be ideal and sutil que ste vendr probablemente 74. this is a bit more of a subtle problem porque 75. tenemos esta fila de encabezados as this one will come in probably because que los productos son que su columna que 75. we have this row of headers so es correcta products is that his column that's 76. regiones otro y tenemos una columna correct para cada mes y vamos a asumir 76. regions another one and we have one 77. que todos estos nmeros son ventas column for every month and let's unitarias esto se cargar correctamente en assume watson 77. that all these numbers are unit sales 78. analtica, pero se nota aqu han this will load properly into watson llamado esta estructura pobre en mi parte 78. analytics but you notice here have superior o la parte inferior called this poor structure in my top or 79. porque lo que va a pasar es que esto no va a ser ideal para todos los tipos de the bottom 80. el usuario puede querer hacer algo 79. because what's gonna happen is that muy comnmente que quiero hacer this is not gonna be ideal for all types 81. despus de cargar el Set sera ver tal of vez un grfico de lneas que muestra las 80. analysis the user might wanna do so ventas unitarias something very commonly I want to do 82. Con el tiempo, los desafos son que no 81. after load the Set would be to see le permitir hacer que no maybe a line chart showing unit sales 83. le permiten hacer incluso una comparacin de meses slo por el formato 82. over time the challenges is that it won't de este archivo allow you to do that it won't 84. porque esto es realmente una tabla de 83. allow you to do even a comparison of referencias cruzadas cuando se mira months just because of the format of porque tenemos mucho this file 85. diferentes columnas pero tienen la misma unidad de medida son todas 84. because this is really a crosstab when unidades you look at it because we've got whole 86. ventas y no le permitir hacer una much comparacin esto es esto es 85. different columns but they've got the esencialmente un same unit of measurement these are 87. para realizar ese tipo de anlisis que all unit est vinculado para hacer una 86. sales and it won't allow you to do a comparacin entre comparison this is this is essentially a 88. meses para mostrar las ventas 87. crosstab to do that type of analysis unitarias a lo largo del tiempo usted which is tied to do a comparison tendra que transponer esto o between 89. quiz lo normalizas, podras llamarlo para que solo tengas una sola columna 88. months to show unit sales over time para you would have to transpose this or or 90. esa medida llam a las ventas de la 89. maybe normalize it you might call it so unidad as que dobla sobre dos lengeta that you only have a single column for separada en el fondo 90. that measure called unit sales so flip 91. que estoy llamando mejor estructura over two separate tab at the bottom esto sera el el cmo despus de la 91. which i'm calling better structure this 92. La transposicin de la cruzada en una would be the the how after the forma ms normalizada slo tiene una 92. transposing of that crossed out into a 93. columna para las unidades vendidas more normalized form we have only esto le permitira hacer one 94. mostrar la tendencia de las unidades vendidas en el tiempo y hacer una 93. column for units sold this would allow comparacin entre meses you to do 95. porque meses tiene ahora su propia 94. showing that trend of units sold over columna y unidades vendidas tambin time and do a comparison between tiene su propia columna months 96. por lo que este es un poco ms de un 95. because months now has its own problema sutil que no puede notar al column and units sold also has its own principio column 97. y puede dar lugar a cierta frustracin 96. so this is a bit of a more of a subtle porque no se puede hacer el anlisis que problem that you may not notice at first 98. usted quiere otra vez esto no es un 97. and it may lead to some frustration problema que es nico a watson analytics 99. esto es un problema because you can't do the analysis that 100. con casi todas las soluciones 98. you want again this is not a problem similares de tareas en las que el formato that is unique to watson analytics tiene que ser un 99. this is a problem 101. una manera muy especfica de lograr 100. with almost all similar type un anlisis ptimo decir que es slo otra solutions of chores where the format 102. Los problemas sutiles me permiten has to be a volver al conjunto de datos que vamos a utilizar para la 103. mayora de esta nueva serie esta es 101. very specific way to achieve la encuesta de satisfaccin conjunto de optimal analysis say so that's just datos de nuevo another 104. y notar nuevamente que todas las 102. subtle problems let me flip back dems medidas que tenemos aqu estn to the dataset we are gonna be using en 105. columnas simples y de nuevo for the 106. bien estructurado bien nombrado 103. majority of this this new series cabeceras de columna que sera el tipo this is the satisfaction survey data set ideal de again 107. conjunto de datos para su uso en 104. and again notice that everything Watson analytics as al final de este primer all the other measures we have here vdeo en el are in 108. series de datos para el nivel 100 de 105. single columns and again anlisis de watson permitan que el 106. nicely structured nicely named siguiente video de esta serie fuese column headers this would be the ideal 109. mire la carga de datos y observe los type of diferentes mtodos que puede cargar 110. ya sea Excel o de una base de datos 107. data set for use in Watson de nuevo gracias por mirar y sintonizar analytics so at the end of this first video 111. al siguiente video de esta serie in the 108. data series for watson analytics level 100 enablemeant the next video in this series were gonna 109. look at the data upload and look at different methods you can upload it 110. whether it be Excel or from a database so again thanks for watching and tune in 111. to the next video of this series