Anda di halaman 1dari 6

1. hello and welcome to the first video 1.

hola y bienvenidos a la primera serie de


series for the level 100 watson videos para el nivel 100 watson
2. analytics enablement this first video 2. habilitacin analtica de esta primera
series will be all about data so serie de video ser todo acerca de los
3. arguably the most important thing datos para
3. posiblemente lo ms importante antes
before you can start using watson de empezar a usar watson analytics es
analytics is 4. entender el tipo de datos que va a
4. understanding the type of data that's funcionar y cmo obtenerlo en watson
gonna work and how to get it into 5. analtica para que una nota antes de
watson entrar a la derecha en los datos son parte
5. analytics so one note before you get de la discusin es
right into the data are part of the 6. slo una nota sobre el idioma son
discussion is actualmente watson analytics slo soporta
6. just a note about language are Ingls
currently watson analytics only 7. hay mucho trabajo que se necesita para
supports English entrar en la automatizacin y
8. inteligencia entre bastidores para poder
7. language there's a lot of work that
apoyar otros idiomas
needs to go into the automation and 9. cosas como anlisis de intenciones en
8. intelligence behind the scenes to be el cuadro de dilogo de idioma nacional no
able to support other languages so son
9. things like intent analysis in the 10. trivial actualizar a traducir a otros
national language dialog box are are idiomas para localizar as en este
not 11. tiempo que slo el deporte Ingls
10. trivial to update to to translate to other Ingls idioma y, aunque es posible
languages to localize so at this 12. cargar en un conjunto de datos de
11. time we only sport English English idioma diferente, por ejemplo, si tengo una
language and while it is possible to hoja de Excel
13. en francs podra cargarlo en lo que
12. load in a different language data set for
no queremos hacer que para una pareja
example if I have an excel sheet 14. razones diferentes
13. in French I could load it in however we 15. a Podramos obtener algunos
don't want to do that for a couple resultados inesperados de hecho,
14. different reasons probablemente obtendr algunos
15. a we might get some unexpected 16. resultados inesperados porque nuestra
results in fact you likely will get some lgica ms antigua est construida en
16. unexpected results because our elder ingls ahora mismo
logic is built in English right now so 17. No queremos mostrar a la gente eso y
17. we don't want to show people that and tampoco queremos dar a la gente la
also we don't want to give people the 18. impresin de que apoyamos otros
idiomas cuando actualmente no lo
18. impression either that we support other
hacemos
languages when currently we do don't 19. eso es solo una nota sobre el lenguaje
so slo para empezar a hablar
19. that's just a note about language just to 20. especficamente sobre el tipo de datos
kick things off to talking que funcionarn bien o mejor en watson
20. specifically about the type of data that 21. analtica probablemente la manera
will work well or best in watson ms fcil de describirlo sera watson
soportes analticos
22. rectngulos de datos para que los
21. analytics probably the easiest way to datos tengan que estar bien estructurados
describe it would be watson analytic con filas y
supports 23. columnas uniformes de valores
22. rectangles of data so that data has to uniformes cuando la cada columna ms
be nicely structured with rows and fcil con pensar en ello
24. sera una tabla de base de datos para
23. columns uniform uniform values when que la tabla de base de datos vuelva a ser
the each column easiest with think una columna uniforme cada
about it 25. columna tiene tipos de valores
24. would be a database table so database consistentes que seran el tipo de datos
table again as uniform columns every que es
25. column has consistent types of values 26. soportado ptimo para Watson
that would be the type of data that is analytics
26. supported optimal for Watson analytics 27. as que djeme popover al lado de
27. so let me popover to next to excel and sobresalir y le muestre un ejemplo de un
show you an example of a dataset that conjunto de datos que
would 28. funcionan bien este va a ser el
conjunto de datos que usamos para la
28. work well this is going to be the dataset
base de la
we use for the basis of the 29. ejercicios de las series de video para
29. exercises of those video series for this este nivel 100 habilitar lo que eres
level 100 enablement what you're 30. mirar aqu es una encuesta de
30. looking at here is a satisfaction survey satisfaccin para imaginar una aerolnea y
so imagine an airline and this is the este es el
31. type of data set you look at where 31. tipo de conjunto de datos en el que
every row represents a different survey mira cada fila representa una encuesta
32. responded and they provided diferente
information about their satisfaction 32. respondieron y proporcionaron
rating if they informacin sobre su grado de satisfaccin
si
33. had status when they flew where they
33. tenan estatus cuando volaban de
flew from to what airline they were donde volaban desde a qu aerolnea eran
34. flying a lot of different columns about 34. volando un montn de columnas
every every every column represents a diferentes sobre cada cada columna
35. different variable or aspect of the representa un
survey the customer responded to a 35. variable o aspecto diferente de la
36. couple things to point out here again encuesta que el cliente respondi a una
you've got a nicely structured data set 36. cosas de pareja para sealar aqu otra
37. there is no formatting this new headers vez que usted tiene un conjunto de datos
or footers aggregate values again all bien estructurado
38. things that will cause a problem is part 37. no hay formateo de estos nuevos
encabezados o pies de pgina agregan
of the data import also point out that I
valores de nuevo todos
39. see about this dataset is that 38. las cosas que causan un problema es
everything in the column titles are nice parte de la importacin de datos tambin
40. and intuitive and concise and that is sealan que yo
extremely important as well because
41. that's going to affect the experience of 43. para cambiar o eliminar guiones bajos
the user when you're looking at loading eliminar guiones puntos caracteres
42. a dataset of the watson analytics so especiales de nuevo no
again make sure that you take the time 44. porque watson analytics no puede
43. to change or remove underscores manejar esas cosas pero slo porque eso
remove dashes dots special characters va a
again not 45. afectar la experiencia del usuario
44. because watson analytics can't handle cuando usted est mirando los resultados
those things but just because that's dentro de Watson
46. analytics as que antes de que incluso
going to nos metamos en la carga de datos vamos
45. affect the experience of the user when a tomar un par
you're looking at the results inside 47. Momentos para ver algunos de los
Watson problemas o problemas que se pueden
46. analytics so before we even get into presentar en la carga de datos
uploading data let's just take a couple 48. o usted sabe que los clientes podran
47. moments to look at some of the enfrentar tambin el primero est
problems or issues you may run into alrededor en el tipo
loading data 49. nos centraremos en las hojas de
48. or you know that customers might face Excel, algunos problemas de formato y la
as well the first one is around at the mayora de la mayora de los usuarios
50. cuando piensan en hojas de Excel
type
normalmente no piensan en datos en
49. of let's focus on Excel sheets, some 51. de esta manera muy limpia y
formatting issues and most most users estructurada suelen sobresalir hojas tienen
50. when they think of Excel sheets clculos
typically they don't think of data in 52. para los agregados Manning
51. this way very clean and structured 53. etc aqu aqu es un buen ejemplo de lo
usually excel sheets have calculations que es
52. for Manning aggregates 54. miramos la hoja formada muy simple
53. etc so here's here's a good example of que usted tiene una cabecera con algunos
what that is colores y
54. we look at the very simple formated 55. tienes algunas cabeceras
jerarquizadas anidadas as que tienes
sheet you've got a header with some
algunos totales que se extienden
colors and 56. mltiples columnas con algunos
55. you've got some nested nested agregados pero esto sera un muy tpico
headers as well you've got some totals tal vez Excel
that span 57. hoja de clculo que los usuarios
56. multiple columns with some podran tener e intentara cargar en
aggregates but this would be a very Watson
typical maybe Excel 58. analytics el problema con este formato
57. spreadsheet that the users might have particular es lo que hace watson analytics
and would try to upload into Watson 59. actualmente es que mira a la primera
58. analytics the problem with this fila de datos en elige que sea el
60. los encabezados de columna as que
particular format is what watson
cuando esta hoja se carga, vera el
analytics does informe de ventas es un
59. currently is that it looks at the first row 61. cabecera de columna y no hay otros
of data in chooses that to be the encabezados de columna en esto en las
60. column headers so when this sheet hojas as
gets loaded it would see sales report is 62. que obviamente no es bueno tambin
a mirar toda esta columna y dir que
61. column header and there are no other 63. todos estos valores son ahora
column headers in this in the sheets so elementos de la columna de reporte de
62. that is obviously not good it will also ventas para que los productos
look at this entire column and say that 64. que es una cabecera que no queremos
63. all of these values are now elements of que el producto ABC sea reconocido pero
the sales report column so products 65. los totales en promedio tambin
64. which is a header which we don't want apareceran como un elemento en este
reporte de ventas una columna
product ABC would be recognized but 66. que otra vez sera incorrecta y los
65. totals in average would also show up desafos que llevara al usuario a obtener
as an element in this sales report a 67. algunos resultados muy inesperados
column en resultados posiblemente muy confusos
66. which again would be incorrect and the tambin
challenges it would lead the user to get 68. tan abajo del da las hojas que utiliz
67. some very unexpected results in in para cargar en watson analytics si usted
possibly very confusing results as well 69. El uso de Excel CSV tiene que ser
68. so down the day the sheets you used muy estructurado, no puede tener formato
to upload into watson analytics if you 70. y los encabezamientos de lo contrario
69. using Excel CSV have to be very el habitual obtener algunos resultados
inesperados
structured they cannot have formatting
71. mirar otro ejemplo veamos algo que es
70. and headers otherwise the usual get de nuevo un poco
some unexpected results 72. mejor as que aqu sera un muy, muy
71. to look at another example let's look at algunos de conjunto de hoja con algunos
something that is again a little de
72. better so here would be a very very 73. que el formato eliminado esto
some of set formated sheet with some funcionar mejor, pero todava no ser
of ideal y
73. that formatting removed this will work 74. esto es un poco ms de un problema
better but it still won't be ideal and sutil que ste vendr probablemente
74. this is a bit more of a subtle problem porque
75. tenemos esta fila de encabezados as
this one will come in probably because
que los productos son que su columna que
75. we have this row of headers so es correcta
products is that his column that's 76. regiones otro y tenemos una columna
correct para cada mes y vamos a asumir
76. regions another one and we have one 77. que todos estos nmeros son ventas
column for every month and let's unitarias esto se cargar correctamente en
assume watson
77. that all these numbers are unit sales 78. analtica, pero se nota aqu han
this will load properly into watson llamado esta estructura pobre en mi parte
78. analytics but you notice here have superior o la parte inferior
called this poor structure in my top or 79. porque lo que va a pasar es que esto
no va a ser ideal para todos los tipos de
the bottom
80. el usuario puede querer hacer algo
79. because what's gonna happen is that muy comnmente que quiero hacer
this is not gonna be ideal for all types 81. despus de cargar el Set sera ver tal
of vez un grfico de lneas que muestra las
80. analysis the user might wanna do so ventas unitarias
something very commonly I want to do 82. Con el tiempo, los desafos son que no
81. after load the Set would be to see le permitir hacer que no
maybe a line chart showing unit sales 83. le permiten hacer incluso una
comparacin de meses slo por el formato
82. over time the challenges is that it won't de este archivo
allow you to do that it won't 84. porque esto es realmente una tabla de
83. allow you to do even a comparison of referencias cruzadas cuando se mira
months just because of the format of porque tenemos mucho
this file 85. diferentes columnas pero tienen la
misma unidad de medida son todas
84. because this is really a crosstab when unidades
you look at it because we've got whole 86. ventas y no le permitir hacer una
much comparacin esto es esto es
85. different columns but they've got the esencialmente un
same unit of measurement these are 87. para realizar ese tipo de anlisis que
all unit est vinculado para hacer una
86. sales and it won't allow you to do a comparacin entre
comparison this is this is essentially a 88. meses para mostrar las ventas
87. crosstab to do that type of analysis unitarias a lo largo del tiempo usted
which is tied to do a comparison tendra que transponer esto o
between 89. quiz lo normalizas, podras llamarlo
para que solo tengas una sola columna
88. months to show unit sales over time
para
you would have to transpose this or or 90. esa medida llam a las ventas de la
89. maybe normalize it you might call it so unidad as que dobla sobre dos lengeta
that you only have a single column for separada en el fondo
90. that measure called unit sales so flip 91. que estoy llamando mejor estructura
over two separate tab at the bottom esto sera el el cmo despus de la
91. which i'm calling better structure this 92. La transposicin de la cruzada en una
would be the the how after the forma ms normalizada slo tiene una
92. transposing of that crossed out into a 93. columna para las unidades vendidas
more normalized form we have only esto le permitira hacer
one 94. mostrar la tendencia de las unidades
vendidas en el tiempo y hacer una
93. column for units sold this would allow
comparacin entre meses
you to do 95. porque meses tiene ahora su propia
94. showing that trend of units sold over columna y unidades vendidas tambin
time and do a comparison between tiene su propia columna
months 96. por lo que este es un poco ms de un
95. because months now has its own problema sutil que no puede notar al
column and units sold also has its own principio
column 97. y puede dar lugar a cierta frustracin
96. so this is a bit of a more of a subtle porque no se puede hacer el anlisis que
problem that you may not notice at first 98. usted quiere otra vez esto no es un
97. and it may lead to some frustration problema que es nico a watson analytics
99. esto es un problema
because you can't do the analysis that
100. con casi todas las soluciones
98. you want again this is not a problem similares de tareas en las que el formato
that is unique to watson analytics tiene que ser un
99. this is a problem 101. una manera muy especfica de lograr
100. with almost all similar type un anlisis ptimo decir que es slo otra
solutions of chores where the format 102. Los problemas sutiles me permiten
has to be a volver al conjunto de datos que vamos a
utilizar para la
103. mayora de esta nueva serie esta es
101. very specific way to achieve la encuesta de satisfaccin conjunto de
optimal analysis say so that's just datos de nuevo
another 104. y notar nuevamente que todas las
102. subtle problems let me flip back dems medidas que tenemos aqu estn
to the dataset we are gonna be using en
105. columnas simples y de nuevo
for the 106. bien estructurado bien nombrado
103. majority of this this new series cabeceras de columna que sera el tipo
this is the satisfaction survey data set ideal de
again 107. conjunto de datos para su uso en
104. and again notice that everything Watson analytics as al final de este primer
all the other measures we have here vdeo en el
are in 108. series de datos para el nivel 100 de
105. single columns and again anlisis de watson permitan que el
106. nicely structured nicely named siguiente video de esta serie fuese
column headers this would be the ideal 109. mire la carga de datos y observe los
type of diferentes mtodos que puede cargar
110. ya sea Excel o de una base de datos
107. data set for use in Watson
de nuevo gracias por mirar y sintonizar
analytics so at the end of this first video 111. al siguiente video de esta serie
in the
108. data series for watson analytics
level 100 enablemeant the next video
in this series were gonna
109. look at the data upload and look
at different methods you can upload it
110. whether it be Excel or from a
database so again thanks for watching
and tune in
111. to the next video of this series

Anda mungkin juga menyukai