Anda di halaman 1dari 4

Imprimir | Regresaralanota

Sociedad | Domingo,18demayode2014

COMONETFLIXLOGRAPREDECIRLOQUESUSCLIENTESQUIERENVER

Lamatemticadelgusto
Netflixesunaempresaestadounidense,cuyoservicioahoratambinsebrindaenla
Argentina,queofrecepelculasyseriesparaveratravsdeInternet.Paraacercarse
algustodecadausuarioutilizaunalgoritmoyparamejorarlollamaunconcurso
porunmillndedlares.Aqu,unahistoriasorprendentedecineymatemtica.
PorAdrinPaenza
Desdehacepocotiempo,laArgentinaseincorporalncleode
pasesservidosporNetflix.Lacompaasehapopularizado
rpidamenteyloquesucediactieneuncorrelatoconloqueest
pasandoenelrestodelmundo.QuesNetflix?Netflixesuna
compaanorteamericana,fundadaen1997ycuyabaseestenla
ciudaddeLosGatos,enCalifornia.Sibienoriginalmentefuela
primeraenproveerdeunserviciodeDVDadomicilioparatodos
aquellosquepagaranunasuscripcinmensual,laevolucindela
tecnologalatransformahoraenunaproveedoradelmismomaterial
(pelculasyseries)peroahorayanoesnecesarioeltransportefsico
delcontenido,sinoquestellegaalusuarioatravsdeunaconexin
aInternet,enloquesedenominastreamingvideoosea,elflujode
videoquellegageneradoporunafuenteremota.Dichodeotraforma:
tenerunasuscripcinaNetflixseraequivalenteateneraccesoaun
canaldecable,peroenlugardellegarnicamenteasutelevisor,
llegaasucomputadora(ocualquierdipositivoequivalente)atravs
deInternet.

ElcofundadoryCEOdeNetflix,Reed
Hastings.

Dosobservacionesesenciales:
1)Adiferenciadeloquesucedeconuncanaldetelevisin,endondeelgerenteartsticoesquiendetermina
quseemite,enelcasodeNetflixeselusuarioquieneligeloquequierever,y
2)Eselusuarioquien,adems,determinacundoveloquequierever.
Sondatosnomenoresyquemarcantambinuncambioeneljuegoqueexistidesdequeaparecila
televisin.Ahora,elclientecontrolaelqu,elcundoyeldnde.
Yunagregado:ademsdepelculas,Netflixofreceseriesdetelevisinqueyanoslosonlasquereproducen
loscanalesdeairey/odecable,sinoqueporprimeravezenlahistoriaprodujoundocumental(TheSquare)que
solamentesepuedeversiunoestsuscriptoyquefuenominadoalOscarenlaedicindelcorrienteao.Por
otrolado,enelao2013debutHouseofCards(CastillodeNaipesoCasadeNaipes)quefuelaprimeraserie
generadaespecficamenteparaquesevieraporInternetycuyacalidadfuereconocidaalhaberrecibidounode
lospremiosEmmy.
PorquhablardeNetflix?
Casidesdequeinicisusactividades,Netflixadvirtiqueelgrannegocioademsdelasuscripcinerapoder
predeciryporlotantorecomendarquesloqueelusuariopodaquererver.Esdecir,personasquecomousted
oyopreferimosenunmomentodeterminadoquedarnosencasaparaverunapelculaenlugardeirauncineo
teatro,tenemoslaalternativadeelegirquyenqumomentomirarla.Peroaquapareceelgrandilema:qu
mirar?Unavezsaciadalanecesidadpersonalosocialdeverlosestrenos,lasnovedadesobienloqueestde
moda,oinclusoesodeloquetodoelmundoalrededornuestrohablaocualquierotravariante,cmohacer
parasaberquelegirentremilesdepelculasy/oseries?

Yesaqudondeunavezmsentralamatemtica.SiustedesusuariodeInternetdesdehacetiempoyha
bajadomsicaounlibroounapelculaounaseriedetelevisin(porponersolamentealgunosejemplos),deca,
ustedsehabrtropezadoconqueaparecealguiendentrodelsitioqueustedestvisitandoqueledice:las
personasqueleyeronCienaosdesoledad,deGabrielGarcaMarquez,tambinleyeronLaGuerraylaPaz,
deTolstoi.Obien,laspersonasquebajaronlamsicadeYesterdaydelosBeatles,tambincompraron
HolidaydelosBeeGees,oaquellosquevieronPasqualinoSettebelezzetambinvieronIPugniinTasca.
Obviamente,lalistapodraseguiryseguir.
Netflixtena(ytiene)unprogramaquesellamaCinematch.Cadapersona,luegodemirarunapelcula,es
invitadaarankearla,algoascomoadjudicarleunpuntaje(quevaraentreunaycincoestrellas)deacuerdo
concuntolehayagustado.EsosratingseguardanyconstituyenunabasededatosfabulosaqueluegoNetflix
aprovecha.LaideamadrequeusantantoNetflixcomoAmazon(porponerotroejemplo)sebasaenquesiados
personaslesgustaundeterminadoproducto(msica,literatura,pelcula),esmuyposiblequetenganms
cosasencomn.Claro,detrsdealgotaningenuoysencillo,transparenteparaelusuario,hayunalgoritmoque
tieneencuentamillonesdedatos,relacionesentreellosymultiplicidaddepreferencias.Cinematchesel
nombredeeseprograma,queaparecesubyacenteenelsitiowebdeNetflixyquelesirveparaanalizarlos
hbitosdesusespectadoresyunavezquealguienterminadeverunapelcula,lerecomiendaotras.En
promedio,unsuscriptordeNetflixquellevaalgunosaoshacalificadoalrededorde200pelculasentreaquellas
quevioenunpasadorecienteperotambinaquellasquevioenotraspocas.Porlotanto,Netflixtiene
muchsimainformacinacercadeloqueloqueles/nosgustaalosconsumidores(ytambinloquenonos
gusta).Laideaentoncesesbuscarpatrones,observacionesqueaunapersonacomnnoscostaraonos
seraimposibledetectar.Primero,porquenotenemostiempo,ysegundoporqueaunquenospropusiramos
hacerloenformaindividual,nosllevaraelmismotiempoquelesllevanuestrosantepasadospasarde
conseguirfuegofrotandodospiedrashastallegaralencendedorelectrnico.Unalgoritmobienescritolohace
sinesfuerzo.Ymeapuroaescribiralgoms:casiel70porcientodelaspelculasquelosusuariosdeNetflix
miranresultanserunaconsecuenciadirectadelasrecomendacionesdeCinematch.Ynosloeso,elsistema
derecomendacionestambinenseaamirar,aelegirpelculasquenosonnilasmspromocionadas,nilas
delosgrandesestudiosdeHollywood,nilasdemayorrating,sinoqueaparecenpelculasindependientes,de
mercadosquesuelensermarginales.Endefinitiva,unoseeducayaprendeaelegirtambin.
Peromedesvi.Cinematchanticipaoprediceelrankingqueunusuariolesdeberaponeradeterminadas
pelculas,ysebasaparahacerloenlasnotas(onmerodeestrellas)queesamismapersonalespusoa
pelculasquevioanteriormente.
Paradecirloenformamsmatemtica(ylepidoquemeacompaeenesterazonamientoporqueesmuy
sencillo):Cinematchoperaconcuaternascomosta:(nmerodeusuario,nmerodepelcula,fecha,
calificacin).Porejemplo(388,162,4demayo,3estrellas).
Comoustedadvierte,lostresprimerosdatosestnfijosydeterminados.Elniconmeroocoordenadaque
estlibreeslaltima,ladelacalificacin.
ElcofundadoryCEOdeNetflix,ReedHastingsquientambinfuemiembrodeldirectoriodeMicrosoftyahora
integraeldeFacebook,advirtiqueelalgoritmoqueusabalaempresahaballegadoauntopeensu
capacidadpredictiva.Ycomotodoinnovadorsepreguntsielproblemaestabaenellosmismos,enqueno
erancapacesdemejorarelalgoritmoquetenan.ValelapenaacotarqueNetflixtieneenestemomentomsde
44millonesdesuscriptoresentodoelmundo(msdeunaArgentinacompleta)quepaganalrededordeocho
dlaresmensualesytienemsde100milttulosentrepelculasyseries.Siunoquisieraverlastodas,tardara
msde68aosparahacerlo.
Recomendar,recomiendacualquiera.Hacerloconprecisinesunatareanomenor.
Hastings(ylagentequetrabajaconl,supongo)tuvoentoncesunaideaextraordinaria:propusohacerun
concursoabiertoalacomunidadtoda(cientficaono).Cualquierpersonaogrupodepersonasquefueracapaz
demejorarenmsdeun10porcientolasprediccionesdeCinematch,recibiraunmillndedlares[1].
Lacompetenciafueanunciadaenoctubredelao2006.Netflixlesofrecialosparticipantesunapequea
porcindesuenormebasededatos,demaneratalqueloscompetidoreslospudieranusarparaentrenarsey
escribirunalgoritmopredictivo.Aesosefectoslesdio100.480.507cuaternasqueinvolucrabanlaopininde
480.189usuariossobre17.770pelculas.Seinscribieronmsde30milequipos.S,loescribootravez:msde
30.000gruposinteresados.
Unavezqueunapersonaoungrupotenaescritounalgoritmo,paraconvenceraNetflixdequeloqueellos
habanescritosuperabaaCinematch,habaotrogrupodedatosqueNetflixtenareservadosparausarloscomo
unexamen.Esteexamenconsistaenlosiguiente:Netflix,enlugardeentregarleslascuaternascompletas,les
daba2.817.131ternas(conlosprimerostreslugaresocupados),perodejabavacoelltimonumerito,quese
reservabaeljurado.Elalgoritmotienequesercapazdegenerarjustamenteesecuartodatoysialcompararlo

conloquehabahechoCinematchlograbamejorarenun10porcientolascalificacionesdeNetflixpasabaa
competirporelmillndedlares.
Comoescribmsarriba,solamentelosmiembrosdeljuradoconocanelconjuntocompletodelas
calificacionesyalosefectosdepreservarelanonimato,todoslosnombresdelosclientes,edades,lugar
geogrficoendondeseencontraban,grupotnico,etc....estabanexcluidos.Deesaforma,losparticipantesdel
concursotenanquebasarsusresultadosennmerosynoencuestionesdetiposocialnipsicolgico.
Unpasoms:llegadoelmomentoenqueungruposuperarael10porcientoqueseproponaNetflix,allmismo
empezabaunacuentaregresivadetreintadas:elrestodelosparticipantestenaunmesexactopara
presentarsusalgoritmos.Sinadiepodasuperarel10porciento,sedeclarabaganadoralequipoqueslohaba
logradoyseleentregabaelmillndedlares.[2]
Lacompetenciacomenzel2deoctubredel2006yseisdasdespus!,ungrupollamadoWXYZConsulting(de
origenchino)mejorlosresultadosdeCinematch...peronoalcanzaronel10porcientosinoqueapenas
rozabanel1porciento.El15deoctubredel2006yaerantreslosgruposquehabanmejoradoaCinematchy
delostreselquemejorperformancelogrfuequienesconsiguieronestar1,06porcientoporarribadelalgoritmo
queusabaNetflix.Comolosresultadoserandinmicosypblicos,aparecaconstantementeunasuertede
tabladeposicionesmostrandoaqudistanciaenporcentajeestabanlasprediccionesdecadaalgoritmocon
respectoalasquesugeraNetflix.
Enjuniodelao2007,msde20.000delos30.000equiposquehabaoriginalmenteseguanparticipandoenla
competencia,provenientesdemsde186pases.Alllegaralsegundoaodelconcurso,solamentetres
equiposlograronserlderesdurantevariosmeses.EnparticularelgrupollamadoBellKor,integradoensu
mayoraporcientficosdeloslaboratoriosAT&T,estuvoalfrentedesdemayodel2007hastaseptiembredel
2008.Luegodedosaosdetrabajo,habacincogruposquemejorabanenmsdeun9porcientoaCinematch:
BellKorinBigChaos,BigChaos,PragmaticTheory,BellKoryGravity.Durantemuchosmeses,parecan
atascados,empantanados.
Allseprodujounvuelcointeresante:variosgruposqueseguancompitiendo,comoenunmaratn,decidieron
unirfuerzasyrepartireldineroencasodeganarlo.Losequipossefueronconsolidandoylasideasempezarona
fluir.Faltabapocoparalameta,perocomosuelesucederenlosjuegosolmpicos,parapoderganarcomolo
haceUsainBolt,esnecesariomejorarunacentsimadesegundo,ysaeslapartemsdifcil.Enoctubredel
2008,ungrupoahorallamadoBigChaos,integradoensumayoraporcientficosaustracos,pasalfrente.A
partirdeesemomento,parecaquetodoquedarareducidoaloqueproducanestosdoscompetidores:
BigChaosyBellKor.
El26dejuniodelao2009,luegodevariasconsolidacionesypasesentreequipos,ungrupodenominado
BellkorsPragmaticChaosllegasuperarelalgoritmodeCinematchenun10,05porciento.Allcomenzotra
historia.
Enprincipio,empezlacuentaregresivade30das.Todoslosquequedabantenantiempohastael26dejulio
deeseao(2009)alas6:42:37PMparapresentarsualgoritmosuperadordel10porcientoparapoderacceder
acompetirconBellkorsporelmillndedlares.Sinollegabaningnotrogrupo,entoncesBellkorssequedara
coneldinero.
Increbleeinesperadamente,el25dejuliodel2009,menosdeundaantesdelcierre,unequipodenominado
ahoraTheEnsemblellegaunamejoradel10,09porcientosobreCinematchytalcomoestabaestipulado,un
dadespus,el26dejulio,Netflixdetuvoelconcursoydioporfinalizadolarecepcindealgoritmos.Apartirde
esemomento,todoquedabareducidoadecidirculdelosdosequipossequedaraconelmillndedlares.
Eljuradosehabareservadoparasmismootrogrupodedatos(1.408.789ternasms)parapoderdecidir.
Finalmente,luegodemuchasdiscusionesporqueparecaquehabahabidounempatetcnico,lagentede
NetflixdecidiqueBellKorsPragmatichabasidoelequipoganador.Desdeelpuntodevistamatemtico,
hubierasidoimposibledistinguirunodeotro.GanBellKorsPragmaticChaosporqueentregaronsusresultados
finalesveinteminutosantesquelohicieralagentedeTheEnsemble.Esosveinteminutosvalieronunmilln
dedlares,dijoHastingsenelmomentodelaentregadelpremio,el21deseptiembredel2009.
Estegrupoestuvointegradoalfinalporsietepersonasentreingenierosencomputacin,programadores,
matemticos,especialistasenestadsticasyhastaunmatemticoexpertoenvideojuegos.Undatocuriosoes
quevariosdeellosseconocieroneldadelaentregadelpremioporquehabantrabajadosinmoversedesu
lugardeorigenydehecho,provenandeAustria,Canad,IsraelylosEstadosUnidos.LagentedeThe
Ensemblefueotrasuertedealianzaglobalyaquelaintegraronmsde30personasdevariospasesy
continentes.
Porsupuestoquelosalgoritmosson,fueronyserntilesparamuchomsquedecidircmorankear

pelculas.Piensequelosdosgrupostuvieronensusmanosmsde100millonesdecalificaciones(ode
notas)yeldesafodepoderpredecircontantaprecisinpuedeseraplicadoahoraendiferentescamposdela
ciencia,especficamentedelasociologa,relacioneshumanasycomerciales.Entodocaso,unadelas
preguntasesencialesquequedaabierta(porsupuesto)eslasiguiente:cunpredecibleeselgustohumano?
Oaumentolaapuesta:aunquefueraposibledepredecirlopersonaporpersona,podralgndauna
computadorasercapazdeaprenderloy/odededucirlo?
Eltrabajoenconjunto,enequipo,hechoporgentequenoseconocihastaelltimomes,sirveparamostrar
tambinlapotenciaquesignificatenerpersonascondistintaformacinpensandoalgocomn.[3]
Paraelfinal,meguardundatocuriossimo(einesperado).Netflixhabalogradoloquequera:mejorarsu
algoritmodeprediccin.Pagelmillndedlaresalosganadores,pero...nuncauselalgoritmo!S,leybien.
Porqu?Porqueeneltiempoquemedientreelanunciodelacompetenciaylaentregadelpremio,la
empresatuvoquereinventarseoredefinirseconlallegadadeloqueseconoceconelnombredestreaming
video.Osea,elgrannegocioahorayanoesenviarDVDalacasadelosclientescomoeraenel2006,sino
queahoraNetflixenvaelmaterialdirectamenteporInternetatravsdesuspropiosservidores,yaunque
parezcamentira,noeslomismodecidirqueunoquiereverunapelculadentrodeunosdasquesitienela
chancedeverlaenelmomento.Noeslomismoanticiparloqueunocreequequerrverendosotresdas
queloqueunobuscacomosatisfaccininstantnea.Perosayaesotrahistoria.Loshumanossomosraros,
no?
[1]Ququieredecirmejorar?Quieredecirque,conlosdatosqueCinematchtena,pudopredecirelnmero
deestrellasqueundeterminadousuariolepondraaciertaspelculas.Despus,larealidadmostrsituvieron
razn...ono.
Netflixlesdabaesosdatosaloscompetidores(sinmostrarleselltimonumerito,eldelnmerodeestrellas)y
despuslestomabaunexamen.Paraellotenatresgruposdedatos:lasprediccionesdeCinematch,las
prediccionesdelalgoritmonuevoylarealidad.
Sielnuevoalgoritmohubierasidocapazdeacertarenmsdeun10porcientolasprediccionesquehaba
hechoCinematchconesegrupodepelculasyusuarios,entonceseseprogramasepodraconsiderarmejorque
elquehabausadoNetflix.
[2]UndatomuyimportanteesqueelgrupoganadornotenaquefirmarleaNetflixuncontratodeexclusividad
porsualgoritmo.Netflixlopodrausarsiaslodecidaperolosganadorespodravenderloaotrasempresas
aquieneslesinteresara.Parecealgotrivial,peroesclaramentealgonomenor:losautoresdelasideas
involucradasydeldesarrollolevendanaNetflixlaoportunidaddeusarlo,perosereservabanelderechode
comercializarloellostambinyseguancomodueosintelectualesdeloquehabangenerado.
[3]Estoseconoceconelnombredesabiduradelamultitudocrowdsourcing,osea,aprovecharlasideasde
muchagentepararesolverunproblema.Buscarlacooperacindegruposgrandesdepersonasparapoder
resolverunproblema.El2dejuniodelao2013aparecienlacontratapadePgina/12unartculoalrespecto
(http://www.pagina12.com.ar/diario/contratapa/1322138020130602.html)quepermitiestimarelpesodeuntoro.
20002015www.pagina12.com.ar | RepblicaArgentina | TodoslosDerechosReservados
SitiodesarrolladoconsoftwarelibreGNU/Linux.