jueves, 19 de marzo de 2015

(Elefante+ Ratón)/2=Vaca (una cuestión de promedios)

Esta es una cuestión muy curiosa pero interesante que sacan a relucir en el libro  Probably Not: Future Prediction Using Probability and Statistical Inference y es la siguiente :

"Puedes saber que el promedio entre un ratón y un elefante es una vaca,pero estudiar la vaca no te va ayudar a saber mas ni sobre elefantes ni sobre los ratones"

Es una cuestión bien interesante y la moraleja de la historia  es que cuando hay medidas que difieren mucho la una de la otra (desviación estándar alta), entonces sabemos que el promedio no nos es muy util.

Fin 




viernes, 6 de marzo de 2015

La estadística detrás de Duolingo (aproximación)

Duolingo se ha convertido  en una de las paginas mas populares para aprender idiomas y en parte su éxito lo debe a la buena capacidad que tiene el programa  para detectar lo que  personas que no hablan el idioma intentan decir  y calificarlo como bueno malo o regular.

Para poder lograr lo anterior el programa Duolingo debe saber procesar los datos de personas que no son hablantes nativos del idioma que están aprendiendo.Entonces por ejemplo para el ingles Duolingo no debe procesar la voz de la persona cuando habla al igual que hablara un nativo si no que debe diseñar un programa que permita reconocer cuando quien le habla es una persona proveniente de China o de Colombia la cual tendría un acento bastante diferente.

Esta habilidad para reconocer el acento de personas no nativas es también necesaria para los software de traducción los cuales deben identificar la palabra a pesar de que este en un acento diferente. Es también necesaria cuando hay ruidos externos como un ventilador o trafico.

Desde el punto de vista estadístico cuando una persona  intenta hablar un idioma diferente a su idioma nativo debe considerarse como una desviación al estándar, pues lo que diga se alejara de la media que seria la pronunciación perfecta.

Cunado un software debe lidiar con desviación estándar producida por una persona que no es un hablante nativo debe utilizar primero el método del modelo oculto de markov para identificar y reconocer la voz y posteriormente debe hacer una clasificación por el  método  del K-nearest neighborg (el vecino mas cercano).


Paso 1. El modelo oculto de Markov.

Este método es una extensión de las cadenas de Markov pero a diferencia de las cadenas de Markov no busca la aplicación de eventos dependientes sino independientes y es el mas usado para el reconocimiento de voz.El reconocimiento de voz es un evento independiente porque lo que se diga al principio no afecta a lo que se diga después.

Paso 2. La clasificiacion por le K-nearest Neighbor.

Cuando el programa de reconocimiento de voz usa el método de clasificación del K-nearest neighbor debe hacer la comparación de lo que se le dijo al sistema en contraste con una base de datos .Normalmente una base de datos  de este tipo,esta compuesta por 100 personas que pronunciaron la palabra en cuestión. Dentro de ese grupo de personas deben encontrarse individuos de diferentes grupos de acentos extranjeros ademas de la pronunciación hecha por expertos.







viernes, 27 de febrero de 2015

Como discriminar con los precios???

Al escuchar la palabra discriminar nos vienen a la mente no precisamente ideas muy agradables; sin embargo, la "discriminación de precios" o llamemoslo mejor  segmentación de precios, puede resultar en un trato de doble ganancia en el  que no solo beneficia a la empresa si no también al cliente .

Un caso no muy conocido de empresas que fallaron en el intento de realizar una discriminación de precios es el de  Coca Cola.En algún momento el jefe ejecutivo de la compañía anuncio una campaña con maquinas dispensadoras con  sensores de temperaturas y que cobrarían mas cara la bebida entre mas calor hubiera.La indignación de los clientes de Coca Cola no se hizo esperar y la empresa no tuvo de otra mas que retractarse de la idea.

Mucha gente conoce el oscuro caso de Amazon , la compañía  intento cargar precios  individualizados a sus clientes "sin que estos  lo supieran" lo que termino causando indignación y daño en la imagen de la compañía. A mi parecer las fallas de Amazon pueden resumirse en los siguientes dos asteriscos:


*Subestimar al cliente a no anunciar las diferencias de precio: El cliente de hoy en día es un cliente mas que informado  y super inteligente, no se le puede hacer cargos de diferentes precios y esperar que estos no se den cuenta,este  fué el error de Amazon.

*No tener razones de peso para justificar las diferencias de precio: La estrategia  cargaba un precio mas bajo si era primera ves que se logeaba en la web de Amazon,esto en doble sentido causó daño pues se creaban cuentas innecesarias para obtener descuentos y los viejos clientes de la compañía se sintieron menospreciados por no poder acceder a los beneficios que si tenían los nuevos clientes.




¿CUAL HUBIERA SIDO UNA MEJOR ESTRATEGIA PARA DISCRIMINAR PRECIOS?

Como empresa siempre se debe pensar primero en el cliente sin dejar de lado que se debe buscar las ganancias que permitan la supervivencia de la empresa claro esta.

Es por ello que la mejor estrategia  es siempre que haya una TRATO JUSTO entre cliente y empresa

Primero que todo anunciar que se van a dar estas preferencias de precio  es de mucha ayuda para evitar  malos entendidos con los clientes

Dar razones de peso para los cambios de precio ,si el libro sale antes estoy seguro que hasta el doble pagarían algunos,si de pronto se compra algo en cierto horario... son estrategias mas justas y que son beneficiosas tanto para el cliente como para le empresa.

sábado, 14 de febrero de 2015

La habilidad que todo el mundo debería aprender

En una época en la que el manejo de datos  y donde el data mining y la era del Big Data ya esta a la vuelta de la esquina,uno se pregunta  ¿cual sera esa habilidad, que será la panacea para todos los problemas ,que le servirá a uno para ser empleable al mismo tiempo que sera útil si uno quiere entrar en la corriente del emprendimiento?

Resulta que es muy difícil llamar esa habilidad, un lenguaje de programación especifico, antes se creía que R era lo ultimo en guaracha para el manejo de datos y entonces aparece Python...antes se creía que Haddop era el indicado para almacenar Big data y ya hoy hasta Amazon ofrece esos servicios....¿entonces en un mundo tan cambiante que es lo que realmente deberíamos aprender?


Lo crean o no la respuesta realmente existe, se trata de adquirir la habilidad de SOLUCIONAR PROBLEMAS .Si , así como suena, la habilidad de solucionar problemas puede ser la solución a todos sus problemas.


Pero donde se prende esta habilidad????

Pues me temo que aunque halla  libros de solución de problemas, nada es mejor que convertirse en un necio, si en un necio .No se trata de aprender los lenguajes,los programas o las técnicas mas sofisticadas,por que lo que hoy es lo mejor mañana ya quedara obsoleto.


Como ser un necio????

Es muy sencillo, se trata de no ser una esponja....las esponjas solo absorben y no producen nada,ser necio se trata de utilizar la herramienta que mas fácil se te haga de utilizar...no importa si no es la herramienta de moda.

Se trata de HACER ,ponte todos los días un problema bien pequeño que sepas que puedes solucionar en una hora o dos . Busca bases de datos publicas y trata de encontrar patrones en esas bases de datos.
Que tal si de ser necio,sale el autor  la proxima gran aplicacion ??? o si de ser necio poco a poco terminas convirtiéndote en un guru solucionador de problemas???

Este articulo es inspirado en el articulo "The Only Skill you Should be Concerned With" http://www.datasciencecentral.com/profiles/blogs/the-only-skill-you-should-be-concerned-with


ryanlerch-thinkingboy-outline in clipart open library

viernes, 6 de febrero de 2015

Mediciones 100% exactas solo existen en cuentos de hadas

Había una vez el  rey  de la  fabrica de ladrillos y que quería  saber cual es el nivel de resistencia de estos ladrillos.

Si lo que se quisiera es obtener una medición 100% exacta de cual es la resistencia de estos ladrillos,entonces la solución seria probar uno y cada uno de los ladrillos producidos en la fabrica  ¿resultaría rentable esto ?

Es por ello que se hace necesario la toma de muestras al alzar a la hora de realizar una medición.

Uno de los problemas que pueden presentarse con la toma de muestras  es que estas lleguen  a ser muy pequeñas,pero personalmente no creo que sea un problema.No es problema siempre y cuando la muestra represente al  menos  parte de lo que vamos a medir.Como decimos en el titulo: las mediciones nunca, nunca son 100% exactas.


Algo mas que se debe tener en cuenta al tomar una muestra, es que en ocaciones puede ocurrir lo que se conoce como error de sesgo ,en donde a pesar de escoger una muestra que es aparentemente aleatoria,por cuestiones del azar la muestra puede estar inclinada hacia cierto valor.


La moraleja  del cuento, es que las mediciones 100% exactas solo existen en cuentos de hadas y que  una muestra vale mas que mil mediciones grandes pero al mismo tiempo debemos tener mucho cuidado de que este muestra realmente corresponda a un conjunto aleatorio y que sea significativa en  comparación al total de elementos que vamos a medir.

Fin

Image by Amilo Clip Art




Imagen by fabiovaleggia in clipart

miércoles, 4 de febrero de 2015

Es el email Marketing una estrategia valida en estos días ????

Reflexionando acerca de como en el mundo del marketing y los negocios ,lo que hoy fue la  herramienta ideal quizás mañana ya hoy no lo sea.

Con la aparición del e-mail las campañas de marketing basadas en estos medios apuntaban a ser una mina de oro y en realidad lo fueron,ya que realmente permitían generar una segmentación de clientes efectiva y un costo bastante bajo...la pregunta que queda en el aire es si aun son lo suficientemente efectivas.

Estamos en una época en la que con tan solo un clic la gente puede eliminar cualquier clase de  Spam o "correo basura"  y la gente cada día es mas precavida y alarmada con los correos que recibe, debido a la proliferación de estos correos basura.De acuerdo al Message Anti-Abuse Working Group  la proliferación de este tipo de mensajes alcanzó oscilaba en el 2010 entre el 80 y 90% del total de correos en la red.

Entonces seguirá siendo efectivo el marketing por correo electronico? para mi personalmente , la empresa debe dejar de ser quien envié los correos ;es el mismo cliente es quien debe estar interesado en recibir este tipo de información.

Los newsfeed  o las suscripcciones en las que es el mismo usuario o cliente quien pide recibir la información corresponden a alternativas mas viables en las circunstancias de estos días.


martes, 4 de noviembre de 2014

Los casinos que predicen cuanto dolor aguantará tu bolsillo

En la era del análisis  de datos con fines económicos , algunos casinos han utilizado sofisticados métodos estadísticos para mejorar sus servicios.

 El Casino  Harrah's de las Vegas ha sido citado por Ayres en su libro Supercrunchers como un ejemplo interesante.El casino ha descubierto que puede predecir a través de la información que recolecta de su tarjeta de cliente fiel, cual es el monto que X persona estará dispuesto  apostar sin sentirse totalmente dolido al punto de que no quiera volver a a apostar en casinos. Este monto es llamado como "EL PUNTO DE DOLOR" y para el caso del casino  es la  máxima cantidad que una persona esta dispuesta a perder apostando, antes de sentirse totalmente decepcionado de la actividad de apostar en si.

Entonces por ejemplo, cada vez que alguien esta en una maquina tragamonedas y de acuerdo a los datos que arroja su tarjeta esta a punto de alcanzar el "PUNTO DE DOLOR" el casino envía personalmente  a uno de sus trabajadores a que invite a esta  persona a una cena gratis en el restaurante del casino y a que olvide el hecho de que hasta el momento había tenido una "mala racha apostando".


Imagen tomada de scientificamerican.com