Que es Big Data y que es un Data Scientists?




En su último post Lilian Pierson evoca la pregunta retorica:
Entonces quieres ser un Data Scientist?

Después de esto, elabora en algunos recursos y herramientas que es necesario dominar para poder autodenominarse un Data Scientist.
The Harvard Review también denomino a un Data Scientists como el trabajo mas sexy del siglo 21.

Pero que es en realidad un Data Scientist? Que características los distinguen de los demás científicos, y es mas, la pregunta obligada es: Es un Científico también?
Y la respuesta corta es no, un Data Scientist, o científico de datos, es tan científico como un Medico o un Ingeniero, el enfoque de un Científico de Datos es utilizar herramientas ya existentes para proveer algún tipo de información que los datos puedan proveer.

Estas herramientas, como lo menciona Lilian, pueden variar desde las herramientas practicas y técnicas, como lenguajes de programación, hasta herramientas mas sofisticadas, como lo son técnicas de inteligencia artificial y Machine Learning.
Y a que nos referimos con Big Data?

Para eso, necesitamos hacer un poco de historia, algunos recordaran el boom del Internet y las bases de datos a principios del milenio, todas las compañías querían a un programador que supiera utilizar el bendito SQL, PHP y Apache. Estas herramientas están dedicadas a coleccionar la información de usuarios en Bases de Datos.
Después de pasar los últimos 10 años reuniendo toda la información de sus usuarios, las compañías se dieron cuenta que tenían bases de datos enormes, las cuales tenían información que los podían ayudar a vender mejor sus productos o a mejorar la eficiencia de su servicio.
Que tipo de información podemos obtener de nuestras bases de datos?

Entre algunos ejemplos, podemos obtener el perfil de nuestros clientes y hacer recomendaciones, como lo hace Amazon.com. También podemos usar todos estos datos para personalizar la experiencia en Disneylandia.

Las posibilidades son infinitas!

Mi objetivo personal con este blog, es ofrecer una perspectiva internacional de Big Data, Machine Learning y Data Scientist en México, me interesa que este campo crezca y que se fomente su educación en universidades.

Pueden contactarme a mi Twitter @leonpalafox, donde posteo cosas relacionadas con Machine Learning y Big Data.

Comments

Popular Posts