Archivo por meses: marzo 2009

Top-10 de los algoritmos en Data Mining

Un reciente trabajo publicado a finales del 2007 realiza un estudio de cuáles han sido los 10 algoritmos de Data Mining más exitosos. Según cuentan sus autores, entre los que se encuentran Ross Quinlan -creador de los míticos árboles de decisión ID3 y C4.5- la decisión se llevó a cabo según la opinión de los autores de los artículos premiados y los comités científicos de las conferencias más prestigiosas en Data Mining (IEEE ICDM y KDD), junto con el número de referencias al algoritmo en Google Scholar (mínimo 50).

Y los premiados son…

1. C4.5 (1993)
Quinlan, J. R. 1993. C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers Inc.
Google Scholar Count in October 2006: 6907

2. K-Means (1967)
MacQueen, J. B., Some methods for classification and analysis of multivariate observations, in Proc. 5th Berkeley Symp. Mathematical Statistics and Probability, 1967, pp. 281-297.
Google Scholar Count in October 2006: 1579

3. SVM (1995)
Vapnik, V. N. 1995. The Nature of Statistical Learning Theory. Springer-Verlag New York, Inc.
Google Scholar Count in October 2006: 6441

4. Apriori (1994)
Rakesh Agrawal and Ramakrishnan Srikant. Fast Algorithms for Mining Association Rules. In Proc. of the 20th Int’l Conference on Very Large Databases (VLDB ’94), Santiago, Chile, September 1994.
Google Scholar Count in October 2006: 3639

5. EM (2000)
McLachlan, G. and Peel, D. (2000). Finite Mixture Models. J. Wiley, New York.
Google Scholar Count in October 2006: 848

6. PageRank (1998)
Brin, S. and Page, L. 1998. The anatomy of a large-scale hypertextual Web search engine. In Proceedings of the Seventh international Conference on World Wide Web (WWW-7) (Brisbane, Australia). P. H. Enslow and A. Ellis, Eds. Elsevier Science Publishers B. V., Amsterdam, The Netherlands, 107-117.
Google Shcolar Count: 2558

7. AdaBoost (1997)
Freund, Y. and Schapire, R. E. 1997. A decision-theoretic generalization of on-line learning and an application to boosting. J. Comput. Syst. Sci. 55, 1 (Aug. 1997), 119-139.
Google Scholar Count in October 2006: 1576

8. K Nearest Neighbours (1996)
Hastie, T. and Tibshirani, R. 1996. Discriminant Adaptive Nearest Neighbor Classification. IEEE Trans. Pattern Anal. Mach. Intell. (TPAMI). 18, 6 (Jun. 1996), 607-616.
Google SCholar Count: 183

9. Naive Bayes (??)
Hand, D.J., Yu, K., 2001. Idiot’s Bayes: Not So Stupid After All? Internat. Statist. Rev. 69, 385-398.
Google Scholar Count in October 2006: 51

10. CART (1984)
L. Breiman, J. Friedman, R. Olshen, and C. Stone. Classification and Regression Trees. Wadsworth, Belmont, CA, 1984.
Google Scholar Count in October 2006: 6078

Galicia hace CTRL+Z

Control-Z

En un país partido al medio como es Galicia, el pasado 1 de Marzo ha aparecido un denominador común: todo el mundo se ha visto sorprendido. La campanada que ha dado el Partido Popular ha pillado desprevenidos a los más optimistas y a los más pesimistas. Las encuestas daban que “el PP rozaría la mayoría absoluta”. No ha sido así, la ha superado sobradamente.

Tras la sorpresa, toca reflexionar y pasada la confusión inicial, las opiniones se centran en la búsqueda de las causas que, esto hay que reconocerlo, son todavía en caliente. Actualmente yo me he encontrado con 3 argumentos:

  • Los periódicos hicieron que calasen los escándalos, del despacho y del coche de Touriño.
  • El bipartito no alcanzó el cambio prometido y muchos de los electores que habían dado la oportunidad a las izquierdas se han visto defraudados (queríamos un Obama gallego).
  • El miedo a la crisis, el paro, el bipartito.

Yo soy de los de la tercera causa, al menos, creo que ha sido la decisiva.

Es cierto que los escándalos es propaganda fácil y que la masa es sensible a este tipo de distracciones, pero no a última hora, estando además la cosa en estos temas bastante igualada, tras la destitución del cabeza de lista del PP por Ourense y la sombra de la corrupción que se cierne sobre el partido a nivel nacional.

El problema de los electores defraudados haría, como mucho, aparecer la abstención y, sin embargo, ha habido una participación histórica. No creo que una persona que no note el cambio se levante de su butaca enfadado y vaya a pedir el cambio a los de antes. Es más verosímil que se quede en casa defraudado.

La tercera, la tercera sí. No es posible que un gobierno dure únicamente cuatro años sin haber hecho enormes descalabros (que los medios afines vengan a última hora a salvanos de los ladrones no cuela). Lo que ha pasado es que Galicia ha decidido hacer ctrl+z, arrastrada por el miedo, por la idea de que un bipartito es un experimento, un atrevimiento, un error. Se sabe que cuando vienen las vacas flacas hay que ponerse serios y dejar de jugar. La realidad de que la crisis va en aumento, ha hecho que un electorado, el gallego, donde están los más ahorradores (austeros), hayan cambiado ideales por vaquiñas, y cedan el poder al PP, el partido que ahorra y que nos tendrá el dinerito a buen recaudo. Ha calado en ese 5% que decide si el gobierno es azul o rojo. Aunque soy de la idea de que las elecciones no se ganan, sino que se pierden, en este caso nadie ganó ni nadie perdió. Galicia escogió el partido que tradicionalmente encarna el rol que cree adecuado a la situación actual. Obviamente, que un Gobierno llene las arcas recortando lo social no debe ser la mejor receta, pero eso son cosas mías.

Como nota final, decir que yo he tenido la oportunidad de presidir la mesa electoral de Coles, donde el PSdeG-PSOE arrasó, siendo la primera fuerza. No le podré por lo tanto pedir explicaciones a mis vecinos. Eso está bien….