谦虚、渴望、脚踏实地、一步步地学习,这样就可以避免成为浮躁、贪婪的你。

世界杯比赛规则与数据聚类

上一篇 / 下一篇  2010-06-28 11:33:04 / 个人分类:科研江湖

文章来源
  • 文章来源:转载
应该有很多朋友像我一样,这段时间可能要花些时间看世界杯。有些博友还会发些心得。俺就从数据聚类的角度,来对世界杯比赛规则进行“重认识”一下,呵呵。

       先交代下基础背景知识,内行直接跳过本段,呵呵。数据聚类包括划分聚类、层次聚类等、基于模型的聚类等基本模式。划分聚类中最经典的方法就是K-均值聚 类,需要事先给定初始点和聚类类目数。层次聚类中最常用的是HAC聚类,事先两两求出相似度,将最相似的或者最不相似的连接起来呢,然后再求次相似的,一 直到所有点的都被连接为止。近年来,基于模型的聚类越来越火,可以将基于竞争的聚类方法划入这个类别。07年Frey提出的AP聚类方法更是被大量引用。

      再结合数据聚类,说下世界杯比赛规则。分析测试百科网~2`lkl.Wh
 
$\\O H0z$MBl0     1. 首先,小组划分,是做基于约束的划分聚类:    

      
A/r Lk'rv?&M vL0      (1) 经过预选赛入围的32只球队,被划分为4个档次,其中第一档中的8支球队作为种子队 (32个数据,8个聚类类目,将以往世界排名作为权重,选择初始聚类中心,当然东道主特殊,直接作为种子);

      (2) 剩余球队按照其档次和所在洲的约束,进行抽签划分到相应的小组中(24个数据按照一定的规则约束后,随机分配到每个聚类中心的所在组中);分析测试百科网Ca ?!~2K6o!c F2p$m
 
*n6M ]3|f$[[0     2. 然后,正式比赛,是做层次聚类

      (1) 小组确定后,每组四个对,两两求“相似度”,就是说两两打一场,胜的权重给3,平了给1,输了给0,每小组的6场赛事结束后,得到每个队的总体权重(当然 了,有可能还要考虑净胜球,相互战绩啥的),那么小组中排名前2的队作为连接点参与下一个层次的聚类。(这里,两两求相似度,完全是基于竞争的,整个比赛 阶段基于竞争的层次聚类);分析测试百科网cZ(o,FI-Pj6h
   分析测试百科网!h,m2^)w9z\
      (2) 淘汰赛阶段,直接竞争,做二分聚类,胜的参加下一轮聚类;分析测试百科网G"ol)o6zr
 分析测试百科网7ehI GJ gE(J`Y
      (3) 直到最后两支最牛的打决赛,冠军队成为了根节点。


n!D(c7Y2r"L8R+f$V*D!o1T0     3. 聚类结束,参数重新分配,准备4年后的聚类,呵呵。

     分析测试百科网6rKk}wq
     所以,世界杯做了大量的约束,注意比赛的观赏性,用了比较简单公平的方法,在较短时间内确定聚类层次关系。

     如果是动物界打比赛,可能又是另一个场景,完全自由随机的打,最强的完全有可能因为体力不支,提早被淘汰而成不了冠军。

    以上仅供娱乐参考,推理和比喻不当地方,请博友指出,谢谢。   分析测试百科网L$f"| B+hA"CjV({.w
分析测试百科网~ QeDk~#V6g
分析测试百科网 | U+q+IN"O|z&]z
分析测试百科网%rwcX*P1ZL
分析测试百科网:orL'o!I@-cL/?
仪器分析分析测试百科网X%}7|j0d
分析测试百科网n7S-L4z e~:C9X*z*O

TAG: 世界杯 比赛规则 数据聚类

 

评分:0

我来说两句

显示全部

:loveliness: :handshake :victory: :funk: :time: :kiss: :call: :hug: :lol :'( :Q :L ;P :$ :P :o :@ :D :( :)

Open Toolbar