Determination of genetic structure of germplasm collections: Are traditional hierarchical clustering methods appropriate for genetic marker data?

We studied the performance of traditional hierarchical clustering techniques using molecular marker data. In this study, we showed that the cophenetic correlation coefficient is directly related to subgroup differentiation and can thus be used as an indicator of the presence of genetically distinct subgroups in germplasm collections. Whereas UPGMA performed well in preserving distances between accessions, Ward excelled in recovering groups. Our results also showed a close similarity between clusters obtained by Ward and by model-based cluster method (STRUCTURE). Traditional cluster analysis can provide an easy and effective way of determining structure in germplasm collections using molecular marker data.
Nous avons étudié la performance des techniques traditionnelles de classification hiérarchique en utilisant des données de marqueurs moléculaires. Dans cette étude, nous avons montré que le coefficient de corrélation cophénétique est directement lié à la différenciation des sous-groupes et peut donc être utilisé comme un indicateur de la présence de sous-groupes génétiquement distincts dans les collections du matériel génétique. Tandis qu’UPGMA a donné de bons résultats dans la préservation de distances entre les accessions, Ward a excellé dans la récupération des groupes. Nos résultats ont également montré une similitude étroite entre les groupes obtenue par Ward et par la méthode de groupe basée sur un modèle (STRUCTURE). L’analyse traditionnelle de groupes peut constituer un moyen facile et efficace de détermination de la structure dans les collections du matériel génétique à partir des données de marqueurs moléculaires.
East Africa
