Seeds Data Set Analysis.pptx
- Количество слайдов: 16
Seeds Data Set Analysis Баженова О. , 12 маг кл
Seeds Data Set http: //archive. ics. uci. edu/ml/datasets/seeds Number of Instances: 210 Number of Attributes: 7 The examined group comprised kernels belonging to three different varieties of wheat: Kama, Rosa and Canadian, 70 elements each, randomly selected for the experiment. High quality visualization of the internal kernel structure was detected using a soft X-ray technique. It is non-destructive and considerably cheaper than other more sophisticated imaging techniques like scanning microscopy or laser technology. The images were recorded on 13 x 18 cm X-ray KODAK plates. Studies were conducted using combine harvested wheat grain originating from experimental fields, explored at the Institute of Agrophysics of the Polish Academy of Sciences in Lublin. The data set can be used for the tasks of classification and cluster analysis.
Seeds Data Set Параметры объектов: 1. площадь поверхности A, 2. периметр P, 3. компактность C = 4*pi*A/P^2, 4. длина ядра, 5. ширина ядра, 6. коэффициент ассиметрии 7. длина канавки. + параметр принадлежности к классу: Kama, Rosa или Canadian
Матрица корреляции площадь поверхно сти периметр компактно длина сть ядра ширина ядра коэффици длина ент канавки ассиметри и площадь поверхност и периметр 1 0, 99434 0, 60828 0, 94998 0, 97077 -0, 22957 0, 86369 0, 99434 1 0, 52924 0, 97242 0, 94482 -0, 21734 0, 89078 компактнос ть длина ядра 0, 60828 0, 52924 1 0, 36791 0, 761634 -0, 33147 0, 22682 0, 94998 0, 97242 0, 36791 1 0, 86041 -0, 17156 0, 93280 ширина ядра 0, 97077 0, 94482 0, 76163 0, 86041 1 -0, 25803 0, 74913 коэффицие нт ассиметрии -0, 22957 -0, 21734 -0, 33147 -0, 17156 -0, 25803 1 -0, 01107 длина канавки 0, 86369 0, 89078 0, 93280 0, 74913 -0, 01107 1 0, 22682
Матрица корреляции площадь поверхно сти периметр компактно длина сть ядра ширина ядра коэффици длина ент канавки ассиметри и площадь поверхност и периметр 1 0, 99434 0, 60828 0, 94998 0, 97077 -0, 22957 0, 86369 0, 99434 1 0, 52924 0, 97242 0, 94482 -0, 21734 0, 89078 компактнос ть длина ядра 0, 60828 0, 52924 1 0, 36791 0, 761634 -0, 33147 0, 22682 0, 94998 0, 97242 0, 36791 1 0, 86041 -0, 17156 0, 93280 ширина ядра 0, 97077 0, 94482 0, 76163 0, 86041 1 -0, 25803 0, 74913 коэффицие нт ассиметрии -0, 22957 -0, 21734 -0, 33147 -0, 17156 -0, 25803 1 -0, 01107 длина канавки 0, 86369 0, 89078 0, 93280 0, 74913 -0, 01107 1 0, 22682
Матрица корреляции площадь поверхно сти периметр компактно длина сть ядра ширина ядра коэффици длина ент канавки ассиметри и площадь поверхност и периметр 1 0, 99434 0, 60828 0, 94998 0, 97077 -0, 22957 0, 86369 0, 99434 1 0, 52924 0, 97242 0, 94482 -0, 21734 0, 89078 компактнос ть длина ядра 0, 60828 0, 52924 1 0, 36791 0, 761634 -0, 33147 0, 22682 0, 94998 0, 97242 0, 36791 1 0, 86041 -0, 17156 0, 93280 ширина ядра 0, 97077 0, 94482 0, 76163 0, 86041 1 -0, 25803 0, 74913 коэффицие нт ассиметрии -0, 22957 -0, 21734 -0, 33147 -0, 17156 -0, 25803 1 -0, 01107 длина канавки 0, 86369 0, 89078 0, 93280 0, 74913 -0, 01107 1 0, 22682
Матрица корреляции площадь поверхно сти периметр компактно длина сть ядра ширина ядра коэффици длина ент канавки ассиметри и площадь поверхност и периметр 1 0, 99434 0, 60828 0, 94998 0, 97077 -0, 22957 0, 86369 0, 99434 1 0, 52924 0, 97242 0, 94482 -0, 21734 0, 89078 компактнос ть длина ядра 0, 60828 0, 52924 1 0, 36791 0, 761634 -0, 33147 0, 22682 0, 94998 0, 97242 0, 36791 1 0, 86041 -0, 17156 0, 93280 ширина ядра 0, 97077 0, 94482 0, 76163 0, 86041 1 -0, 25803 0, 74913 коэффицие нт ассиметрии -0, 22957 -0, 21734 -0, 33147 -0, 17156 -0, 25803 1 -0, 01107 длина канавки 0, 86369 0, 89078 0, 93280 0, 74913 -0, 01107 1 0, 22682
Матрица корреляции компактност длина ядра ь ширина ядра коэффициен длина т канавки ассиметрии компактность 1 0, 36791514 0, 76163451 -0, 33147087 0, 226824821 длина ядра 0, 36791514 1 0, 86041493 -0, 17156242 0, 932806085 ширина ядра 0, 76163451 0, 86041493 1 -0, 25803654 0, 749131468 коэффициент ассиметрии -0, 3314708 -0, 1715624 -0, 25803654 1 -0, 011079019 длина канавки 0, 22682482 0, 93280608 0, 74913146 -0, 01107901 1
Матрица корреляции компактность длина ядра*ширина ядра коэффициент ассиметрии длина канавки компактность 1 0, 61113051 -0, 33147087 0, 22682482 длина ядра*ширина ядра 0, 61113051 1 -0, 21916676 0, 86206709 коэффициент ассиметрии -0, 33147087 -0, 21916676 1 -0, 01107901 длина канавки 0, 22682482 0, 86206709 -0, 01107901 1
Кластеризация. K-means 2 класса Эвклидово расстояние
Кластеризация. K-means 3 класса Эвклидово Расстояние Не совпало распределение 28 объектов по классам
Классификация. Линейный дискриминант Фишера. Принимаются гипотезы: Классы распределены по нормальному закону Матрицы ковариаций классов равны в случае с двумя классами в двумерном признаковом пространстве разделяющей поверхностью будет прямая если классов больше двух, то разделяющая поверхность будет кусочно-линейной
Классификация. Линейный дискриминант Фишера.
Классификация. Линейный дискриминант Фишера.
Классификация. Линейный дискриминант Фишера. Classification Function Coefficients периметр площадь компактность коэфф_ассиметр длина_канавки Длина ядра*шир. ядра (Constant) Класс 1, 00 -2735, 252 5384, 096 44594, 990 -3, 675 222, 312 105, 212 98, 875 -40003, 124 2, 00 -2715, 475 5358, 270 44499, 357 -2, 734 244, 109 102, 510 -39844, 509 3, 00 -2713, 495 5336, 180 44303, 806 -2, 214 239, 809 -39426, 950
Классификация. Линейный дискриминант Фишера. Classification Results(a) Predicted Group Membership 1, 00 2, 00 3, 00 Original Count 1, 00 66 1 3 2, 00 2 68 0 3, 00 2 0 68 % 1, 00 94, 3 1, 4 4, 3 2, 00 2, 9 97, 1 , 0 3, 00 2, 9 , 0 97, 1 (a) 96, 2% of original grouped cases correctly classified. Класс Total 70 70 70 100, 0
Seeds Data Set Analysis.pptx