Сейчас на сайте 0 пользователей и 0 гостей.
|
StatSoft предлагает уникальные технологии анализа и добычи данных, в частности, методы Data Mining. Эти методы реализованы в удобном интерфейсе и позволяют даже начинающему пользователю провести исследования. В данной статье проводится обзор методов Data Mining, в числе которых реализованы методы Нейронных сетей, Обобщенного кластерного анализа, Правил связи, Деревьев классификации и регрессии, Интерактивных деревьев, Растущих деревьев, Обобщенных аддитивных моделей, МАР-сплайнов, Процедур машинного обучения и т.д. В первой части можно увидеть некоторые диалоговые окна программы STATISTICA Data Miner. Во второй части статьи приводятся впечатляющие результаты работы некоторых методов Data Mining в одной реальной медицинской задаче.
Часть I. Русский интерфейс STATISTICA Data Miner
Обычно работа начинается с загрузки файла данных и выбора метода анализа данных.
Шаг 1. Загрузка файла данных.
Программа STATISTICA встречает Вас диалоговым окном приглашения, в котором можно либо указать одно из типичных действий перед началом работы, либо выбрать один из последних файлов, с которым производилась работа в программе.
После нажатия OK в вышеприведенном диалоге, мы перейдем в окно открытия файлов:
Отметим, что программа STATISTICA "понимает" все распространенные форматы файлов данных, среди которых файлы xls, txt, htm, xml, rtf и многие другие
После открытия файла на экране отобразится таблица данных следующего вида:
После этого можно выбирать методы анализа данных.
Шаг 2. Выбор метода анализа данных
Перейти к выбору метода анализа можно несколькими способами: либо через пункт главного меню Анализ, либо нажав кнопку в левом нижнем углу рабочей области STATISTICA, либо нажав кнопку, соответствующую конкретному методу, на Панели инструментов.
После выбора строки с названием метода анализа появляется соответствующая ему стартовая панель.
Шаг 3. Задание параметров анализа
Шаг 3.1. Выбор конкретного метода и интерфейса анализа.
В стартовой панели анализа выбирается одна из модификаций метода,
либо модификация метода и интерфейс настройки и проведения анализа (от Мастера анализа - максимальное число подсказок и настроек по умолчанию, до Редактора кода - режим программирования)
Шаг 3.2. Выбор переменных.
Следующий общий шаг анализа - выбор переменных (зависимых/независимых, непрерывных/категориальных).
Шаг 3.3. Настройка параметров анализа
Начинающий пользователь может задать параметры, приведенные на вкладке Быстрый, а остальные можно оставить по умолчанию.
Продвинутые аналитики могут оценить всю гибкость настроек, воспользовавшись настройками на вкладке Дополнительно и некоторых специальных вкладках.
Комментарии
Отправить комментарий