информационный портал по вопросам биомедицинской инженерии

Сейчас на сайте 0 пользователей и 0 гостей.

Вход в систему

аватар: Цепелёва Анастасия Николаевна
Введение

StatSoft предлагает уникальные технологии анализа и добычи данных, в частности, методы Data Mining. Эти методы реализованы в удобном интерфейсе и позволяют даже начинающему пользователю провести исследования. В данной статье проводится обзор методов Data Mining, в числе которых реализованы методы Нейронных сетей, Обобщенного кластерного анализа, Правил связи, Деревьев классификации и регрессии, Интерактивных деревьев, Растущих деревьев, Обобщенных аддитивных моделей, МАР-сплайнов, Процедур машинного обучения и т.д. В первой части можно увидеть некоторые диалоговые окна программы STATISTICA Data Miner. Во второй части статьи приводятся впечатляющие результаты работы некоторых методов Data Mining в одной реальной медицинской задаче.
Часть I. Русский интерфейс STATISTICA Data Miner

Обычно работа начинается с загрузки файла данных и выбора метода анализа данных.

Шаг 1. Загрузка файла данных.

Программа STATISTICA встречает Вас диалоговым окном приглашения, в котором можно либо указать одно из типичных действий перед началом работы, либо выбрать один из последних файлов, с которым производилась работа в программе. 

После нажатия OK в вышеприведенном диалоге, мы перейдем в окно открытия файлов:

Отметим, что программа STATISTICA "понимает" все распространенные форматы файлов данных, среди которых файлы xls, txt, htm, xml, rtf и многие другие

После открытия файла на экране отобразится таблица данных следующего вида:

После этого можно выбирать методы анализа данных.

Шаг 2. Выбор метода анализа данных

Перейти к выбору метода анализа можно несколькими способами: либо через пункт главного меню Анализ, либо нажав кнопку в левом нижнем углу рабочей области STATISTICA, либо нажав кнопку, соответствующую конкретному методу, на Панели инструментов.

После выбора строки с названием метода анализа появляется соответствующая ему стартовая панель.

Шаг 3. Задание параметров анализа

Шаг 3.1. Выбор конкретного метода и интерфейса анализа.

В стартовой панели анализа выбирается одна из модификаций метода,
либо модификация метода и интерфейс настройки и проведения анализа (от Мастера анализа - максимальное число подсказок и настроек по умолчанию, до Редактора кода - режим программирования)

Шаг 3.2. Выбор переменных.

Следующий общий шаг анализа - выбор переменных (зависимых/независимых, непрерывных/категориальных).
Шаг 3.3. Настройка параметров анализа

Начинающий пользователь может задать параметры, приведенные на вкладке Быстрый, а остальные можно оставить по умолчанию.
Продвинутые аналитики могут оценить всю гибкость настроек, воспользовавшись настройками на вкладке Дополнительно и некоторых специальных вкладках.

Комментарии

Отправить комментарий

Содержание этого поля является приватным и не предназначено к показу.
  • Доступны HTML теги: <a> <em> <strong> <cite> <code> <ul> <ol> <li> <dl> <dt> <dd> <img> <table> <td> <tr> <hr> <div> <span> <h1> <h2> <h3> <h4> <h5> <h6> <p> <pre> <adress> <center>
  • Строки и параграфы переносятся автоматически.

Подробнее о форматировании

8 + 11 =
Решите эту простую математическую задачу и введите результат. Например, для 1+3, введите 4.

Комментарии