Формат данных
Для использования информационной системы необходимо подготовить данные в виде файлов Microsoft Excel (xls или xlsx) или CSV (разделитель полей: ";", разделитель целой и дробной части: ".", кодировка UTF-8 с BOM). Формат зависит от назначения файла:
- для обучения;
- для прогнозирования (опционально).
Формат файла для обучения
Первая строка содержит названия столбцов (и не обрабатывается). Вторая и последующие строки содержат данные (один объект на строке).
Первый столбец содержит имя объекта (как правило, это формула соединения).
Второй столбец содержит значение целевой функции (вещественное число).
Третий и последующие столбцы содержат признаковое описание объекта, трактуемое как вектор вещественных чисел. Длина вектора для всех объектов должа быть одинакова.
Формат файла для прогнозирования
Первая строка содержит названия столбцов (и не обрабатывается).
Второй столбец пуст (значения целевой функции неизвестны).
Третий и последующие столбцы содержат признаковое описание объекта, трактуемое как вектор вещественных чисел. Длина вектора для всех объектов должа быть одинакова и совпадать с длиной вектора в обучаюей выборке. Порядок следования свойств в векторе - как в обучающей выборке.