Импорт из текстовых файлов с разделителями.





Структурированный текстовый файл с разделителями – один из самых распространенных форматов хранения данных. Такой файл представляет собой обычный текстовый файл, столбцы данных в котором разделены однотипными символами-разделителями, например символами табуляции, пробела, точки с запятой и т.д.

 

Процесс импорта данных из текстового с разделителями файла в мастере импорта (категория Текстовой файл (Direct))содержит следующие шаги:

· указание имени файла;

· настройка параметров импорта;

· настройка импортируемых полей;

· запуск процесса импорта;

· выбор способа визуализации;

· задание сведений об узле.

 

 

Имеется возможность использовать как абсолютные, так и относительные пути для файлов. Они указываются относительно текущей директории Deductor. При открытии Deductor текущей директорией является директория файла проекта. Поэтому, если файл проекта и текстовые файлы располагаются в одной папке, то использование относительных путей в Мастере импорта позволит не перенастраивать узлы импорта при изменении расположения папки на жестком диске.

 

 

 

 

Откроем файл Anketa.

 

Здесь также доступны настройки:

· Начать импорт со строки– номер строки, начиная с которой будет делаться импорт данных из файла.

· флаг Первая строка является заголовком– установка флажка означает, что узел будет импортировать данные с учетом того, что все записи первой строки являются заголовками столбцов.

· Кодировка– ANSI (Windows) или ANCII (MS DOS).

 

На шаге Настройка параметров импортанужно настроить параметры импорта данных из текстового файла, так как существует несколько форматов структурированных текстовых файлов.

 

Доступные опции:

· переключатель Формат исходных данных, который определяет символ-разделитель в файле (например: символ табуляции, пробел, запятая). Разделитель чаще всего присутствует. Если же нет, то нужно выбрать переключатель Фиксированной ширины (поля имеют заданную ширину), а позже установить ширину каждого поля.

· Ограничитель с трок– при задании данного параметра необходимо указать, какой именно ограничитель строкового значения нужно использовать при импорте данных из текстового файла. Обычно таким ограничителем является символ двойной кавычки ".

· Разделитель дробной и целой части числа– при задании данного параметра необходимо указать символ, разделяющий дробную и целую части в числовых значениях, содержащихся в файле.

· Разделитель компонентов даты– указывается символ, разделяющий компоненты даты в соответствующих значениях, содержащихся в файле.

· Разделитель компонентов времени –указывается символ, разделяющий компоненты времени в соответствующих значениях, содержащихся в файле.

· Форматы Даты/Времени –указываются форматы даты/времени, используемые в импортируемом файле.

· Представление значений –опция для полей логического типа, которое может принимать одно из трех значений– истина (true), ложь (false) и пустое значение (null).Определяет регламент записи в эти значения. Так, при настройках по умолчанию для любого логического поля значениеДабудет восприниматься какистина, Нет –какложь.

 

!!! В качестве разделителей, представлений значений и форматов по умолчанию всегда предлагаются системные настройки операционной системы. Поэтому при импорте необходимообращать внимание на их соответствие формату в импортируемом текстовом файле. !!!

Следующее окно мастера зависит от установленного переключателя в флажке Форматисходных данных. Если был выбран формат С разделителями, то появится вкладка,на которой нужно явно указать символ-разделитель (по умолчанию – табуляция). Здесь женаходится флаг Считать последовательные разделители одним– в случаепоследовательно идущих символов-разделителей они будут восприниматься за один. Такоебывает, например, когда символом-разделителем выступают несколько пробелов.Предпросмотр текстового файла в виде таблицы внизу (загружаются только первые 10 строк)позволяет убедиться в корректности выбора настроек импорта даже не запуская его.

 

На шаге Настройка параметров столбцовнужно настроить следующие параметры столбцов импортируемых данных, указав соответствующие значения в полях.

 

Имя столбца– указывается имя, которое будет служить идентификатором столбца в последующих узлах. По умолчанию предлагается заголовок столбца из текстового файла, если на предыдущем шаге был установлен флажок Первая строка является заголовком. Иначе будут предложены имена типа COL1, COL2 и т.д. Можно ввести любые имена, которые семантически отражают содержимое столбца, однако допускаются только латинские символы, и имя столбца должно быть уникальным в пределах всех столбцов импортируемого файла.

 

Метка столбца– название, под которым данный столбец будет виден в визуализаторах. Допускаются любые символы, уникальность имен не обязательна.

 

Тип данных– указывается тип данных, содержащихся в столбце. Тип выбирается из списка, открываемого щелчком по кнопке в правой части поля:

 

Вид данных– характер данных, содержащихся в столбце:

 

Непрерывными могут быть только числовые данные. Дискретный характер носят, как правило, строковые данные, но не всегда. Дискретными могут быть назначены в зависимости от контекста решаемой задачи данные целого типа, реже – вещественного. Вид данных столбца влияет на:

· алгоритм расчета статистики по столбцу;

· работу аналитических алгоритмов.

Назначение– определяет порядок использования поля набора данных, полученного в результате импорта столбца (поля), при дальнейшей обработке импортированных данных:

 

Например:

 

Изменить назначение группы столбцов одной операцией можно следующим образом:

· удерживая клавишу Shift, выделить мышкой или клавишами Ctrl+↓, Ctrl+↑первый и последний столбцы группы столбцов и изменить их назначение;

· удерживая клавишу Ctrl, выделить мышкой только нужные столбцы и изменить их назначение.

 

На шаге Запуск процесса импортастартует сам процесс импорта данных с ранее настроенными параметрами. Ход процесса импорта отображается с помощью индикатора. Если процесс импорта остановился, это сигнализирует о возможных ошибок при чтении данных. В этом случае появляется окно с сообщением об ошибке.

 

Для управления процессом импорта предусмотрены следующие кнопки:

· Пуск – запускает процесс в первый раз или возобновляет после паузы.

· Пауза – временно приостанавливает импорт.

· Стоп – останавливает процесс без возможности его продолжения.

 

На оставшихся двух шагах мастера импорта будет предложено выбрать визуализатор набора данных (по умолчанию предлагается Таблица) и задать сведения об узле.

 

 





Читайте также:
История государства Древнего Египта: Одним из основных аспектов изучения истории государств и права этих стран является...
Зачем изучать экономику?: Большинство людей работают, чтобы заработать себе на жизнь...
Аффирмации для сектора семьи: Я создаю прекрасный счастливый мир для себя и своей семьи...
Пример художественного стиля речи: Жанры публицистического стиля имеют такие типы...

Рекомендуемые страницы:


Поиск по сайту

©2015-2020 poisk-ru.ru
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2017-12-07 Нарушение авторских прав и Нарушение персональных данных


Поиск по сайту:

Обратная связь
0.017 с.