Параметры парсера
Специальное предложение: скидка 50% (115 200 рублей) на ODataDB Enterprise до 24 июня 2024

Параметры парсера

/asIs

Используйте эту опцию, чтобы отключить любую специальную обработку входных данных, например преобразование временных меток Yahoo Finance в значения даты и времени.

/attributedColumns=<col>.<attr>[;...]

Используйте эту опцию для создания выходных столбцов из значений атрибутов XML.

Например, Zoho CRM экспортирует такие данные, как

<FL val="FirstName">John</FL>
<FL val="LastName">Doe</FL>

Чтобы извлечь значения в столбцы FirstName и LastName, используйте следующую опцию:

/attributedColumns=FL.val

/collapsedNodes=<node>[;...]

Используйте эту опцию, чтобы включить значения дочернего узла XML в родительский узел.

Например, узел XML имеет следующую структуру:

<passages>
<passage><hlword>Yandex</hlword> - the search engine that can...</passage>
</passages>

Чтобы иметь один столбец passages, используйте:

/collapsedNodes=passages

/firstRow=<first row>

Используйте эту опцию, чтобы определить первую строку данных во входном файле.

/firstRowHasNames

Используйте эту опцию, чтобы указать, что входные данные имеют заголовки, если утилита не обнаруживает их автоматически.

Эта опция противоположна опции /noSourceHeaders.

Вы можете использовать эту опцию со значением false. Например:

/firstRowHasNames=false

/hasRowNum

Используйте эту опцию, чтобы указать, что первый столбец содержит номера строк.

Вы можете опустить этот параметр, если первый столбец имеет имя _RowNum.

Используйте эту опцию, чтобы не добавлять дополнительный столбец одновременно с опцией /addRowNum. Например:

/hasRowNum /addRowNum

Кроме того, вы можете использовать эту опцию в сочетании с /addRowNum для удаления первого столбца:

/hasRowNum /addRowNum=false

/ignoredTags=<tag>[;...]

Используйте эту опцию, чтобы отключить создание столбцов для указанных тегов XML.

Например, узел XML имеет следующую структуру:

<passages>
<passage><hlword>Yandex</hlword> - the search engine that can...</passage>
</passages>

Чтобы игнорировать тег hlword, используйте:

/ignoredTags=hlword

/inputCodePage=<codepage>

Используйте эту опцию для определения кодовой страницы входного файла.

Например:

/inputcodepage=65001

/inputDateFormat=DMY | MDY

Используйте эту опцию для определения порядка даты и месяца для входных данных.

gsqlcmd пытается определить этот порядок автоматически.

Однако, вам необходимо указать порядок вручную, если столбец содержит только даты типа 12.01.2019 или 01.12.2019, что не позволяет определить правильный порядок автоматически.

/inputSeparator=<separator> | Tab

Используйте эту опцию, чтобы определить разделитель входного CSV.

gsqlcmd в большинстве случаев определяет его автоматически.

/keptNodes=<node>[;...]

Используйте эту опцию, чтобы указать узлы XML и JSON, добавляемые к выходным данным, даже если они не имеют значений.

Этот параметр позволяет сохранять одни и те же выходные столбцы для файлов с небольшими наборами данных, когда некоторые столбцы могут не иметь значений.

/noSourceHeaders

Используйте эту опцию, если первая строка CSV и текстовых файлов или заголовков таблицы HTML не содержит имен столбцов.

В этом случае gsqlcmd создает столбцы с такими именами, как F1, F2 и т.д.

Эта опция чрезвычайно полезна также для финансовых отчетов, в которых в качестве заголовков столбцов используются годы или кварталы.

Эта опция противоположна /firstRowHasNames.

/numberFields=<field>[<separator>...]

Используйте эту опцию для принудительного преобразования значений столбца в числа.

Например:

/numberColumns=Open;High;Low;Close;Volume

Без этой опции gsqlcmd пропускает преобразование столбца, если какая-либо ячейка столбца содержит значение, которое не может быть преобразовано.

/requiredColumns=<name>[;...]

Используйте эту опцию, чтобы определить столбцы, необходимые для вывода.

gsqlcmd пропустит вывод для файла, если он не содержит указанных столбцов.

Например, вы хотите загрузить дивиденды для списка тикеров.

Если компания не выплачивает дивиденды, то ее страница будет пустой. Таким образом, вы можете указать необходимые выходные столбцы, чтобы пропускать такие страницы.

Например:

gsqlcmd convert https://www.nasdaq.com/symbol/aapl/dividend-history aapl.csv /requiredColumns=ExEffDate;Type

/rootPath=<path>[;...]

Используйте эту опцию для явного определения корневых выходных столбцов.

Ниже приведено несколько примеров для источников XML, JSON и HTML:

/rootPath=.InvoiceTransmission.Invoice
/rootPath=calls,puts
/rootpath=*.*.timestamp,*.*.*.quote,*.*.*.adjclose
/rootPath=1

Без этой опции gsqlcmd автоматически определяет выходные столбцы.

Используйте режим show-roots, чтобы получить корневые узлы для файлов XML и JSON.

Используйте режим show-html-tables, чтобы получить номера таблиц, используемые в качестве корневых для файлов HTML.

gsqlcmd поддерживает несколько корней для JSON и HTML и один корень для XML.

/skippedNodes=<node>[;...]

Используйте эту опцию, чтобы исключить узлы XML или JSON из выходных данных.

Вы можете указать пути к столбцам, например parent1.parent2.column, или суффиксы, например .column.

Например, чтобы исключить столбцы type с типами данных, используйте:

/skippedNodes=.type

/stringFields=<field>[<separator>...]

Используйте эту опцию, чтобы пропустить преобразование значений столбца в числа.

Например, используйте эту опцию, чтобы сохранить такие значения, как "2.10", в виде строк.

Без этой опции инструмент преобразует значение в числовое значение как 2.1.

Например, чтобы сохранять версии и почтовые индексы в полях Version и ZipCode в виде строк, можно использовать:

/stringColumns=Version;ZipCode