Назад к blog
rootSectionDefinition

Язык PdfQL

Язык, предназначенный для извлечения структурированных данных из PDF-документов с помощью цепочки операций, похожей на пайплайны Mongo DB.

Пример запроса

select(tables)
    ->filter((item) => item.GetCell(4).Text() == 'Name')
    ->selectMany(tableRows)
    ->map((item) => item.GetCell(1))

▶︎ Шаги

Операторы, которые трансформируют, фильтруют уменьшают элементы последовательности. Соединяйте их, и получайте то, что хотите.

λ Выражения

Строительные блоки, используемые в определении шагов. Сочитайте их для выражения того, что необходимо выполнить.

🔑 Ключевые слова

Специальные токены с предопределенным значением в грамматике PdfQL.

📥 Вывод

Поддерживаемые выходные форматы для результатов запросов.