| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ГОСТ Р 51294.9-2002 ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ Автоматическая идентификация КОДИРОВАНИЕ ШТРИХОВОЕ Спецификации символики PDF417 (ПДФ417)
ГОССТАНДАРТ РОССИИ Москва
Предисловие 1 РАЗРАБОТАН Ассоциацией автоматической идентификации ЮНИСКАН/EAN РОССИЯ/AIM РОССИЯ совместно с ЗАО «Фирма ПИЛОТ» ВНЕСЕН Техническим комитетом по стандартизации ТК 355 «Автоматическая идентификация» 2 ПРИНЯТ И ВВЕДЕН В ДЕЙСТВИЕ Постановлением Госстандарта России от 26 августа 2002 г. № 314-ст 3 Настоящий стандарт представляет собой аутентичный текст международного стандарта ИСО/МЭК 15438-2001 «Информационная технология. Технологии автоматической идентификации и сбора данных. Спецификации символики штрихового кода ПДФ417» (ISO/IEC 15438-2001 «Information Technology Automatic Identification and Data Capture - Bar code symbology specifications - PDF417»), за исключением раздела «Библиография», и приложений V, W, X. Дополнительные положения выделены курсивом. При применении настоящего стандарта рекомендуется использовать вместо ссылочных международных стандартов соответствующие им межгосударственные стандарты, сведения о которых приведены в дополнительном приложении W, и государственные стандарты Российской Федерации, сведения о которых приведены в дополнительном приложении X. 4 ВВЕДЕН ВПЕРВЫЕ
СОДЕРЖАНИЕ Введение Технология штрихового кодирования основана на распознавании комбинаций штрихов и пробелов определенных размеров. Существуют множество методов кодирования информации в формате штрихового кода, именуемых символиками, и множество правил перевода знаков в комбинации штрихов и пробелов и других важных параметров, именуемых спецификациями символики. Производителям оборудования для штрихового кодирования и пользователям технологии штрихового кодирования необходим общедоступный стандарт спецификаций символики, к которому можно обращаться при разработке оборудования или стандартов применений. Символика, представленная в данном стандарте, является общественным достоянием и не подлежит ограничениям для пользователей, лицензированию и взиманию взносов.
ГОСТ Р 51294.9-2002 (ИСО/МЭК 15438-2001) ГОСУДАРСТВЕННЫЙ СТАНДАРТ РОССИЙСКОЙ ФЕДЕРАЦИИ Автоматическая идентификация КОДИРОВАНИЕ ШТРИХОВОЕ Спецификации символики PDF417 (ПДФ417) Automatic identification. Bar coding. Symbology specifications PDF417 Дата введения 2003-01-01 1 Область примененияНастоящий стандарт устанавливает: - требования к символике штрихового кода PDF-417; - показатели символики PDF-417, кодирование знаков данных, форматы символов, размеры, правила коррекции ошибки, алгоритм декодирования и совокупность параметров применения. 2 Нормативные ссылкиВ настоящем стандарте использованы ссылки на следующие стандарты1: ИСО 646-91 Информационная технология - 7-битный кодированный набор знаков ИСО для обмена информацией ИСО 8859-1-98 Обработка информации. Наборы 8-битных однобайтовых кодированных графических символов. Часть 1. Латинский алфавит № 1 ИСО/МЭК 15416-2000 «Информационная технология. Технологии автоматической идентификации и сбора данных. Спецификации испытаний качества печати штриховых кодов. Линейные символы» ЕН 796-96 Штриховое кодирование. Идентификаторы символик ЕН 1556-98 Штриховое кодирование. Терминология 1 Соответствие межгосударственных стандартов и государственных стандартов Российской Федерации международным стандартам приведено в приложениях W и X. Международные спецификации, указанные в разделе 2 ИСО/МЭК 15438, перенесены в раздел «Библиография» ([1] и [5]). 3 Определения, обозначения и сокращения3.1 ОпределенияПрименительно к настоящему стандарту использованы следующие термины и определения, данные в ЕН 1556: Алгоритм (algorithm), стандарт применения (application standard), версия КОИ-7 (ASCII), автораспознавание (autodiscrimination), штрих (bar), штриховой код (bar code), двунаправленность декодирования (bi-directional), двоичный (binary), бит (bit), кодовое слово (codeword), столбец символа штрихового кода (column), непрерывный штриховой код (continuous code), знак данных (data character), кодовое слово данных (data codeword), уплотнение данных (data compaction), поле данных символа (data region), алгоритм декодирования (decode algorithm), декодер (decoder), элемент символа штрихового кода (element), кодирование (encode), уровень коррекции ошибок (error correction level), визуальное представление знаков (human readable character), начальные нули (leading zeros), линейная символика (linear symbology), модуль (module), расчет «по модулю» контрольного знака (modulo), многострочная символика (multi-row symbology), n, k символика (n, k symbology), набор цифровых знаков (numeric), дополнение символа штрихового кода (overhead), знак-заполнитель (pad character), кодовое слово-заполнитель (pad codeword), свободная зона (quiet zone), рекомендуемый алгоритм декодирования (reference decode algorithm), строка символа штрихового кода (row), сканер (scanner), самоконтроль знака символа штрихового кода (self-checking), пробел символа штрихового кода (space), знак СТАРТ (start character), знак СТОП (stop character), коэффициент сжатия символа штрихового кода (symbol aspect ratio), знак символа (symbol character), символика штрихового кода (symbology), идентификатор символики (symbology identifier), длина символа штрихового кода (symbol width), размер X (X-dimension), размер Y (Y-dimension). В настоящем стандарте применяют также следующие термины с соответствующими определениями: 3.1.1 модель базового канала (Basic Channel Model): Стандартная система кодирования и передачи данных штрихового кода, в которой с выхода декодера поступают байты данных сообщения, но не передается никакой управляющей информации о сообщении. Примечание - В соответствии с данной моделью декодер работает в режиме базового канала 3.1.2 последовательность штрихов и пробелов (bar-space sequence): Последовательность, представляющая ширину элементов знака символа в модулях. 3.1.3 кластер (cluster): Одно из трех подмножеств самостоятельных знаков символа PDF417, в котором знаки символа соответствуют особым структурным правилам, используемым при декодировании символики. 3.1.4 режим уплотнения (compaction mode): Наименование каждого из трех алгоритмов уплотнения данных PDF417: режим текстового уплотнения (Text Compaction mode), режим цифрового уплотнения (Numeric Compaction mode) и режим байтового уплотнения (Byte Compaction mode), эффективно преобразующих 8-битные байты данных в кодовые слова PDF417. 3.1.5 кодовое слово коррекции ошибок (Error correction codeword): Кодовое слово в символе, которое кодирует значение, получаемое из алгоритма исправления ошибок кодовых слов для декодирования обнаруженных ошибок и их исправления в зависимости от уровня коррекции ошибок. 3.1.6 интерпретация расширенного канала (Extended Channel Interpretation): Процедура, применяемая в некоторых символиках, включая PDF417, для точной замены интерпретации по умолчанию иной интерпретацией. Примечание - Интерпретация, изначально предназначенная для формирования символа, может быть восстановлена после декодирования сканированного символа для воссоздания сообщения данных в его исходном формате. 3.1.7 модель расширенного канала (Extended Channel Model): Система кодирования и передачи байтов данных сообщения и управляющей информации о сообщении, в которой управляющая информация передается с использованием управляющей последовательности интерпретации расширенного канала. Примечание - Декодер, соответствующий данной модели, работает в режиме расширенного канала. 3.1.8 функциональное кодовое слово (function codeword): Кодовое слово в символике, которое инициирует определенную операцию в символике. Примечание - Функциональное кодовое слово используется, например, для перехода между кодированными наборами данных, вызова схемы уплотнения, программирования считывающего устройства и вызова интерпретаций расширенного канала. 3.1.9 идентификатор глобальной метки (Global Label Identifier): Процедура в рамках символики PDF417, предназначенная для замены интерпретации по умолчанию иной интерпретацией. Примечания: 1 Назначение указанной процедуры идентично назначению интерпретации расширенного канала. 2 Связанная с символикой система идентификаторов глобальных меток предшествовала независимой от символики системе интерпретации расширенного канала. 3.1.10 Макро PDF417 (Macro PDF417): Процедура в символике PDF417 по логической передаче данных из компьютерного файла в комплект связанных символов PDF417. Примечания: 1 Эта процедура значительно расширяет емкость данных по сравнению с емкостью единичного символа. 2 Настоящая процедура подобна параметру структурированного соединения, применяемому в других символиках. 3.1.11 кодовое слово фиксации в режиме (Mode Latch codeword): Кодовое слово, которое используется для перехода из одного режима в другой, который будет действовать до применения кодового слова фиксации в режиме или регистра в режиме, либо до окончания символа. 3.1.12 кодовое слово регистра в режиме (Mode Shift codeword): Кодовое слово, которое используется для перехода из одного режима в другой только для одного кодового слова, после чего режим кодирования возвращается к исходному. 3.1.13 кодовое слово индикатора строки (Row Indicator codeword): Кодовое слово PDF417, примыкающее к знаку СТАРТ или знаку СТОП в строке, которое кодирует информацию о структуре символа PDF417: идентификацию строки, общее количество строк и столбцов и уровень коррекции ошибки. 3.1.14 кодовое слово дескриптора длины символа (Symbol Length Descriptor): Кодовое слово в символе PDF417, кодирующее общее количество кодовых слов данных в символе. Примечание - Дескриптор длины символа всегда должен быть первым кодовым словом в символе PDF417. 3.2 Обозначения математических символов и операцийВ настоящем стандарте используются следующие обозначения математических символов, которые согласуются с наиболее общим использованием системы счисления: A - коэффициент сжатия символа (symbol aspect ratio) PDF417 (отношение высоты к длине); b - ширина элемента в знаке символа; c - количество столбцов в символе в области данных (за исключением знаков СТАРТ и СТОП и кодовых слов индикаторов строк); d - кодовое слово данных, включая все функциональные кодовые слова; E - кодовое слово коррекции ошибок; e - расстояние между подобными краями в знаке символа; F - номер строки; f - количество ошибок подстановки; H - высота символа, включая свободную зону; K - номер кластера; k - количество кодовых слов коррекции ошибок; L - левый индикатор строки (Left row indicator); L - количество стираний; M - количество первоначальных кодовых слов данных, предшествующих дополнению дескриптора длины символа и любых кодовых слов-заполнителей (pad); N - общее количество кодовых слов данных, включая дескриптор длины символа и все кодовые слова-заполнители; P - шаг или ширина знака символа; QH - горизонтальная свободная зона; QV - вертикальная свободная зона; R - правый индикатор строки (Right row indicator); r - число строк в символе; s - уровень коррекции ошибок; W - длина символа, включая свободную зону; X - размер X или ширина модуля; Y - высота модуля (также именуется высотой строки). В настоящем стандарте используют также следующие обозначения для математических операций: div - оператор целоисчисленного деления с округлением в меньшую сторону; INT - целое число, полученное в результате округления в меньшую сторону до целого значения, с отбрасыванием десятых долей; mod - положительный остаток целого числа после деления. Примечание - Если остаток окажется отрицательным, для получения положительного результата прибавляют значение делителя. Например, остаток от деления -29160 на 929 равен -361. При прибавлении к остатку -361 делителя 929 получают положительное значение 568. 3.3 СокращенияВ настоящем стандарте применяют следующие сокращения: ECI - интерпретация расширенного канала; GLI - идентификатор глобальной метки. 4 Требования к символике PDF4174.1 Показатели символики4.1.1 Основные показателиСимволика штрихового кода PDF417 (русское обозначение ПДФ417) имеет следующие основные показатели: a) кодируемый набор знаков: в режиме текстового уплотнения (4.4.2) позволяет кодировать все графические знаки КОИ-7, т.е. знаки с десятичными значениями от 32 до 126 включительно в соответствии с ИСО/МЭК 646*, а также некоторые управляющие знаки, в режиме байтового уплотнения (4.4.3) позволяет кодировать все 256 значений 8-битных байтов. Этот режим включает все знаки КОИ-7 с десятичными значениями от 0 до 127 включительно и предусматривает поддержку международных наборов знаков, в режиме цифрового уплотнения (4.4.4) позволяет эффективно кодировать цифровые последовательности данных, различные функциональные кодовые слова для управления; * Версия 7-битного кодированного набора знаков для обмена и обработки информации по ИСО 646 соответствует набору С0 ссылочной версии КОИ-7Н0 по ГОСТ 27463 и набору Г0 версии КОИ-8 B1 по ГОСТ Р 34.303. В ИСО/МЭК 15438 указанная версия обозначена как ASCII. b) структура знака символа: знаки (n, k, m), представленные 17 модулями (n), элементами - 4 штрихами и 4 пробелами (k), с самым крупным элементом шириной в 6 модулей (m); c) максимально возможное количество знаков данных в символе (при нулевом уровне коррекции ошибок) - 925 кодовых слов данных, позволяющих закодировать: в режиме текстового уплотнения - 1850 знаков (2 знака данных на кодовое слово), в режиме байтового уплотнения - 1108 знаков (1,2 знака данных на кодовое слово), в режиме цифрового уплотнения - 2710 знаков (2,93 знака данных на кодовое слово). При минимальном рекомендуемом уровне коррекции ошибок (error correction level) имеется 863 кодовых слов данных, позволяющих закодировать: в режиме текстового уплотнения - 1726 знаков (2 знака данных на кодовое слово), в режиме байтового уплотнения - 1033 знака (1,2 знака данных на кодовое слово), в режиме цифрового уплотнения - 2528 знаков (2,93 знака данных на кодовое слово); d) размер символа: количество строк - от 3 до 90, количество столбцов - от 1 до 30, длина в модулях - от 90X до 583X, включая свободные зоны, максимальное количество кодовых слов - 928, максимальное количество кодовых слов данных - 925. Поскольку может быть задано как число строк, так и число столбцов, при печати может быть изменен и коэффициент сжатия символа PDF417 для выполнения требований по размещению; e) задаваемая коррекция ошибок - от 2 до 510 кодовых слов на символ (4.7); f) знаки, не относящиеся к знакам данных: на строку - 73 модуля, включая свободные зоны, на символ - не менее трех дополнительных кодовых слов, представленных в виде знаков символа; g) тип кода - непрерывный, многострочный, двухмерный; h) самоконтроль знака - присутствует; i) двунаправленное декодирование - присутствует. 4.1.2 Дополнительные свойстваВ символике PDF417 к дополнительным свойствам (обязательным или необязательным) относят: a) уплотнение данных (обязательное свойство). Установлены три схемы уплотнения совокупности знаков данных в кодовые слова. Обычно данные непосредственно не представляются на основе «один знак - одно кодовое слово» (4.4.2 - 4.4.4); b) интерпретации расширенного канала (необязательное свойство). Данный механизм позволяет кодировать до 811800 различных наборов знаков данных или интерпретаций (4.5); c) Макро PDF417 (необязательное свойство). Данный механизм предоставляет логическое и последовательное представление файлов данных в ряде символов PDF417. Таким образом, вплоть до 99999 символов PDF417, могут быть связаны или соединены и отсканированы в любом порядке для правильного восстановления исходного файла данных (4.13); d) декодируемость от края до края (обязательное свойство). PDF417 может декодироваться измерением размеров от края одного элемента знака символа до соответствующего края другого элемента (4.3.1); e) перекрестное сканирование строк (обязательное свойство). Для перекрестного сканирования строк в PDF417 используют сочетание трех следующих показателей: - синхронизацию по горизонтали или синхронизацию по времени, - идентификацию строки, - синхронизацию по вертикали использованием значения кластеров для обеспечения локального распознавания строк. При использовании данного сочетания одиночное линейное сканирование при пересечении ряда строк позволяет получить неполное декодирование данных, если хотя бы один полный знак символа в строке был декодирован и получено значение его кодового слова. В дальнейшем с помощью алгоритма декодирования отдельные кодовые слова могут быть соединены в значащую матрицу; f) коррекция ошибок (обязательное свойство). Пользователь может задать один из девяти уровней коррекции ошибок. На всех уровнях, кроме нулевого, возможно не только обнаружение ошибок, но и исправление ошибочно закодированных или недостающих кодовых слов (4.7); g) Компакт PDF417 (Compact PDF417) (необязательное свойство). В относительно «чистой» среде возможно сокращение некоторых строк со знаками, не относящимися к данным (4.12). Примечание - В предыдущей версии показателей PDF417 данное свойство именовалось «Сокращенный PDF417» («Truncated PDF417»). Термин Компакт PDF417 (Compact PDF417) является предпочтительным во избежание путаницы с наиболее общим использованием термина «сокращенный» (‘truncated’). 4.2 Структура символа4.2.1 Параметры символа PDF417Любой символ PDF417, состоящий из множества выровненных по вертикали строк, должен содержать не менее трех строк (но не более 90). Любая строка должна содержать не менее одного знака символа (но не более 30 знаков символа) без учета столбцов знаков СТАРТ, СТОП и столбцов индикатора строк. Символ должен включать свободные зоны со всех 4-х сторон. На рисунке 1 приведен символ PDF417 с закодированными данными: PDF417 Symbology Standard. Рисунок 1 - Структура символа PDF417. 4.2.2 Параметры строкиКаждая строка PDF417 должна содержать: a) начальную свободную зону, b) знак СТАРТ, c) знак символа левого индикатора строки, d) от 1 до 30 знаков символа, e) знак символа правого индикатора строки, f) знак СТОП, g) конечную свободную зону. Примечание - Число знаков символа (или кодовых слов), приведенных в перечислении d), соответствует числу столбцов в символе PDF417. 4.2.3 Последовательность кодовых словСимвол PDF417 может содержать до 928 знаков символа или кодовых слов. Примечание - Термин «Знак символа PDF417» рекомендуется использовать для обозначения напечатанной комбинации штрихов и пробелов; «кодовое слово» - для числового значения знака символа. Кодовые слова должны быть приведены в следующей последовательности: a) первое кодовое слово - дескриптор длины символа - всегда должно кодировать общее количество кодовых слов данных в символе, включая сам дескриптор длины символа, кодовые слова данных и кодовые слова-заполнители, за исключением числа кодовых слов коррекции ошибок; b) кодовые слова формируют по старшинству разрядов подлежащих кодированию знаков. Могут быть вставлены функциональные знаки для уплотнения данных; c) кодовые слова-заполнители помогают представлять последовательности кодовых слов в виде прямоугольной матрицы. Кодовые слова-заполнители можно также использовать для формирования дополнительных полных конечных строк с целью получения желаемого коэффициента сжатия или установленного в нормативном документе по применению; d) необязательный управляющий блок Макро PDF417; e) кодовые слова коррекции ошибки для обнаружения и исправления ошибок. Кодовые слова должны быть расположены таким образом, чтобы кодовое слово позиции старшего разряда примыкало к дескриптору длины символа (Symbol Length Descriptor), а кодовые слова кодировались слева направо от верхнего ряда к нижнему. На рисунке 2 представлена в виде схемы последовательность для символа, подобного представленному на рисунке 1. На рисунке 2 используется уровень коррекции ошибок 1 и требуется одно кодовое слово для полного заполнения матрицы символа.
Обозначения: d15 - дескриптор длины символа; d14 - d1 - закодированное представление данных; d0 - кодовое слово-заполнитель. Рисунок 2 - Пример схемы размещения символа PDF417 Примечание - Значения L, R, d и Е определены в 3.2. Правила и рекомендации по определению структуры матрицы приведены в 4.9. 4.3 Основное кодирование4.3.1 Структура знака символаКаждый знак символа PDF417 должен состоять из следующих элементов: четырех штрихов и четырех пробелов, ширина каждого из которых может быть от 1 до 6 модулей. Совокупная ширина 4 штрихов и 4 пробелов должна составлять 17 модулей. Знаки символа PDF417 могут быть декодированы путем измерения расстояний «e» внутри знака. Каждый знак символа задается последовательностью штрихов и пробелов из восьми цифр, которые представляют ширину в модулях каждого из восьми элементов этого знака символа. На рисунке 3 представлен знак символа с последовательностью штрихов и пробелов 51111125. Рисунок 3 - Знак символа PDF417. В PDF417 имеется 929 установленных значений знаков символа (кодовых слов), пронумерованных от 0 до 928. Кодовые слова представлены в виде трех взаимно исключающих наборов знаков символа или кластеров. Каждый кластер кодирует 929 допустимых кодовых слов PDF417 в виде различных комбинаций штрихов и пробелов так, что один кластер отличается от другого. Кластеры обозначают номерами 0, 3, 6. Задание кластера распространяется на все знаки символа PDF417, за исключением знаков СТАРТ и СТОП. Номер кластера K определяют по следующей формуле K = (b1 - b2 + b3 - b4 + 9) mod 9, где b1, b2, b3 и b4 - ширина в модулях соответственно четырех штрихов. Номер кластера K для знака символа, представленного на рисунке 3, составляет K = (5 - 1 + 1 - 2 + 9) mod 9 = 3. Значения кодовых слов и последовательности штрихов и пробелов для каждого кластера знаков символа приведены в приложении А. 4.3.2 Знаки СТАРТ и СТОПЗнаки СТАРТ и СТОП должны быть представлены в соответствии с таблицей 1 и рисунком 4. Таблица 1 - Последовательность штрихов и пробелов для знаков СТАРТ и СТОП
Примечания: 1 Знаки PDF417 СТАРТ и СТОП уникальны тем, что в них присутствуют элементы шириной более 6 модулей. 2 Знак СТОП имеет один дополнительный элемент - штрих шириной 1 модуль. Последовательность штрихов и пробелов в знаках СТАРТ и СТОП должна быть одинаковой для всех строк. Рисунок 4 - Знаки PDF417 СТАРТ и СТОП. 4.4 Высокоуровневое кодирование данныхВысокоуровневое кодирование преобразовывает знаки данных в соответствующие им значения кодовых слов. При высокоуровневом кодировании используют схемы уплотнения данных. Соответствие заданных пользователем данных и последовательностей кодовых слов в PDF417 устанавливают три режима уплотнения данных: текстовое (4.4.2), байтовое (4.4.3), цифровое (4.4.4). Данная цепочка байтов данных может быть представлена различными последовательностями кодовых слов, в зависимости от кодирования переходов между режимами и подрежимами уплотнения. В символе PDF417 нет специального способа кодирования данных. В каждом режиме предусмотрены 900 кодовых слов для кодирования данных и иных функций в рамках этого режима. Оставшиеся 29 кодовых слов предназначены для специальных функций (4.4.1), независимых от текущего режима уплотнения. PDF417 также поддерживает систему интерпретации расширенного канала, позволяющую точно кодировать разные интерпретации данных в символе (4.5). 4.4.1 Функциональные кодовые словаКодовые слова со значениями от 900 до 928 (далее - кодовые слова от 900 до 928) назначены в качестве функциональных кодовых слов: - для переключения между режимами (4.4.1.1), - для усовершенствованных применений, использующих интерпретации расширенного канала, - для других усовершенствованных применений (4.4.1.3 и 4.4.1.4). В настоящее время кодовые слова от 903 до 912 и от 914 до 920 зарезервированы. В таблице 2 приведен полный список назначенных и зарезервированных функциональных кодовых слов, функции которых установлены в 4.4.1.1 - 4.4.1.4. Зарезервированные кодовые слова представлены в 4.4.6. Таблица 2 - Назначение функциональных кодовых слов PDF417
4.4.1.1 Функциональные коды для перехода режима В одном символе PDF417 предусмотрена возможность двухстороннего переключения режимов с требуемой частотой. Рекомендации по выбору режимов приведены в 4.4.5. Для перехода из текущего режима в требуемый режим (который будет оставаться в действии до тех пор, пока он не будет изменен на другой) должно использоваться кодовое слово фиксации в режиме. Для этой функции предназначены кодовые слова 900 - 902 и 924 (таблица 3). Таблица 3 - Кодовые слова установления режима и перехода между режимами
Примечание - В таблице указаны кодовые слова, используемые для перехода в требуемый режим. Кодовое слово регистра в режиме 913 вызывает временный переход из режима текстового уплотнения в режим байтового уплотнения. Этот переход действует только для следующего кодового слова, после чего должен вернуться прежний подрежим режима текстового уплотнения. Кодовое слово 913 может применяться только в режиме текстового уплотнения; его использование установлено в 4.4.2.4. Порядок перехода между тремя режимами установлен в таблице 4 и на рисунке 5. Таблица 4 - Таблица перехода между режимами, представляющая кодовые слова и их функции
Фиксация в режиме (Mode Latch) Рисунок 5 - Возможные переходы между режимами. Правила перехода в режим байтового уплотнения приведены в 4.4.3.1. 4.4.1.2 Функциональные кодовые слова для перехода к интерпретациям расширенного канала Кодовое слово интерпретации расширенного канала (кодовое слово ECI) может быть использовано для перехода к особой интерпретации, которая будет действовать до другого кодового слова ECI или до окончания данных. Для этой функции назначены кодовые слова от 925 до 927 (4.5). 4.4.1.3 Функциональные кодовые слова для Макро PDF417 Символы Макро PDF417 (в соответствии с 4.13) должны использовать кодовое слово 928 в начале управляющего блока Макро PDF417. Кодовые слова 922 и 923 используют для особых функций в Макро PDF417. 4.4.1.4 Функциональное кодовое слово для инициализации считывающего устройства Кодовое слово используют для указания считывающему устройству, что данные, заключенные внутри символа, являются программным кодом для инициализации считывающего устройства. Кодовое слово 921 должно быть первым кодовым словом после дескриптора длины символа. В случае применения последовательности инициализации Макро PDF417 в каждом символе должно появляться кодовое слово 921. Данные, содержащиеся в инициализации символа или в последовательности символов, не должны передаваться считывающим устройством. 4.4.2 Режим текстового уплотненияРежим текстового уплотнения включает все графические знаки версии КОИ-7 (т.е. знаки с десятичными значениями от 32 до 126) и три управляющих знака версии КОИ-7: ГТ (НТ) или ГОРИЗОНТАЛЬНОЕ ТАБУЛИРОВАНИЕ (десятичное значение знака 9), ПС (LF) или ПЕРЕВОД СТРОКИ (десятичное значение знака 10), и ВК (CR) или ВОЗВРАТ КАРЕТКИ (десятичное значение знака 13). Примечание - В скобках приведены международные обозначения управляющих знаков (приложение V). Режим текстового уплотнения предусматривает также различные знаки с функциями фиксации и переключения регистра, которые используют исключительно в рамках режима текстового уплотнения. В режиме текстового уплотнения осуществляется кодирование до двух знаков в кодовом слове. Правила уплотнения для преобразования данных в кодовые слова PDF417 приведены в 4.4.2.2. Переключения подрежимов приведены в 4.4.2.3. 4.4.2.1 Подрежимы режима текстового уплотнения Режим текстового уплотнения предусматривает четыре подрежима: - прописных букв (Alpha) (прописные буквы латинского алфавита), - строчных букв (Lower) (строчные буквы латинского алфавита), - смешанных знаков (Mixed) (числа и некоторые знаки пунктуации), - знаков пунктуации (Punctuation). В каждом подрежиме содержится 30 знаков, в том числе знаки фиксации в подрежиме (sub-mode latch) и регистра в подрежиме (sub-mode shift). Режимом уплотнения по умолчанию для PDF417 должен быть режим текстового уплотнения в подрежиме прописных букв. При переходе из другого режима кодовое слово фиксации в режиме текстового уплотнения должно всегда переключать в подрежим прописных букв режима текстового уплотнения. Все знаки и их значения приведены в таблице 5. Таблица 5 - Определение подрежимов режима текстового уплотнения
Примечания 1 Обозначения: al - знак фиксации в подрежиме прописных букв (latch to Alpha) as - знак регистра в подрежиме прописных букв (shift to Alpha) ml - знак фиксации в подрежиме смешанных знаков (latch to Mixed) pl - знак фиксации в подрежиме знаков пунктуации (latch to Punctuation). 2 В графах «Знак» представлена интерпретация по умолчанию идентификатора глобальной метки GLI 0 и интерпретация расширенного канала ECI 000002 для значений байтов, представленных в соседних графах «КОИ-7». Каждая величина, указанная в таблице, представляет собой половину кодового слова, т.е. значения от 0 до 29 (4.4.2.2). 3 В графах «Знак» в скобках указаны международные обозначения знаков. 4.4.2.2 Правила уплотнения для кодирования в режиме текстового уплотнения В режиме текстового уплотнения пары знаков данных должны быть представлены одним кодовым словом. Значения знаков данных находятся в диапазоне от 0 до 29 (т.е. 30 базовых значений) и указаны в таблице 5. В каждой паре из 30 базовых значений первое или находящееся слева значение пары должно обозначать значение h более высокого порядка, следующее значение пары - значение более низкого порядка l. Закодированное кодовое слово в PDF417 определяется по формуле d = h × 30 + l, где d - установлено в 3.2. Эта формула также распространяется на 30 базовых значений для функций фиксации в подрежиме (sub-mode latch) и регистра в подрежиме (sub-mode shift) в рамках режима текстового уплотнения. Для переключения между подрежимами следует использовать соответствующие значения знаков фиксации в подрежиме (sub-mode latch) и регистра в подрежиме (sub-mode shift). Если в результате кодирования последовательности знаков не получено четное число 30 базовых значений, следует использовать специальную методику, приведенную в 4.4.2.4. Приведенный пример кодирования (таблица 6) представляет, каким образом достигается уплотнение в режиме текстового уплотнения. Таблица 6 - Пример кодирования в режиме текстового уплотнения
Примечания 1 ml - знак фиксации в подрежиме смешанных знаков используется для переключения с целью кодирования цифровых знаков. 2 Знак ps используется в этом примере как значение-заполнитель, могут использоваться и другие значения знаков регистра в подрежиме и фиксации в подрежиме (4.4.2.4). Подлежащие кодированию данные: PDF417. Данные PDF417 представлены кодовыми словами 453, 178, 121, 239. 4.4.2.3 Переключение подрежимов режима текстового уплотнения (функции фиксации в подрежиме и регистра в подрежим) Переключение из одного подрежима в другой в пределах режима текстового уплотнения должно выполняться с помощью значений знаков фиксации в подрежиме и регистра в подрежиме, заданных для подрежима и действовавших до переключения. Знак регистра в подрежиме должен использоваться для переключения из одного подрежима режима текстового уплотнения в другой только для одного знака данных. Последующие кодовые слова возвращаются в подрежим, который использовался непосредственно до знака регистра в подрежиме (кроме случая, когда знак ps используется в качестве знака-заполнителя, в соответствии с 4.4.2.4). Функции знака регистра в подрежиме: ps - переключение регистра в подрежим знаков пунктуации (shift to punctuation sub-mode), as - переключение регистра в подрежим прописных букв (shift to uppercase alphabetic sub-mode). Знак фиксации в подрежиме должен использоваться для переключения из одного подрежима режима текстового уплотнения в другой, который будет действовать до тех пор, пока не будет явно задействован другой знак регистра в подрежиме или знак фиксации в подрежиме. Функции знака фиксации в подрежиме: al - фиксация в подрежиме прописных букв (latch to uppercase alphabetic sub-mode), ll - фиксация в подрежиме строчных букв (latch to lowercase alphabetic sub-mode), ml - фиксация в подрежиме смешанных знаков (цифровые или другие знаки пунктуации) (latch to mixed sub-mode), pl - фиксация в подрежиме знаков пунктуации (latch to punctuation sub-mode). Внутри каждого подрежима режима текстового уплотнения допускается ограниченный набор функций фиксации в подрежиме и переключения регистра в подрежим (таблица 5). В таблице 7 представлены переключения подрежимов режима текстового уплотнения; на рисунке 6 приведена схема данного процесса. Примечание - После знака фиксации в подрежиме может следовать другой знак фиксации в подрежиме или знак регистра в подрежиме; но после знака регистра в подрежиме не может следовать ни знак фиксации в подрежиме, ни знак регистра в подрежиме. Таблица 7 - Переключения подрежимов в режиме текстового уплотнения
Обозначения: - переключение регистра в подрежим; ll - знак фиксации в подрежиме строчных букв; ps - знак регистра в подрежиме знаков пунктуации; ml - знак фиксации в подрежиме смешанных знаков; as - знак регистра в подрежиме прописных букв; al - знак фиксации в подрежиме прописных букв; pl - знак фиксации в подрежиме знаков пунктуации Рисунок 6 - Переключения подрежимов в режиме текстового уплотнения 4.4.2.4 Методика применения знака-заполнителя в режиме текстового уплотнения Если последовательность знаков из 30 базовых значений в режиме текстового уплотнения не является четным числом, то к окончанию последовательности знаков добавляют знак-заполнитель (пример в таблице 6). Поскольку в режиме текстового уплотнения нет специальных нулевых функций, знаки фиксации в подрежиме и регистра в подрежиме должны использоваться в соответствии с приведенной ниже методикой: a) если последовательность знаков представляет собой окончание данных или за последовательностью знаков в режиме текстового уплотнения следует фиксация в другом режиме уплотнения, знаком-заполнителем может быть любой знак регистра в подрежиме или фиксации в подрежиме; b) если за последовательностью знаков в режиме текстового уплотнения следует функция переключения регистра в режим байтового уплотнения (кодовое слово 913) для кодирования знака в режиме байтового уплотнения, можно применять два способа в зависимости от подрежима режима текстового уплотнения, использованного до переключения регистра в режим байтового уплотнения; 1) если подрежим режима текстового уплотнения не является подрежимом знаков пунктуации, то должен использоваться знак со значением 29 (ps) из 30 базовых значений при условии, что кодирование вернется к тому же подрежиму режима текстового уплотнения. Декодер должен игнорировать знак ps, который непосредственно предшествует кодовому слову 913, 2) если подрежимом режима текстового уплотнения является подрежим знаков пунктуации, используют знак со значением 29 (al) из 30 базовых значений. Декодер не должен игнорировать знак (al), и таким образом осуществится возврат в подрежим прописных букв. 4.4.2.5 Переключение из режима текстового уплотнения Режим текстового уплотнения может завершиться с окончанием символа или любым из нижеперечисленных кодовых слов: 900 (фиксация в режиме текстового уплотнения); 901 (фиксация в режиме байтового уплотнения); 902 (фиксация в режиме цифрового уплотнения); 924 (фиксация в режиме байтового уплотнения); 928 (начало управляющего блока Макро); 923 (начало необязательного поля Макро PDF417); 922 (ограничитель Макро PDF417). Последние три кодовых слова могут встречаться только внутри управляющего блока Макро PDF417 символа Макро PDF417 (4.13.1). На режим текстового уплотнения также влияет присутствие зарезервированного кодового слова (4.4.6). Если декодер находится в режиме текстового уплотнения и встречается кодовое слово 913 (регистр в режиме байтового уплотнения), он декодирует кодовое слово, которое следует за кодовым словом 913, как отдельный двоичный байт, и затем возвращается к режиму текстового уплотнения. Подрежим, в который возвращается декодер, является самым последним фиксированным подрежимом, который действовал до кодового слова 913; знак регистра в подрежиме ps, непосредственно предшествующий кодовому слову 913, игнорируют. Если декодер находится в режиме текстового уплотнения и встречает кодовое слово 900 (фиксация в режиме текстового уплотнения), декодер вернется в подрежим прописных букв. 4.4.3 Режим байтового уплотненияРежим байтового уплотнения позволяет кодировать последовательность 8-битного набора байтов в последовательность кодовых слов преобразованием базы 256 в базу 900, при этом достигается коэффициент уплотнения, равный шести байтам на пять кодовых слов (1,2:1). Набор знаков и их значения (от 0 до 255) приведены в приложении В. Они должны рассматриваться как заданная по умолчанию интерпретация графических и управляющих знаков. При вызове интерпретаций расширенного канала (ECI) (4.5) эта интерпретация может быть задана как ECI 000000 или ECI 000002 (4.5.2). 4.4.3.1 Переход в режим байтового уплотнения Для режимов текстового или цифрового уплотнения при переходе в режим байтового уплотнения необходимо использовать одно из следующих кодовых слов: - 924 (фиксация в режиме байтового уплотнения) - при общем числе знаков в режиме байтового уплотнения, подлежащих кодированию, кратном 6; - 901 (фиксация в режиме байтового уплотнения) - при общем числе знаков в режиме байтового уплотнения, подлежащих кодированию, не кратном 6; - 913 (регистр в режиме байтового уплотнения), которое может использоваться вместо кодового слова 901, когда в режиме байтового уплотнения подлежит кодированию одиночный знак. 4.4.3.2 Правила уплотнения для кодирования одиночного знака в режиме байтового уплотнения (с использованием кодового слова регистра в режиме байтового уплотнения 913) Для кодирования одиночного знака в режиме байтового уплотнения значение кодового слова должно соответствовать десятичному значению (от 0 до 255) знака версии КОИ-8 (в соответствии с приложением В). 4.4.3.3 Правила уплотнения для кодирования протяженных цепочек знаков в режиме байтового уплотнения (с использованием кодовых слов фиксации в режиме байтового уплотнения 924 или 901) Для кодирования знака данных режима байтового уплотнения используют следующую процедуру: устанавливают общее число знаков режима байтового уплотнения; при наличии числа, кратного 6, используют кодовое слово 924 (фиксация в режиме байтового уплотнения), в противном случае используют кодовое слово 901 (фиксация в режиме байтового уплотнения); количество знаков в режиме байтового уплотнения разбивают на последовательности из 6 знаков слева направо (от позиций старших разрядов к младшим). Если количество знаков менее 6, следует перейти к шагу 7; десятичные значения шести байтов данных, подлежащих кодированию в режиме байтового уплотнения, обозначают как ряд от b5 до b0 (где b5 является первым байтом данных); преобразуют базу 256 в базу 900 для получения последовательности из 5 кодовых слов (в приложении С определен алгоритм и приведен пример); при необходимости повторяют операцию на этапе 3; для оставшихся знаков режима байтового уплотнения при использовании кодового слова фиксации в режиме байтового уплотнения 901 (т.е. когда количество знаков режима байтового уплотнения в последней группе менее 6) значением (значениями) кодового слова (слов) должно быть десятичное значение (десятичные значения) (от 0 до 255) знака (знаков) (в соответствии с примером кодирования, приведенным в приложении В) от позиций старших разрядов к младшим. Примечание - Режим байтового уплотнения, следующий за кодовым словом 901 (фиксация в режиме байтового уплотнения), предполагает, что общее число байтов, подлежащих кодированию, не является кратным 6. Если число байтов, подлежащих кодированию в режиме байтового уплотнения, кратно 6, для соответствия настоящим правилам кодирования следует закодировать, разместить в любой точке символа кодовое слово фиксации в режиме байтового уплотнения 901 или 924. Например, кодовое слово 924, представленное в качестве первого или второго кодового слова, будет идентифицировать следующую за ним последовательность кодовых слов режима байтового уплотнения как кодируемое число байтов, кратное 6. В качестве альтернативы кодовое слово 901 может быть вставлено в любую позицию в пределах последовательности кодовых слов режима байтового уплотнения, что разделит эту последовательность на две части, из которых ни одна не кодирует число байтов, кратное 6. Если в режимах текстового или цифрового уплотнения требуется дополнительное кодирование, следует использовать соответствующие знаки фиксации в режиме (4.4.1.1). 4.4.3.4 Переход из режима байтового уплотнения Режим байтового уплотнения может быть завершен с окончанием символа или любым из указанных кодовых слов: 900 (фиксация в режиме текстового уплотнения); 901 (фиксация в режиме байтового уплотнения); 902 (фиксация в режиме цифрового уплотнения); 924 (фиксация в режиме байтового уплотнения); 928 (начало управляющего блока Макро PDF417); 923 (начало необязательного поля Макро PDF417); 922 (ограничитель Макро PDF417). Три последних кодовых слова могут встречаться только внутри управляющего блока Макро PDF417 символа Макро PDF417 (в соответствии с 4.13.1). На режим байтового уплотнения также влияет присутствие зарезервированного кодового слова (в соответствии с 4.4.6). Повторный вызов режима байтового уплотнения (посредством использования кодового слова 901 или 924 во время действия режима байтового уплотнения) служит для завершения предыдущего режима байтового уплотнения группирования в 6 знаках режима байтового уплотнения, как указано в 4.4.3.3, и затем для начала нового группирования. Эта процедура может быть необходима при кодировании номера назначения интерпретации расширенного канала (ECI assignment number) (в соответствии с 4.5.3.2). В ходе процесса декодирования в режиме байтового уплотнения обработка последней группы кодовых слов различна в зависимости от того, каким кодовым словом (901 или 924) был вызван режим байтового уплотнения. Если режим байтового уплотнения вызван кодовым словом 924, то общее число кодовых слов в пределах режима уплотнения должно быть кратным 5. В противном случае символ является дефектным. Все группы из 5 кодовых слов декодируют в виде групп из 6 байтов. Если режим байтового уплотнения вызван кодовым словом 901, то последнюю группу кодовых слов четко интерпретируют как один байт на кодовое слово, без уплотнения. Следовательно, если последняя группа состоит из пяти кодовых слов, группу интерпретируют как 5 байтов, а не 6. 4.4.4 Режим цифрового уплотненияРежим цифрового уплотнения является методом уплотнения данных с базы 10 в базу 900 и должен использоваться для кодирования протяженных цепочек последовательных цифровых разрядов. Режим цифрового уплотнения позволяет кодировать до 2,93 цифровых разрядов на кодовое слово. 4.4.4.1 Переключение в режим цифрового уплотнения Вызов режима цифрового уплотнения может быть осуществлен из режимов байтового или текстового уплотнения с использованием кодового слова фиксации в режиме цифрового уплотнения 902. 4.4.4.2 Правила уплотнения для кодирования протяженных цепочек последовательных цифровых разрядов Для уплотнения цифровых данных используют следующую процедуру. Следует разделить цепочку цифр на группы из 44 цифр, за исключением последней группы, которая может содержать меньшее количество цифр. В каждой группе к позиции старшего разряда должна быть добавлена цифра 1 для исключения потери начальных нулей. ПРИМЕР: Исходные данные: 00246812345678 После выполнения этапа 2: 1 00246812345678 Примечание - Начальная цифра 1 исключается в алгоритме декодирования. Следует провести преобразование базы 10 в базу 900. В приложении D установлен алгоритм преобразования и приведен пояснительный пример. При необходимости повторяют операцию на этапе 2. Для определения точного числа кодовых слов в режиме цифрового уплотнения могут использоваться следующие правила: группы из 44 цифровых разрядов уплотнены в 15 кодовых словах; для групп более коротких цифровых последовательностей число кодовых слов можно вычислить следующим образом: кодовые слова = INT (количество цифровых разрядов/3) + 1 Для последовательности из 28 разрядов INT (28/3) + 1 = 9 + 1 = 10 кодовых слов 4.4.4.3 Переход из режима цифрового уплотнения Режим цифрового уплотнения может быть завершен с окончанием символа или с помощью любого из указанных кодовых слов: 900 (фиксация в режиме текстового уплотнения); 901 (фиксация в режиме байтового уплотнения); 902 (фиксация в режиме цифрового уплотнения); 924 (фиксация в режиме байтового уплотнения); 928 (начало управляющего блока Макро PDF417); 923 (начало необязательного поля Макро PDF417); 922 (ограничитель Макро PDF417). Последние три кодовых слова могут встречаться только внутри управляющего блока Макро PDF417 символа Макро PDF417 (4.13.1). На режим цифрового уплотнения также влияет присутствие зарезервированного кодового слова (4.4.6). Повторный вызов режима цифрового уплотнения (путем использования кодового слова 902 не выходя из режима цифрового уплотнения) служит для завершения группирования текущего режима цифрового уплотнения, как указано в 4.4.4.2, и для начала нового группирования. Эта процедура может быть необходима при кодировании номера назначения интерпретации расширенного канала (в соответствии с 4.5.3.4). В ходе процесса декодирования для режима цифрового уплотнения результат преобразования базы 900 в базу 10 должен привести к числу, в котором разрядом старшего порядка является 1. Если преобразование базы 900 в базу 10 не имеет результатом число, начинающееся с 1, символ должен рассматриваться как дефектный. Начальная 1 исключается при получении исходного числа. 4.4.5 Рекомендации по выбору подходящего режима уплотненияВсе базовые разработки при печати и сканировании символов PDF417 должны предусматривать три режима: текстовое уплотнение, байтовое уплотнение, цифровое уплотнение. Набор знаков по умолчанию для режима текстового уплотнения должен соответствовать установленному в приложении В. Режим текстового уплотнения обычно эффективнее режима байтового уплотнения для кодирования текстовых файлов стандартной версии КОИ-7 в связи с большим уплотнением знаков КОИ-7 с десятичными значениями 9, 10, 13 и от 32 до 126. Режим цифрового уплотнения должен использоваться для протяженных цепочек цифр. Рекомендации по переключению между режимами для получения наименьшего числа кодовых слов приведены в виде алгоритма в приложении Р. 4.4.6 Обработка зарезервированных кодовых слов PDF4174.4.6.1 Краткий обзор Символы PDF417, предназначенные для использования в открытых системах, не должны использовать кодовые слова, которые обозначены как зарезервированные (4.4.1) в настоящем стандарте. Однако декодирующее оборудование должно поддерживать передачу зарезервированных кодовых слов, используя управляющие последовательности в соответствии с 4.17.4. Декодирующее оборудование также может поддерживать опцию обработки таких символов как дефектных, что может произойти при работе в режиме базового канала. Системы приема должны отбрасывать данные, содержащие любые управляющие последовательности, использующие зарезервированные кодовые слова до тех пор, пока в систему не внесут новое определение для ранее зарезервированного кодового слова. 4.4.6.2 Создание будущего использования зарезервированных кодовых слов Любые новые кодовые слова, подлежащие определению в будущих редакциях настоящего стандарта, должны иметь свои правила кодирования, направленные на обеспечение обратной совместимости с ранее установленным оборудованием. В частности: - если новое сигнальное кодовое слово (отличное от кодового слова нового режима уплотнения) закодировано, непосредственно за ним должна следовать соответствующая функция фиксации в режиме уплотнения, чтобы последующие кодовые слова интерпретировались и передавались в качестве набора байтов, а не в качестве серий управляющих неинтерпретируемых кодовых слов. При использовании данного подхода будут достигнуты желаемые результаты при согласовании декодирующего оборудования, соответствующего исходному PDF417 и настоящему стандарту, вне зависимости от использования данным оборудованием исходного или нового протокола передачи; - в системе приема декодер интерпретаций расширенного канала будет обрабатывать управляющие интерпретации расширенного канала (т.е. управляющие блоки Макро PDF417) и управляющие неинтерпретируемые кодовые слова) до интерпретируемых интерпретаций расширенного канала (таких, как схемы шифрования и наборы знаков). Поэтому схема декодирования должна учесть следующий порядок операций: 1) если присутствуют интерпретации расширенного канала - ECI управляющего блока Макро PDF417 (Macro PDF417 Control Block), то они будут использоваться для компоновки полного набора байтов в соответствующем порядке; 2) кодовые слова управления данными будут преобразованы декодером ECI в соответствии с правилами нового режима уплотнения или сигнальной ECI. Полученные в результате байты данных будут вставлены в соответствующие места внутри потока байтов; 3) к полученному в результате потоку байтов будет применяться набор знаков или другие интерпретируемые ECI. 4.5 Интерпретация расширенного каналаПротокол интерпретации расширенного канала (далее - протокол ECI) позволяет выходному потоку данных иметь интерпретации, отличные от интерпретаций набора знаков по умолчанию. Протокол ECI полностью определяется в ряде символик, включая PDF417. Примечание - Первоначально для PDF417 была установлена особая схема символики, именуемая идентификаторами глобальной метки (Global Label Identifiers) (далее GLI). Процессы кодирования и декодирования интерпретации расширенного канала (далее ECI) идентичны ранее опубликованным спецификациям к GLI PDF417 ([2] и [3]). Однако протокол передачи для декодированных сообщений в соответствии с ранее опубликованными спецификациями PDF417 ([2] и [3]) в части GLI отличается от протокола передачи для ECI. Также имеются отличия по отношению к использованию ECI с Макро PDF417. Настоящий стандарт позволяет использовать ранние и современные протоколы таким образом, чтобы устаревшее и новое оборудование были совместимы. В PDF417 поддерживаются пять основных типов интерпретаций: a) наборы знаков (или кодовые страницы); b) интерпретации общего назначения, например шифрование данных и уплотнение данных (в отличие от режимов уплотнения символики); c) задаваемые пользователем интерпретации для замкнутых систем; d) передача управляющей информации для Макро PDF417 (Macro PDF417); e) передача неинтерпретируемых кодовых слов PDF417. Передача протокола ECI представлена в полном объеме в [1]. Протокол обеспечивает согласованный метод точного определения отдельных интерпретаций или значений байтов перед печатью и после декодирования. ECI идентифицируется 6-разрядным номером, который закодирован в символе PDF417 с помощью одного из трех специальных кодовых слов, за которым следует одно или два кодовых слова (4.5.1). Особая ECI может быть вызвана в любой точке закодированного сообщения в соответствии с правилами режимов уплотнения (в соответствии с 4.5.3). Использование протокола ECI возможно только с декодерами, имеющими возможность передачи идентификатора символики (4.17.5). Декодеры, которые не имеют возможности передачи идентификатора символики, не могут точно передать управляющие последовательности из любого символа, в котором содержится интерпретация расширенного канала. 4.5.1 Кодирование номера назначения интерпретации расширенного каналаECI можно вызвать в любом месте потока данных при соблюдении условий, установленных в 4.5.3. После совершения вызова ECI возможно переключение между любыми режимами уплотнения. Используемый режим уплотнения строго определяют закодированные 8-битные значения данных, не зависящие от действующей ECI. Например, кодирование последовательности со значениями от 48 до 57 (десятичные значения) будет иметь наибольшую эффективность в режиме цифрового уплотнения, даже если последовательность не будет интерпретироваться как цифры. Номер назначения интерпретации расширенного канала (далее - номер назначения ECI) закодирован в одной из трех последовательностей кодовых слов ECI, которые начинаются с кодовых слов 927, 926 или 925. Для кодирования номера назначения ECI используется одно или два дополнительных кодовых слова. В таблице 8 представлены правила кодирования. Таблица 8 - Кодирование номеров назначения ECI
В PDF417 доступно 811800 возможных номеров назначения ECI. Примечание - Метод кодирования идентичен схеме GLI, поддерживаемой в фирменных исходных спецификациях PDF417 и включенной в [2] и [3]. Пример процесса кодирования: ECI = 013579 Кодовые слова: [926] [(13579 div 900) - 1] [13579 mod 900] = [926] [15 - 1] [79] = [926] [14] [79] 4.5.2 Заранее назначенные интерпретации расширенного каналаДля обеспечения обратной совместимости с действующими спецификациями символик, включая PDF417, заранее назначены следующие интерпретации расширенного канала: - ECI 000000 (приравниваемая к исходному GLI 0) - схема кодирования по умолчанию кодирующего устройства, соответствующая исходным стандартам PDF417. Набор знаков представлен в приложении А; - ECI 000001 (приравниваемая к исходному GLI 1) - схема кодирования GLI ряда символик, где знаки с десятичными значениями от 0 до 127 идентичны знакам ИСО/МЭК 646* (или [4]), и знаки с десятичными значениями от 128 до 255 идентичны знакам ИСО 8859-1. * 7-битный кодированный набор знаков по ИСО 646 соответствует набору ссылочной версии КОИ-7НО по ГОСТ 27463, за исключением двух знаков: в позиции 02/04 в ИСО 646 используют знак $ (ДЕНЕЖНЫЙ ЗНАК ДОЛЛАРА) (целочисленное значение 37) и в позиции 7/14 знак ~ (ТИЛЬДА) (целочисленное значение 111). Примечание - Для ECI 000000 (эквивалентной GLI 0) и ИРК/ЕС1 000001 (эквивалентной GLI 1) требуется логическая схема с возвратом к GLI 0 в начале каждого закодированного символа комплекта символов Макро PDF417. Этот протокол не принят для других интерпретаций расширенного канала; - ECI 000002 соответствует кодовой таблице (приложение В), эквивалентной ECI 000000, без логической схемы с возвратом к GLI 0. Она является схемой кодирования по умолчанию для кодирующих устройств, полностью соответствующей настоящему стандарту; - ECI 000003 соответствует кодовой таблице, эквивалентной ECI 000001, без логической схемы с возвратом к GLI 0. ECI 000000 и ECI 000001 не допускается кодировать в одном и том же символе PDF417 или наборе символов Макро PDF417, за исключением интерпретаций расширенного канала, заданных пользователем. ECI 000002 и ECI 000003 обеспечивают совместимые альтернативы ECI 000000 и ECI 000001 соответственно и являются предпочтительными для использования в новых применениях. Дополнительные интерпретации расширенного канала присваиваются в соответствии с правилами, приведенными в [5]. 4.5.3 Кодирование последовательностей интерпретаций расширенного канала в рамках режимов уплотненияОсновной принцип кодирования заключается в том, что интерпретации расширенного канала используют в исходном потоке байтов данных (для обозначения разных интерпретаций) путем формирования модифицированного потока данных, который кодируется в символах PDF417 с использованием для большей эффективности режимов уплотнения символики. Кодирование ECI и специальное уплотнение символики формируют два независимых логических слоя в этом процессе. Несмотря на то, что назначения ECI и режимы уплотнения, как правило, могут перемежаться, некоторые их комбинации могут формировать нелогическую или неоднозначную ситуацию. В 4.5.3.1 - 4.5.3.5 определено, каким образом ECI могут быть встроены без появления неоднозначности путем установления надлежащего расположения управляющих последовательностей ECI. 4.5.3.1 Интерпретации расширенного канала и режим текстового уплотнения Управляющая последовательность ECI может быть размещена в любом месте в рамках режима текстового уплотнения. Подрежим, вызванный непосредственно перед управляющей последовательностью ECI, сохраняется для кодирования сразу после этой последовательности. Поэтому функции фиксации в подрежиме и регистра в подрежиме сохраняются параллельно управляющей последовательности ECI и функция регистра в подрежиме непосредственно перед управляющей последовательностью кода ECI не игнорируется. 4.5.3.2 Интерпретации расширенного канала и режим байтового уплотнения, использующий кодовые слова 924 и 901 (фиксация в режиме байтового уплотнения) При кодировании в режиме байтового уплотнения, использующего кодовое слово 924 (фиксация в режиме байтового уплотнения), управляющая последовательность ECI может быть размещена кодирующим устройством непосредственно после кодового слова 924 или соответственно на любой границе, отделяющей группы из пяти кодовых слов. Это необходимо для обеспечения однозначного расположения в декодированном потоке байтов для декодера, чтобы разместить управляющую последовательность. Если декодер находится в версии 924 режима байтового уплотнения и обнаруживает управляющую последовательность ECI, которая следует за группой из пяти кодовых слов, он должен вывести шесть байтов данных, связанных с кодовыми словами перед управляющей последовательностью, вывести управляющую последовательность и затем продолжать сбор кодовых слов для декодирования в режиме байтового уплотнения. Если декодер обнаруживает управляющую последовательность ECI в иных, отличных от данных установленных местоположений, он должен рассматривать символ как дефектный. При кодировании в режиме байтового уплотнения с использованием кодового слова 901 (фиксация в режиме байтового уплотнения) управляющая последовательность ECI может размещаться непосредственно: - после кодового слова 901; - после любого набора из пяти кодовых слов, кодирующих шесть байтов; - после любых замыкающих однобайтовых кодовых слов в конце последовательности. Примечание - Декодер не может допустить, чтобы из-за того, что управляющая последовательность ECI следует за набором из пяти кодовых слов, эти пять кодовых слов кодируют шесть байтов, а затем поток на входе длиной 6N + 5 (где N - целое число) будет иметь конечный набор из пяти кодовых слов, которые кодируют только пять байтов - один байт на одно кодовое слово. Следовательно, декодер должен в первом сканированном символе, минуя управляющую последовательность ECI, установить, где завершается режим 901 в соответствии с 4.4.3.4. На основе этой информации он может установить, каким образом была закодирована группа из пяти кодовых слов. На рисунке 7 представлено допустимое расположение управляющих последовательностей ECI при кодировании в режиме байтового уплотнения. Если декодер встретит управляющую последовательность ECI внутри группы из пяти кодовых слов, он должен рассматривать символ как дефектный. - кодовое слово режима байтового уплотнения; - допустимое расположение управляющей последовательности ECI Рисунок 7 - Допустимые расположения управляющих последовательностей ECI при кодировании в режиме байтового уплотнения 4.5.3.3 Интерпретации расширенного канала и режим байтового уплотнения, использующий кодовое слово 913 (регистр в режиме байтового уплотнения) При кодировании в режиме байтового уплотнения, использующего кодовое слово 913 (регистр в режиме байтового уплотнения), управляющая последовательность ECI может быть размещена непосредственно: - перед кодовым словом 913, - за кодовым словом 913, - за кодовым словом, следующим после кодового слова 913. В первых двух случаях управляющая последовательность ECI выводится до закодированных байтов, в то время как в последнем случае управляющая последовательность ECI выводится после закодированного байта. 4.5.3.4 Интерпретации расширенного канала и режим цифрового уплотнения Управляющую последовательность ECI не следует размещать внутри группы кодовых слов, подлежащих обработке преобразованием базы 10 в базу 900 (4.4.4.2). Она может быть размещена только внутри области режима цифрового уплотнения (обычно) на границе между группами из 15 кодовых слов. Это необходимо для обеспечения однозначного позиционирования в декодированном потоке байтов при размещении декодером управляющей последовательности. Поэтому управляющую последовательность ECI размещают непосредственно: - после кодового слова со значением 902; - после 15-го кодового слова; - после 30-го кодового слова; - и т.д. Если кодирующему устройству необходимо расположить управляющую последовательность ECI в позиции, которая не является кратной 15 кодовым словам, то оно должно рассматривать цифровой блок до ECI как завершенный объект в соответствии со вторым этапом 4.4.4.2. Кодирующее устройство должно повторно ввести режим цифрового уплотнения путем расположения в потоке другого кодового слова со значением 902, за которым следует управляющая последовательность ECI. Если декодер обнаруживает управляющую последовательность ECI на одной из вышеуказанных пограничных точек, он должен генерировать байты данных, связанные с кодовыми словами до управляющей последовательности (при наличии таковых), генерировать управляющую последовательность и затем продолжить сбор кодовых слов для декодирования в режиме цифрового уплотнения. Если декодер обнаруживает управляющую последовательность ECI в иных позициях, отличающихся от установленных, он должен рассматривать символ как дефектный. 4.5.3.5 Комбинирование интерпретаций расширенного канала Две или более управляющие последовательности (т.е. номера назначения ECI) могут быть расположены в любой точке, где возможно размещение надлежащим образом одной ECI, при том условии, что между ними размещены только кодовые слова, которые используют для кодирования управляющей последовательности ECI. 4.5.4 Протокол после декодированияПротокол для передачи данных ECI должен соответствовать представленному в 4.17.2. Во время передачи интерпретаций расширенного канала идентификаторы символики (4.17.5) должны быть полностью реализованы, и соответствующий идентификатор символики должен быть передан в качестве преамбулы. 4.6 Определение последовательности кодовых словВ процессе кодирования генерируется последовательность кодовых слов в виде dn-1 ... d0, где d - кодовое слово данных, включая дескриптор длины символа и все кодовые слова функций; n - общее количество кодовых слов данных, включая дескриптор длины символа, за исключением кодовых слов коррекции ошибки. Дескриптор длины символа, обозначаемый dn-1, должен быть первым кодовым словом данных. Его значение должно быть равно общему количеству кодовых слов данных n; при этом подсчете должен учитываться непосредственно сам дескриптор длины символа и поэтому его значение должно быть от 1 до 926. В процессе кодирования должны быть установлены последовательности кодовых слов. По аналогии с исходными данными сначала должны следовать данные позиций старших разрядов, например текстовые и цифровые данные, которые читаются слева направо. Последовательность кодовых слов должна быть представлена таким образом, чтобы кодовые слова данных позиций старших разрядов, содержащие закодированные данные, были обозначены dn-2. Последнее кодовое слово данных должно быть обозначено d0. Процесс, используемый для определения матрицы строк и столбцов символа (4.9.2), может потребовать дополнения замыкающими кодовыми словами-заполнителями для завершения последовательности кодовых слов данных. 4.7 Обнаружение и коррекция ошибокКаждый символ PDF417 содержит минимум два кодовых слова коррекции ошибок. Кодовые слова коррекции ошибок позволяют как обнаруживать, так и исправлять ошибки. 4.7.1 Уровень коррекции ошибокУровень коррекции ошибки в символе PDF417 в момент создания символа является выборочным. В таблице 9 показано число кодовых слов коррекции ошибок для каждого уровня коррекции ошибок. Таблица 9 - Уровни коррекции ошибок и кодовые слова коррекции ошибок
4.7.2 Возможности для исправления ошибокИсправление ошибок может использоваться для устранения дефектов на этикетке и ошибочного считывания в ходе процедуры декодирования. Для любого заданного уровня коррекции ошибок в символ PDF417 должно быть включено определенное количество кодовых слов коррекции ошибок. Используемый алгоритм кодовых слов коррекции ошибок должен позволять устранить два вида ошибок: - стирание, обусловленное недостающим или не подлежащим декодированию кодовым словом, - ошибку подстановки, обусловленную неправильно декодированным кодовым словом. Схема коррекции ошибок требует наличия одного кодового слова коррекции ошибок для восстановления стирания и двух кодовых слов для устранения ошибки подстановки. Таким образом, заданный уровень коррекции ошибок может исправить любое сочетание ошибок подстановки и стираний, которое удовлетворяет уравнению l + 2 f ≤ 2s+1 - 2, где l, f и s - соответствуют определениям, приведенным в 3.2. Если использована большая часть возможностей по коррекции ошибок для восстановления стираний, возрастает вероятность наличия необнаруженных ошибок. Если исправлено менее четырех ошибок (за исключением s = 0), возможность коррекции ошибок уменьшается по уравнению: l + 2 f ≤ 2s+1 - 3, где l, f и s соответствуют определениям, приведенным в 3.2. Символ PDF417с уровнем коррекции ошибок 3 предусматривает наличие 16 кодовых слов коррекции ошибок, из которых 14 могут использоваться для исправления ошибок и стираний. С их помощью может быть восстановлено до 13 стираний или до семи ошибок подстановки или любое сочетание l стираний и f ошибок подстановки по условиям приведенного выше практического уравнения. В таблице 10 установлены возможные сочетания. Таблица 10 - Возможные сочетания коррекции ошибок для уровня коррекции 3
4.7.3 Определение кодовых слов коррекции ошибокКодовые слова коррекции ошибок определяют в два этапа: - выбор уровня коррекции ошибок - определяет пользователь или требования, установленные применением (приложение Е); - формирование кодовых слов коррекции ошибок - в соответствии с перечнем правил, приведенным в 4.10. Процедуры не могут быть использованы до тех пор, пока не будут определены все кодовые слова данных, включая кодовые слова-заполнители (4.9.2). Примечание - Процедуры в соответствии с 4.3 - 4.9, 4.13 и 4.14 определяются пользователями. Прочие технические процедуры согласно 4.10, 4.11 и 4.15 выполняются оборудованием и требуют решений со стороны пользователя. 4.8 РазмерыСимволы PDF417 должны соответствовать размерам, указанным в 4.8.1 - 4.8.3. 4.8.1 Минимальная ширина модуля (X)Минимальная ширина модуля подлежит определению в нормативных документах, устанавливающих требования по применению. Она учитывает наличие оборудования для производства и считывания символов и соответствует основным требованиям, установленным применением. Размер X должен оставаться неизменным в пределах всего символа. Примечание - Действующие стандарты оценки качества символа штрихового кода (например, ИСО/МЭК 15416) не требуют измерения абсолютных размеров для оценки качества символа. Поэтому несоответствие любому минимальному размеру не является поводом для оценки символа как не соответствующего настоящему стандарту. 4.8.2 Высота строки (Y)Для символов с рекомендуемым наименьшим уровнем коррекции ошибок Y ≥ 3X. Для символов с уровнем коррекции ошибок меньшим, чем рекомендуемый наименьший уровень, Y ≥ 4Х. Рекомендуемый уровень коррекции ошибок приведен в приложении Е. 4.8.3 Свободные зоныНаименьшая ширина горизонтальной свободной зоны (слева и справа от символа PDF417) - 2X. Наименьший размер вертикальной свободной зоны (над и под символом PDF417) - 2Х. 4.9 Определение формата символаМатрицу символа PDF417, общий размер и форму символа определяют следующие факторы: ширина модуля и коэффициент сжатия; число строк и столбцов в матрице символа. При создании символа PDF417 эти параметры выбирают сочетанием установок пользователя, ограничений, определяемых применением, и установок по умолчанию. Процесс выбора может повторяться до получения пользователем требуемого формата. 4.9.1 Определение коэффициента сжатия модуляКоэффициент сжатия печатаемого модуля (aspect ratio of the module) определяют два размера: X - требуемая ширина самого узкого штриха и самого узкого пробела; Y - требуемая высота каждой строки. Эти размеры определяются пользователем или нормативными документами, регламентирующими применение штрихового кода. Основным фактором, определяющим эти параметры, является разрешение систем печати и считывания, используемых в рамках конкретного применения (4.14). 4.9.2 Определение матрицы строк и столбцов символаДля определения матрицы символа, т.е. числа строк r и числа столбцов c, учитывают следующие факторы: - объем и тип данных, подлежащих кодированию; - основные правила символики, определяющие, например, предельное число строк и столбцов (4.2.1 и 4.2.2); - фактическое пространство для нанесения символа; - более длинные строки приводят к уменьшенной вспомогательной части символа (включающей знаки СТАРТ и СТОП, индикаторы строки и области свободных зон); - длина строки (включая свободные поля) должна быть меньше длины линии сканирования, регламентируемой или подразумеваемой в рамках применения; - тип сканера, который может определять общий коэффициент сжатия символа; - выбранный уровень коррекции ошибок. Во многих применениях допустимая длина символа является первичным ограничением и матрицу символа можно определить фиксированным числом столбцов. В приложении Q приведены рекомендации по определению матрицы символа. После кодирования исходных данных с использованием выбранных режимов уплотнения известно число исходных кодовых слов данных m (до дополнения дескриптором длины символа и любыми кодовыми словами-заполнителями). После выбора числа строк и столбцов и уровня коррекции ошибок общее число кодовых слов данных n вычисляют по формуле n = c × r - k где c, k, n и r соответствуют определениям, приведенным в 3.2. В матрице могут возникнуть ситуации, когда для достижения необходимого числа строк и столбцов требуется использование кодовых слов-заполнителей (условно используется кодовое слово со значением 900). Такая ситуация может произойти при n > m + 1, где m и n соответствуют определениям, приведенным в 3.2. Дескриптору длины символа следует назначить значение n, определенное выше. Таким образом: dn-1 = n = c × r - k. Требуемое число кодовых слов-заполнителей равно (n - m) - 1. Кодовые слова-заполнители должны иметь значение 900 и размещаться в позициях младших разрядов последовательности кодовых слов данных, т.е. справа от исходного кодового слова данных в позиции самого младшего разряда (но до управляющего блока Макро PDF417, при наличии). Пример такого преобразования приведен ниже. Независимо от включения дескриптора длины символа и каких-либо кодовых слов-заполнителей последовательность кодовых слов должна оставаться идентичной последовательности, изначально произведенной при кодировании данных. Пусть m = 246, c = 12, r = 24 и k = 32, тогда n = (c × r) - k = (12 × 24) - 32 = 256. Примечание - Обозначения соответствуют указанным выше. Значение дескриптора длины символа n равно 256. Число кодовых слов-заполнителей равно: (n - m) - 1 = 256 - 246 - 1 = 9. В настоящем примере кодовые слова данных (до кодовых слов-заполнителей) начинаются с функции фиксации в режиме цифрового уплотнения (кодовое слово 902) и заканчиваются кодовым словом со значением 423. Все кодовые слова-заполнители являются кодовыми словами 900. Дополнение дескриптором длины символа и кодовыми словами-заполнителями представлено ниже:
4.10 Формирование кодовых слов коррекции ошибокКодовые слова коррекции ошибок формируют с помощью приведенной ниже процедуры и вычисляют на основе значений всех кодовых слов данных, включая дескриптор длины символа и все кодовые слова-заполнители. Последовательность кодовых слов должна быть представлена в виде dn-1, dn-2, ..., d0, где dn-1 - дескриптор длины символа. Полином данных символа представляет собой d(x) = dn-1xn-1 + dn-2xn-2 + , ..., + d1x + d0. Ниже приведено математическое описание вычисления кодовых слов коррекции ошибок для конкретного потока данных и выбранного уровня коррекции ошибок. Все арифметические действия должны быть выполнены по модулю 929. Кодовые слова коррекции ошибок являются дополнением коэффициентов остатка, получающегося в результате деления полинома данных символа d(x), умноженного на xk, на порождающий полином g(x). Отрицательные значения отражаются в поле Галуа GF (929) прибавлением 929 до получения значения ≥ 0. Для вычисления коэффициентов для кодовых слов коррекции ошибок k, необходимых для уровня коррекции ошибок, используют порождающий полином: gk(x) = (x - 3)(x - 32)(x - 33) , ..., (x - 3k) = α0 + α1x + α2x2 + , ..., αk-1xk-1 + xk, где gk(x) - порождающий полином; x - неизвестная переменная; k - общее число кодовых слов коррекции ошибок; αj - коэффициент показателей степеней x, образованный порождающим полиномом gk(x). Пример вычисления коэффициентов приведен в приложении R. В приложении F приведены все значения коэффициентов, необходимые для кодирования символа PDF417 для любого уровня коррекции ошибок. Кодовые слова коррекции ошибок должны вычисляться в соответствии с приведенным ниже алгоритмом с использованием следующих обозначений: di - кодовое слово данных dn-1, ..., d0; Ej - кодовое слово коррекции ошибок Ek-1, ..., E0; αj - коэффициент показателей степени числа x из порождающего полинома (пояснения приведены ниже, а значения - в приложении F); t1, t2, t3 - временные переменные. Алгоритм: 1. Обозначают последовательность кодовых слов данных dn-1, dn-2, ..., d0 2. Устанавливают в исходное состояние кодовые слова коррекции ошибок E0, ..., Ek-1 для значения, равного нулю 3. Для каждого кодового слова данных (data) di = dn-1, ..., d0 t1 = (di + Ek-1) mod 929 для каждого кодового слова коррекции ошибок Ej = Ek-1, ..., E1: t2 = (t1 × αj) mod 929 t3 = 929 - t2 Ej = (Ej-1 + t3) mod 929 t2 = (t1 × α0) mod 929 t3 = 929 - t2 E0 = t3 mod 929 4. Для каждого кодового слова коррекции ошибок Ej = Е0, ..., Ek-1 подсчитывают дополнение: Если Ej не равно нулю Ej = 929 - Ej Пример вычисления кодовых слов коррекции ошибок приведен в приложении S. Альтернативная процедура формирования кодовых слов коррекции ошибок с использованием схемы деления приведена в приложении Т. 4.11 Низкоуровневое кодированиеНизкоуровневое кодирование необходимо для преобразования значений кодовых слов в соответствующие знаки символа (последовательности штрихов и пробелов), при этом матрица символа должна быть фиксированной. На рисунке 8 схематично представлены соответствующие позиции каждого кодового слова данных, кодового слова коррекции ошибок и индикаторов строк для символа PDF417. Обозначения: Lr - левый индикатор строки; Rr - правый индикатор строки; Затененная область - область кодовых слов данных Незатененная область под областью кодовых слов - предназначена для кодовых слов коррекции ошибок Рисунок 8 - Схема размещения кодовых слов типового символа PDF417 4.11.1 КластерыВ PDF417 используют систему распознавания локальной строки для определения перехода от одной строки к другой. Наборы кодовых слов представлены в каждом из трех кластеров. Кластеры имеют номера 0, 3 и 6. В приложении А приведены соответствующие последовательности штрихов и пробелов для каждого знака символа, представляющие каждое кодовое слово и кластер. Для кодирования индикаторов строк и других кодовых слов каждая строка должна содержать знаки символа (комбинации в виде штрихов и пробелов) только одного кластера. В первой строке используют знаки символа из кластера 0, во второй строке - из кластера 3, в третьей строке - из кластера 6, в четвертой строке - из кластера 0 и так далее. Последовательность кластеров 0, 3, 6 должна постоянно повторяться. Номер кластера К для любой строки вычисляют по формуле K = ((номер строки - 1) mod 3) × 3, где строки пронумерованы от 1 до r (в соответствии с 3.2). Так как любые две смежные строки имеют разные кластеры, во время декодирования символа PDF417 декодер может использовать пути сканирования, пересекающие строки. 4.11.2 Определение матрицы символаМатрицу строк и столбцов символа окончательно определяют в соответствии с процедурами, приведенными в 4.9.2. Они обеспечивают получение значений r и c. 4.11.3 Определение значений левого и правого индикаторов строкИндикаторы строк в символе PDF417 - кодовые слова, которые должны кодировать несколько основных параметров: номер строки (F), число строк (r), число столбцов (c) и уровень коррекции ошибок (s). Эта информация должна быть отнесена к трем строкам и цикл должен повторяться непрерывно. Номер строки (F) должен быть закодирован в каждой строке. 4.11.3.1 Левый индикатор строк Левый индикатор строк вычисляют по формулам: при KF = 0; LF = 30 × ((F - 1) div 3) + (r - 1) div 3; при KF = 3; LF = 30 × ((F - 1) div 3) + (s × 3) + (r - 1) mod 3; при KF = 6; LF = 30 × ((F - 1) div 3) + (c - 1), где c, F, r, s и K соответствуют определениям, приведенным в 3.2. 4.11.3.2 Правый индикатор строк Правый индикатор строк вычисляют по формулам: при KF = 0; RF = 30 × ((F - 1) div 3) + (c - 1); при KF = 3; RF = 30 × ((F - 1) div 3) + (r - 1) div 3; при KF = 6; RF = 30 × ((F - 1) div 3) + (s × 3) + (r - 1) mod 3, где c, F, r, s, и K соответствуют определениям, приведенным в 3.2. 4.11.4 Кодирование строкиВ каждой строке должны быть согласованы с номером кластера следующие знаки символа: a) левый индикатор строки; b) знаки символа, представляющие кодовые слова данных и (или) коррекции ошибок, в количестве, равном числу столбцов; c) правый индикатор строки. Знаки СТАРТ и СТОП должны быть одинаковыми для всех строк. Символ должен кодироваться строка за строкой с включением числа c (числа столбцов) кодовых слов в каждой строке. Первая строка должна включать дескриптор длины символа в первом столбце. Последняя строка должна включать частично или полностью кодовые слова коррекции ошибок. 4.12 Компакт PDF417 (Compact PDF417)Символы Компакт PDF417 являются возможным выбором. В случае использования Компакт PDF417 должен соответствовать требованиям приложения G. 4.13 Макро PDF417 (Macro PDF417)Макро PDF417 (Macro PDF417) предусматривает механизм разделения данных в файлах на блоки и представления их более чем в одном символе PDF417. Данный механизм идентичен свойству структурированного соединения в других символиках. Каждый символ Макро PDF417 (Macro PDF417) должен содержать дополнительную управляющую информацию для обеспечения надлежащего восстановления исходного файла данных независимо от последовательности, в которой отдельные символы PDF417 сканируются и декодируются. Для кодирования данных в Макро PDF417 (Macro PDF417) можно использовать до 99999 отдельных символов PDF417. Процедуры Макро PDF417 приведены в приложении G. 4.13.1 Режимы уплотнения и Макро PDF417Управляющий блок Макро PDF417 имеет предопределенный метод кодирования, так что кодовое слово 928 вызывает завершение любой последовательности режима уплотнения в теле символа. Поле индекса сегмента должно быть закодировано в режиме цифрового уплотнения. Каждое определенное необязательное поле Макро PDF417 имеет особые, изначально подразумеваемые режим и подрежим уплотнения, и начало нового необязательного поля служит окончанием режима уплотнения предыдущего поля (в соответствии с H.2.3) и вызывает собственный режим по умолчанию. В частности, даже если два следующих друг за другом необязательных поля используют один и тот же режим текстового уплотнения, когда встречается кодовое слово 923, подрежим прописных букв сбрасывается. 4.13.2 Интерпретации расширенного канала и Макро PDF417В зависимости от ограничений, приведенных в 4.5.3, ECI могут встречаться в сообщениях, закодированных в отдельном символе или в наборе символов Макро PDF417 (Macro PDF417). Любая вызванная ECI должна применяться до окончания закодированных данных или до тех пор, пока не встретится другая ECI. Таким образом, интерпретация ECI может охватить два символа или более. Интерпретация (интерпретации) расширенного канала в теле потока кодовых слов данных не распространяется на управляющий блок Макро PDF417, но возобновляется автоматически в начале следующего символа. Данные управляющего блока интерпретируются с помощью значения ECI по умолчанию (000002) до тех пор, пока управляющие последовательности ECI не будут явно закодированы в необязательном поле в управляющем блоке. Действие любой ECI такого рода автоматически заканчивается при окончании поля, в котором она присутствует. Примечание - При реализации в качестве идентификаторов глобальной метки в соответствии с прежними спецификациями (например, [2] и [3]) кодирование подразумевает возврат к GLI 0 (равнозначному ECI 000000) в начале каждого символа. Если подразумевается, что в следующем символе сохраняется GLI 1, тогда в начале этого следующего символа должен быть явно закодирован GLI 1. В связи с тем, что кодирующие устройства согласованы с этими ранее опубликованными стандартами, которые еще некоторое время будут в использовании, рекомендации по обеспечению совместимости с настоящими требованиями приведены в 4.17.6. 4.14 Рекомендации для пользователя4.14.1 Визуальное представлениеСимволы PDF417 допускают кодирование больших объемов данных, в связи с этим печать визуальных представлений знаков данных может оказаться непрактичной. В качестве альтернативы символ может сопровождать описательный, а не дословный текст. Представление может быть отпечатано в любом месте вокруг символа, но без нарушения символа и свободных зон. Размеры знаков и шрифт не регламентированы настоящим стандартом, но могут устанавливаться в стандартах, регламентирующих требования по применению. 4.14.2 Возможность автоматического распознаванияPDF417 может использоваться в условиях автоматического распознавания с рядом других символик в соответствии с приложением U. 4.14.3 Параметры применения, устанавливаемые пользователемПараметры символов PDF417 должны определять стандарты, регламентирующие требования по применению в соответствии с требованиями, указанными в 4.14.3.1, 4.14.3.2. 4.14.3.1 Символика и размеры Стандарты, регламентирующие требования по применению, должны устанавливать следующие параметры данных и символики, включая размеры: a) выбор и использование интерпретаций расширенного канала, при необходимости, для расширения кодирования данных за пределами интерпретаций по умолчанию базовых режимов, b) объем данных в символе, который может быть фиксированным, переменным или переменным до определенного значения, c) выбор уровня коррекции ошибок, d) диапазон размеров X, e) диапазон размеров Y, f) параметры символа - диапазон допустимых коэффициентов сжатия и (или) соответствие длины или высоты символа (любой из двух) наибольшим размерам. Примечание - Дополнительные факторы, которые следует учитывать при определении применений PDF417, приведены в приложениях Q и U. 4.14.3.2 Требования контроля Параметры оценки символов определяют установлением класса качества в соответствии с ИСО/МЭК 15416 в стандарте, регламентирующем требования по применению. Класс качества выражается в следующей форме: класс/апертура/длина волны в максимуме интенсивности отраженного излучения. Пример представления типов значений, которые необходимо отразить. 1,5/10/660, где - 1,5 - полный класс качества символа; - 10 - ссылочный номер измерительной апертуры (в настоящем примере диаметр 0,25 мм); - 660 - длина волн в максимуме интенсивности отраженного излучения в нанометрах. Примечание - В ИСО/МЭК 15416 определены классы допустимых значений. Значения, соответствующие применению, должны быть установлены в стандарте, регламентирующем требования по применению. 4.14.4 Качество символа PDF417Так как ИСО/МЭК 15416 не охватывает полностью испытания символов PDF417, в приложении J приведены процедуры соответствия. 4.15 Рекомендуемый алгоритм декодированияРекомендуемый алгоритм декодирования для PDF417 приведен в приложении K. Этот алгоритм должен быть основой для любых спецификаций оценки символов штрихового кода PDF417. 4.16 Процедура обнаружения ошибок и коррекции ошибокВ качестве составной части процедуры декодирования возможна реконструкция символа при наличии стираний и ошибок подстановки в пределах возможностей коррекции ошибок символа. Реконструкция может выполняться с помощью процедуры, описанной в приложении L. 4.17 Передаваемые данные4.17.1 Передаваемые данные в базовой интерпретации (по умолчанию)Все кодовые слова данных должны быть переведены в данные для пользователя и переданы в виде 8-битовых байтов независимо от того, находятся ли эти данные в режимах текстового, байтового или цифрового уплотнения. Не подлежат передаче знаки СТАРТ и СТОП, индикаторы строк, дескриптор длины символа, кодовые слова переключения режима, кодовые слова-заполнители и кодовые слова коррекции ошибок. 4.17.2 Протокол передачи для интерпретаций расширенного каналаВ системах, поддерживающих ECI, в каждой передаче должен использоваться префикс идентификатора символики (4.17.5 и приложение М). Управляющие блоки Макро PDF417 (в случае, если они передаются) должны обрабатываться как управляющий набор управляющих последовательностей, который работает совместно с протоколом передачи ECI (4.17.3 и приложение Н). Три кодовых слова (со значениями 925, 926 и 927) являются сигналом для кодирования значения ECI и декодируются как значения байтов следующим образом: 1) если последовательность ECI начинается с кодового слова 927: a) кодовое слово 927 передается в качестве управляющего знака со значением 92, который представляет знак ОБРАТНАЯ ДРОБНАЯ ЧЕРТА (\) при кодировании по умолчанию, b) следующее кодовое слово преобразовано в 6-разрядное значение путем размещения начальных нулей перед кодовым словом. 6-разрядное значение передается как шесть соответствующих значений байтов с десятичными значениями от 48 до 57. Закодировано в символе - [927] [123] Передача данных (десятичные значения байтов) - 92, 48, 48, 48, 49, 50, 51 Интерпретация в знаках КОИ-7 - \000123 2) если последовательность ECI начинается с кодового слова 926: a) кодовое слово 926 передается как управляющий знак с десятичным значением 92, b) следующие два кодовых слова преобразуются в 6-разрядное значение с начальными нулями при необходимости, используя следующую формулу: ([первое кодовое слово] + 1) × 900 + [второе кодовое слово]) 6-разрядное значение передается как шесть соответствующих значений байтов с десятичными значениями от 48 до 57. Закодировано в символе - [926] [136] [156] Передача данных (десятичные значения байтов) - 92, 49, 50, 51, 52, 53, 54 Интерпретация в знаках КОИ-7 - \123456 3) если последовательность ECI начинается с кодового слова 925: a) кодовое слово 925 передается в качестве управляющего знака со значением 92, b) следующее кодовое слово преобразовано в 6-разрядное значение прибавлением к нему значения 810900. 6-разрядное значение передается как шесть соответствующих значений байтов с десятичными значениями от 48 до 57. Закодировано в символе - [925] [456] Передача данных (десятичные значения байтов) - 92, 56, 49, 49, 51, 53, 54 Интерпретация в знаках КОИ-7 - \811356 Процедура повторяется для каждого случая интерпретации расширенного канала. Прикладное программное обеспечение, распознающее 7-байтовую управляющую последовательность по знаку со значением 92, при помощи 6 байтов (каждый из диапазона знаков со значениями от 48 до 47) должно интерпретировать все последовательные знаки до окончания закодированных данных или до тех пор, пока не встретится другой отдельный байт со значением 92 в качестве байта из интерпретации расширенного канала, определенной 6-разрядной последовательностью. Если знак ОБРАТНАЯ ДРОБНАЯ ЧЕРТА или другой знак, представленный байтом со значением 92, необходимо использовать в качестве закодированных данных, передача должна происходить в соответствии с приведенным примером. Если байт со значением 92 появляется в качестве данных, должны быть переданы два байта этого значения; таким образом единичное появление всегда является управляющим знаком, а двоичное появление означает достоверные данные. Закодированные данные - А\\В\С Передача - A\\\\B\\C 4.17.3 Передача данных для Макро PDF417Протокол передачи данных для Макро PDF417 (Macro PDF417) приведен в Н.6. 4.17.4 Передача зарезервированных кодовых слов с использованием протокола интерпретации расширенного каналаПри работе под протоколом передачи ECI декодеры PDF417 должны передавать управляющую последовательность ECI из 6 байтов зарезервированных кодовых слов (интерпретируемых как \CnnnC), представляющую управляющий знак (со значением 92), за которым следует С (значение 67), три разряда, которые представляют десятичное значение зарезервированного кодового слова и за которыми следует другое С, завершающее управляющую последовательность ECI независимым от символики способом. Кодовые слова данных, следующие за зарезервированным кодовым словом, не интерпретируются декодером в соответствии с любым режимом уплотнения, но вместо этого передаются как серии управляющих последовательностей, представляющие кодовые слова с использованием той же 6-байтовой управляющей последовательности, указанной ранее. Все оставшиеся кодовые слова данных передаются этим же способом до тех пор, пока не будут достигнуты: - окончание закодированных данных в символе; - функция фиксации в распознанном режиме уплотнения; - функциональное кодовое слово управляющего блока Макро PDF417 (928, 923, 922). Кодовое слово 913 (регистр в режиме байтового уплотнения) разрешено только из режима текстового уплотнения, и, таким образом, не может быть частью потока кодовых слов в процессе отправки неинтерпретируемых управляющих кодовых слов. Примечание - Этот протокол может правильно передавать синтаксис сообщения для любых зарезервированных кодовых слов, для которых будущие определения представляют собой обеспечение сигнальных функций или представления новых режимов уплотнения. 4.17.5 Идентификатор символикиПосле определения структуры данных (в виде Макро PDF417, ECI и т.д.) в качестве преамбулы к переданным декодером данным должен быть добавлен идентификатор символики. Идентификаторы символики для PDF417 приведены в приложении М. 4.17.6 Передача, использующая устаревшие протоколыВведение системы интерпретаций расширенного канала в некоторые символики оказало воздействие на ранее существовавшие символики, включая PDF417. Основные правила кодирования и декодирования в настоящем стандарте остались теми же, что и в версиях PDF417 [2] и [3]. Передача для ECI и Макро PDF417 отличается по своему формату, но передает равнозначную информацию. Новое оборудование и прикладное программное обеспечение, декодирующее PDF417, должно соответствовать настоящему стандарту. Однако соответствие оборудования ранее опубликованным стандартам будет действовать в течение нескольких лет. Пользователям, генерирующим символы PDF417, не придется вносить никаких изменений, так как закодированные символы имеют равнозначные значения вне зависимости от поколения используемого декодирующего оборудования. В приложении N приведены правила, которыми необходимо руководствоваться при использовании декодирующего оборудования и прикладного программного обеспечения, которые не соответствуют современным символам с ECI и Макро PDF417. Таким образом старое и новое оборудование могут сосуществовать. ПРИЛОЖЕНИЕ А(обязательное) Кодирование/декодирование последовательностей штрихов и пробелов знаков символа PDF417В таблице А.1 установлены значения каждого кодового слова и последовательности штрихов и пробелов для знаков символа в кластерах 0, 3 и 6. Значения e, используемые на этапе декодирования, могут быть получены из последовательности штрихов и пробелов по формуле ei = xi + xi+1. Таблица А.1 - Последовательность штрихов и пробелов
ПРИЛОЖЕНИЕ B(обязательное) Набор знаков по умолчанию для режима байтового уплотненияНабор знаков по умолчанию для режима байтового уплотнения приведен в таблице B.1. Таблица B.1 - Набор знаков по умолчанию для режима байтового уплотнения
Примечания 1 д.з. - десятичное значение знака версии КОИ-8. 2 Первая половина набора знаков (с десятичными значениями от 0 до 127) соответствует ИСО/МЭК 646 (соответствует [4]). Вторая половина (с десятичными значениями от 128 до 255) соответствует кодовой странице РС437. ПРИЛОЖЕНИЕ С(обязательное) Алгоритм кодирования режима байтового уплотненияЭто преобразование следует использовать в режиме байтового уплотнения. С его помощью могут быть преобразованы шесть байтов данных в пять кодовых слов данных PDF417 по уравнению b5 × 2565 + b4 × 2564 + b3 × 2563 + b2 × 2562 + b1 × 2561 + b0 × 2560 = d4 × 9004 + d3 × 9003 + d2 × 9002 + d1 × 9001 + d0 × 9000, где b - десятичное значение байта данных (от 0 до 255); d - кодовое слово данных. Для преобразования базы 256 в базу 900 может быть использован следующий алгоритм: 1. принимают t в качестве временной переменной 2. вычисляют t = b5 × 2565 + b4 × 2564 + b3 × 2563 + b2 × 2562 + b1 × 2561 + b0 × 2560 3. каждое кодовое слово вычисляют следующим образом: для каждого кодового слова данных di = d0 ... d4 di = t mod 900 t = t div 900 Требуется закодировать знаки данных в режиме байтового уплотнения b5, ..., b0 {231, 101, 11, 97, 205, 2} Вычисляют сумму t с использованием десятичных значений шести знаков в режиме байтового уплотнения: t = 231 × 2565 + 101 × 2564 + 11 × 2563 + 97 × 2562 + 205 × 2561 + 2 × 2560 = 254421168672002 Вычисляют кодовое слово 0 d0 = 254421168672002 mod 900 = 302 t = 254421168672002 div 900 = 282690187413 Вычисляют кодовое слово 1 d1 = 282690187413 mod 900 = 213 t = 282690187413 div 900 = 314100208 Вычисляют кодовое слово 2 d2 = 314100208 mod 900 = 208 t = 314100208 div 900 = 349000 Вычисляют кодовое слово 3 d3 = 349000 mod 900 = 700 t = 349000 div 900 = 387 Вычисляют кодовое слово 4 d4 = 387 mod 900 = 387 t = 387 div 900 = 0 Последовательность кодовых слов d4, ..., d0 представляет собой 387, 700, 208, 213, 302 ПРИЛОЖЕНИЕ D(обязательное) Алгоритм кодирования режима цифрового уплотненияЭто преобразование должно использоваться в режиме цифрового уплотнения. С его помощью могут быть преобразованы группы, содержащие до 44 последовательных цифровых разрядов включительно, в 15 (или менее) кодовых слов данных PDF417. Для преобразования базы 10 в базу 900 может быть использован следующий алгоритм: a) принимают t в качестве временной переменной b) устанавливают начальное значение t в виде группы последовательных цифровых разрядов, количество которых доходит до 44, которой предшествует единица c) каждое кодовое слово вычисляют в следующем порядке: Для каждого кодового слова данных di = d0, ..., dn-1 di = t mod 900 t = t div 900 Если t = 0, то кодирование прекращается Требуется закодировать числовую цепочку из 15 цифр 000213298174000. В начале числовой цепочки ставят 1 и устанавливают исходное значение в виде: t = 1000213298174000 Вычисляют кодовое слово 0 d0 = 1000213298174000 mod 900 = 200 t = 1000213298174000 div 900 = 1111348109082 Вычисляют кодовое слово 1 d1 = 1111348109082 mod 900 = 282 t = 1111348109082 div 900= 1234831232 Вычисляют кодовое слово 2 d2 = 1234831232 mod 900 = 632 t = 1234831232 div 900 = 1372034 Вычисляют кодовое слово 3 d3 = 1372034 mod 900 = 434 t = 1372034 div 900 = 1524 Вычисляют кодовое слово 4 d4 = 1524 mod 900 = 624 t = 1524 div 900 = 1 Вычисляют кодовое слово 5 d5 = 1 mod 900 = 1 t = 1 div 900 = 0 Последовательность кодовых слов d5, ..., d0 представляют в виде: 1, 624, 434, 632, 282, 200 ПРИЛОЖЕНИЕ Е(обязательное) Выбор пользователем уровня коррекции ошибокE.1 Рекомендуемый минимальный уровень коррекции ошибок Минимальный уровень коррекции ошибки должен соответствовать приведенному в таблице Е.1. Таблица Е.1 - Рекомендуемый уровень коррекции ошибок
Для приблизительного подсчета количества кодовых слов данных из содержания данных при использовании таблицы Е.1 следует использовать 1,8 текстовых знаков на кодовое слово данных в режиме текстового уплотнения, 2,9 цифры на кодовое слово данных в режиме цифрового уплотнения и 1,2 байта на кодовое слово данных в режиме байтового уплотнения. Если возможны значительные повреждения изображения символа, следует использовать более высокие уровни коррекции ошибок. В замкнутых системах применений могут использоваться уровни коррекции ошибок ниже рекомендуемых. E.2 Прочие факторы, принимаемые во внимание пользователем при выборе уровня коррекции ошибок Целью прикладного стандарта, регламентирующего требования по применению, должно быть использование особенностей исправления ошибок без уменьшения емкости для данных. При выборе уровня коррекции ошибок пользователь должен учитывать следующие факторы: 1) должен выбираться рекомендуемый уровень коррекции ошибок (в соответствии с таблицей Е.1); 2) в связи с тем, что наибольшее количество кодовых слов данных в символе составляет 925, большое количество кодовых слов данных ограничивает наивысший уровень коррекции ошибок, который может быть использован. Количество кодовых слов данных более 415 исключает применение уровня коррекции ошибок 8. Количество кодовых слов данных более 799 исключает применение уровней 6, 7 и 8. Количество кодовых слов данных более 863, исключает уровень коррекции ошибок 5. Следовательно, не рекомендуется увеличивать число кодовых слов до 863; 3) при высокой вероятности того, что в символах PDF417 возможны недостающие или полностью стертые кодовые слова, уровень коррекции ошибок может быть увеличен до уровня 8 или более высокого уровня, при котором количество кодовых слов коррекции ошибок заполняет матрицу максимального размера, допустимого применением; 4) более предпочтительным является поддержка высокого качества печати символа, по сравнению с компенсацией низкого качества печати увеличением уровня коррекции ошибки. Вместо выбора наивысшего уровня коррекции ошибок рекомендуется установить больший размер X или специальную подложку и материалы, способные обеспечить высокое качество печати символа PDF417. ПРИЛОЖЕНИЕ F(обязательное) Таблицы коэффициентов для вычисления кодовых слов коррекции ошибок PDF417В таблицах F.1 - F.9 приведены коэффициенты для вычисления кодовых слов коррекции ошибок для уровней коррекции ошибок от 0 до 8. Таблица F.1 - Коэффициенты для уровня коррекции ошибок 0
Таблица F.2 - Коэффициенты для уровня коррекции ошибок 1
Таблица F.3 - Коэффициенты для уровня коррекции ошибок 2
Таблица F.4 - Коэффициенты для уровня коррекции ошибок 3
Таблица F.5 - Коэффициенты для уровня коррекции ошибок 4
Таблица F.6 - Коэффициенты для уровня коррекции ошибок 5
Таблица F.7 - Коэффициенты для уровня коррекции ошибок 6
Таблица F.8 - Коэффициенты для уровня коррекции ошибок 7
Таблица F.9 - Коэффициенты для уровня коррекции ошибок 8
ПРИЛОЖЕНИЕ G(обязательное) Компакт PDF417Компакт PDF417 (Compact PDF417) можно использовать в тех случаях, когда обеспечение поверхности соответствующего размера для нанесения символа является предметом первостепенной важности и маловероятно повреждение символа. Если повреждение символа маловероятно (например, в условиях офиса), можно исключить правые индикаторы строк и сократить комбинацию штрихов и пробелов знака СТОП до штриха шириной в один модуль в соответствии с рисунком G.1. Эта процедура сокращает объем кодовых слов, не относящихся к данным, с четырех кодовых слов на строку до двух, с некоторым компромиссом в части выполнения декодирования и устойчивости или способности противостоять помехам, повреждениям, пыли и т.д. Рисунок G.1 - Компакт PDF417 Эта версия уменьшения кодовых слов, не относящихся к данным, именуется Компакт PDF417, символ которого полностью совместим в процессе декодирования с типовым PDF417. Символ Компакт PDF417, имеющий менее 6 строк, кодирует число столбцов только в одном кодовом слове, которое не учитывается при коррекции ошибок и, поэтому он особенно уязвим при плохом качестве печати или повреждении. Примечание - В предыдущих версиях PDF417 (например, в [2] и [3]), использовался термин «Сжатый PDF417» (Truncated PDF417). Термин Компакт PDF417 (Compact PDF417) является более предпочтительным во избежание путаницы с общим использованием термина «сжатый» (‘truncated’). ПРИЛОЖЕНИЕ H(обязательное) Макро PDF417H.1 Обзор Макро PDF417 Макро PDF417 (Macro PDF417) предусматривает стандартный механизм создания распределенного представления файлов, слишком больших для того, чтобы быть представленными в отдельном символе PDF417. Символы Макро PDF417 отличаются от обычных символов PDF417 тем, что они содержат дополнительную управляющую информацию в управляющем блоке Макро PDF417. При использовании Макро PDF417 большие файлы данных разделяются на несколько сегментов файла и кодируются в отдельных символах. Управляющий блок определяет идентификацию файла, последовательность соединения, а также иную нестандартную информацию о файле. Декодер Макро PDF417 использует информацию управляющего блока для точного восстановления файла независимо от того, в каком порядке был отсканирован символ. H.2 Синтаксис Макро PDF417 Каждый символ Макро PDF417 должен кодировать управляющий блок Макро PDF417, в котором содержится управляющая информация. Управляющий блок начинается с кодового слова Макро маркера (Macro marker) (значение 928). Управляющий блок следует за блоком данных, с которым он связан; число кодовых слов в управляющем блоке Макро PDF417 учитывают как данные и включают в значение дескриптора длины символа. Окончание управляющего блока Макро PDF417 идентифицируется началом кодовых слов коррекции ошибок. Примечание - Символ, не содержащий данных пользователя, отличных от управляющего блока Макро PDF417, является действительным символом. Управляющий блок Макро PDF417 должен содержать не менее двух обязательных полей: индекса сегмента (segment index) и идентификации файла (file ID). Он также может содержать ряд необязательных полей (H.2.3). На рисунке H.1 показано расположение управляющего блока в символе Макро PDF417. Схема стандартного символа PDF417 Рисунок Н.1 Схемы символов PDF417 H.2.1 Индекс сегмента В Макро PDF417 каждый символ представляет сегмент целого файла. Для восстановления целого файла сегменты необходимо разместить в определенном порядке. Этот процесс облегчает управляющая информация, содержащаяся в управляющем блоке Макро PDF417. Для файла, разделенного на множество j символов Макро PDF417, поле индекса сегмента (segment index) в каждом управляющем блоке Макро PDF417 символа содержит значения от 0 до j - 1, соответствующие относительной позиции содержимого этого символа внутри распределенного представления. Поле индекса сегмента состоит из поля длиной в два кодовых слова и кодируется с помощью режима цифрового уплотнения в соответствии с 4.4.4. Значение индекса сегмента должно быть дополнено начальными нулями до пяти разрядов до применения режима цифрового уплотнения. Переключение в режим цифрового уплотнения не требует явной фиксации в режиме (кодового слова 902). Самое большое допустимое значение в поле индекса сегмента равно 99998. Таким образом, распределенное представление файла данных может содержать до 99999 символов Макро PDF417. Примечание - При переводе в объем информации 99999 символов составят примерно 110 млн байтов данных в режиме байтового уплотнения, или 184 млн знаков в режиме текстового уплотнения, или около 300 млн знаков в режиме цифрового уплотнения. H.2.2 Поле идентификации файла Для каждого связанного символа Макро PDF417 поле идентификации файла (file ID) содержит одно и то же значение. Оно обеспечивает соответствие всех воссоединенных данных символов одному распределенному представлению файла. Идентификация файла имеет поле переменной длины, которое начинается с первого кодового слова, следующего за индексом сегмента, и продолжается до начала необязательных полей (если таковые присутствуют) или до окончания управляющего блока Макро PDF417 (в случае отсутствия необязательных полей). Каждое кодовое слово в идентификации файла может иметь значение от 0 до 899, эффективно создавая серии идентификации файла для номеров базы 900. Каждое кодовое слово серии передается в качестве 3-разрядного десятичного значения представления КОИ-7. Примечание - На эффективность схемы идентификации файла влияет длина поля идентификации файла и соответствие алгоритма, используемого для генерирования значения идентификации файла. Необязательные поля (optional field) могут следовать после идентификации файла. Каждое необязательное поле начинается со специальной последовательности-указателя (tag sequence) и продолжается до начала следующего необязательного поля (если таковое присутствует) или окончания управляющего блока (если отсутствует следующее необязательное поле). Последовательность-указатель состоит из кодового слова 923, за которым следует отдельное кодовое слово указателя поля (field designator). В каждом необязательном поле данные, следующие за последовательностью-указателем, имеют интерпретацию, обусловленную спецификой поля. Не следует использовать пустые необязательные поля. В таблице H.1 представлено соответствие между текущими заданными указателями полей и необязательным содержимым полей. Каждое необязательное поле начинается с подразумеваемого возврата к режиму уплотнения, представленному в таблице H.1, и с подразумеваемого возвращения к ECI 000002 (или GLI 0 для кодирующих устройств, соответствующих ранее опубликованным стандартам PDF417). Управляющая последовательность ECI и функции фиксации в режиме и регистра в режиме могут быть использованы, но только в необязательных полях, изначально находящихся в режиме текстового уплотнения. Таблица H.1 - Указатели необязательных полей Макро PDF417
Примечания 1 Y в графе «Фиксированный режим уплотнения» означает, что в этом поле не допускается использовать никакие функции фиксации в режиме и регистра в режиме. 2 В последней графе «Общее число кодовых слов» учитывают последовательность-указатель из двух кодовых слов. Эти поля всегда представляют параметры глобального файла и поэтому не нуждаются в представлении в управляющем блоке более чем в одном символе Макро PDF417 в пределах распределенного представления файла, за исключением поля числа сегментов (segment count), в соответствии с представленным ниже. Сегмент, который содержит эти поля, задается специальной реализацией кодирующего устройства. Если особое поле подлежит появлению более чем в одном сегменте, оно должно идентично появиться в каждом сегменте. Не существует определенного порядка для необязательных полей. В соответствии с таблицей H.1 все необязательные поля используют стандарт высокоуровневого кодирования PDF417. Действующий режим по умолчанию в начале каждого поля должен быть задан в таблице H.1 безотносительно к функциям фиксации в режиме и регистра в режиме, ранее присутствующим в символе. Особое построение необязательного поля должно соответствовать нижеследующему: - поле числа сегментов (segment count) (идентифицирующее общее количество символов PDF417 в распределенном файле) может содержать значения от 1 до 99999 и должно быть закодировано как два кодовых слова. Если используют необязательное поле числа сегментов, то оно должно быть представлено в каждом сегменте; - поле отметки времени подлежит интерпретации в режиме цифрового уплотнения. Оно указывает отметку времени в исходном файле, и выглядит как астрономическое время работы в секундах, начиная с 1970:01:01:00:00:00 по Гринвичу (т.е. 00:00:00 среднего времени по Гринвичу на 1 января 1970 г.). Используя данный формат, четыре кодовых слова могут закодировать любую дату в пределах следующих 200 столетий; - поле размера файла (file size) содержит размер в байтах исходного единого файла; - поле контрольной суммы (checksum) содержит значение контрольной суммы 16-битного (2 байта) циклически избыточного кода (CRC), использующей полином CCITT - 16 x16 + x12 + x5 + 1, вычисленный по всему исходному единому файлу. Примечания 1 Размер файла и контрольную сумму следует вычислять из исходного файла до прибавления любых управляющих последовательностей ECI, используемых для кодирования интерпретаций расширенного канала. Имеется в виду, что если приемное устройство проверяет контрольную сумму после осуществления приема, исходный файл должен быть дословно восстановлен. Это требуется исключительно для проверки данной необязательной контрольной суммы, чтобы не проводились никакие задаваемые пользователем или необязательные преобразования потока байтов даже в том случае, когда проверка может быть выполнена в процессе декодирования ECI. 2 Если используют CRC, вычисление может быть выполнено до отправки данных к принтеру или в самом принтере на основе возможностей принтера. Значения указателя поля больше 6 в настоящее время не заданы. Однако оборудование, декодирующее PDF417, должно декодировать и передавать любые встречающиеся необязательные поля со значением указателя поля от 7 до 9 (значение байта от 55 до 57) или от A до Z (значения байта от 65 до 90) путем обработки данных поля в качестве данных, исходно находящихся в режиме текстового уплотнения и имеющих переменную длину. H.2.4 Ограничитель Макро PDF417 Управляющий блок в символе, представляющем последний сегмент файла Макро PDF417, содержит особый маркер (называемый ограничителем Макро PDF417 - Macro PDF417 terminator), состоящий из кодового слова 922 в конце управляющего блока. Управляющий блок любого иного символа должен оканчиваться после любых необязательных полей, не имеющих специального ограничителя. H.3 Рассмотрение высокоуровневого кодирования Несмотря на то, что Макро PDF417 подразумевает механизм логического связывания множества символов, при высокоуровневом кодировании PDF417 каждый символ должен оставаться отдельным объектом. Таким образом сфера действия переключения режима должна ограничиваться рамками символа, в котором она возникла. Каждый символ должен обязательно начинаться в подрежиме прописных букв режима текстового уплотнения. Два обязательных поля закодированы следующим образом: поле индекса сегмента закодировано в режиме цифрового уплотнения, а поле идентификации файла кодируется как последовательность чисел базы 900. В контексте необязательного поля управляющего блока режимы уплотнения, указанные в таблице H.1, должны замещать текущие режимы, заданные кодовыми словами идентификатора режима в пределах области кодовых слов данных символа. Однако сфера действия текущей интерпретации расширенного канала переходит через управляющий блок Макро PDF417 к началу следующего символа Макро PDF417. Каждое поле управляющего блока Макро начинается с подразумеваемого возврата к ECI 000002 (или GLI 0 для устройств кодирования, совместимых с ранее опубликованными стандартами PDF417). Также должна быть возможность установить другую ECI внутри необязательного поля управляющего блока в режиме текстового уплотнения, например, для правильного представления греческого имени получателя. Управляющую последовательность ECI можно разместить в любой допустимой позиции (4.5.3) после кодового слова 923 (начало необязательного поля Макро PDF417 - Beginning of Macro PDF417 Optional Field). H.4 Пример кодирования Приведенный пример показывает кодирование управляющего блока Макро PDF417: Комплект Макро PDF417 кодирует в общей сложности 4567 байт, заданных пользователем данных в четырех символах PDF417 (или сегментах файлов). Другие «заголовки» данных, подлежащие кодированию: - идентификация файла = 17база 900 53база 900, - число сегментов, подлежащих использованию, - отправитель: CEN BE, - получатель: ISO CH. Примечание - Поля: число сегментов, отправитель и получатель - являются тремя необязательными полями, выбираемыми пользователем. При условии, что кодирующее устройство располагает необязательные поля в первом символе, кодирование управляющего блока Макро PDF417 в этом символе должно соответствовать приведенному ниже: [последнее кодовое слово данных] [928]A [111] [100]B [017] [053]C [923] [001]D [111] [104]E [923] [003]F [064] [416] [034]G [923] [004]H [258] [446] [067]I [первое кодовое слово коррекции ошибок] ... В последнем из четырех символов будет следующий управляющий блок Макро PDF417: [последнее кодовое слово данных] [928]A [111] [103]В [017] [053]C [923] [001]D [111] [104]E [922]J [первое слово коррекции ошибок], где A - кодовое слово макро-маркера (Macro marker), B - идентификация сегмента файла (File Segment ID). Сегменты файла пронумерованы от 0 до j - 1 и закодированы с использованием режима цифрового уплотнения. 1-й сегмент = 00000 = кодовые слова со значениями 111, 100 4-й сегмент = 00003 = кодовые слова со значениями 111, 103 C - идентификация файла по базе 900 D - признак поля числа сегментов E - число сегментов F - признак поля отправителя G - поле отправителя, кодирующее CEN BE H - признак поля получателя I - поле получателя, кодирующее ИСО СН J - ограничитель Макро PDF417. H.5 Макро PDF417 и протокол интерпретации расширенного канала Независимый от символики протокол интерпретации расширенного канала (протокол ECI) был разработан после того, как PDF417 был регламентирован как символика. PDF417 поддерживал собственную систему идентификаторов глобальной метки (GLI), предшественницу и базу протокола ECI, с самой первой публикации спецификаций символики в 1994 г. ([2] и [3]). Поэтому следует принять во внимание ранние внедрения GLI. Существуют два обстоятельства, которые следует учитывать: - GLI 0 и GLI 1 (равнозначные ECI 000000 и ECI 000001) были только интерпретациями, установленными в исходных спецификациях PDF417 ([2] и [3]). Прежние правила для Макро PDF417 приведены в H.5.1; - иные назначения ECI, использование которых совместно с Макро PDF417 приведено в H.5.2. H.5.1 Макро PDF417 с интерпретациями расширенного канала 000000 и 000001 (GLI 0 и GLI 1) Так как GLI были действительной частью исходной спецификации PDF417 ([2] и [3]), является логичным наличие кодирующих устройств GLI и Макро PDF417, объединенных в одну единицу. Исходная спецификация ([2] и [3]) к символике PDF417 вызывала обязательную логическую схему с возвратом к GLI в начале второго и последующего символов Макро PDF417; таким образом, каждый символ должен начинаться с интерпретации по умолчанию. В случае GLI 0 и GLI 1 (эквивалентным ECI 000000 и ECI 000001) это не оказывает никакого внутреннего воздействия на кодирование. Однако для некоторых сложных интерпретаций расширенного канала логическую схему с возвратом к GLI 0 трудно реализовать независимым от символики способом. Кодирующее программное обеспечение, соответствующее исходной спецификации для Макро PDF417 и GLI 0 и GLI 1, полностью подходит для ранее существовавших применений, а также применений GLI, задаваемых пользователем (теперь именуемых ECI), так как сфера действия системы по определению является ограниченной. Все ECI, имеющие нумерацию 000002 или выше, не должны быть заданы логической схемой с возвратом к GLI 0. Следовательно, символы PDF417 не должны смешивать ECI 000000 и ECI 000001 с интерпретациями расширенного канала, имеющими более высокую нумерацию (за исключением закрытых систем). H.5.2 Макро PDF417 и прочие интерпретации расширенного канала Кодирующее устройство ECI может быть независимым от символики и генерировать поток байтов для ввода данных в кодирующее устройство символики PDF417. Кодирующее устройство ECI должно работать так, как если бы имелся отдельный поток данных независимо от размера файла. Таким образом, после вызова ECI должна сохраняться через сегменты до появления другой ECI или окончания закодированных данных. Это необходимо, например, в случае, где назначение ECI представляет схему шифрования, в которой не приемлем возврат в GLI 0. Кодирующим устройствам Макро PDF417, соответствующим настоящему стандарту, нет необходимости кодировать преобладающую ECI в начале следующих символов PDF417. Примечание - Может понадобиться проведение нескольких итераций для генерации логической схемы кодирования окончания символа, например режим цифрового уплотнения не должен растягиваться на два сегмента, но два отдельных блока режима цифрового уплотнения могут быть закодированы в окончании одного символа и в начале следующего. Эти условия относятся к Макро PDF417 и высокоуровневому кодированию (в соответствии с H.3), а не относятся к Макро PDF417 и ECI. H.6 Передача данных Макро PDF417 Передача информации управляющего блока Макро PDF417 должна трактоваться так же, как интерпретируемые ECI. Независимый от символики протокол ECI приведен ниже; исходный протокол PDF417 приведен в приложении N. Несмотря на то, что управляющий блок Макро PDF417 кодируется в конце данных символа, при использовании протокола ECI он передается перед данными символа. Три кодовых слова (922, 923 и 928) отмечают кодирование управляющего блока Макро PDF417 или одной из его составных частей. Декодирование происходит следующим образом: 1) если последовательность начинается с кодового слова 928 (макро-маркер): a) кодовое слово 928 передается в качестве управляющей последовательности 92, 77, 73, которую представляет \MI в интерпретации по умолчанию; b) следующие два кодовых слова идентифицируют индекс сегмента. Они закодированы в режиме цифрового уплотнения и декодируются как 5-разрядное число в диапазоне от 00000 до 99998; c) следующие кодовые слова кодируют поле идентификации файла, которое должно быть одинаковым для всех связанных символов Макро PDF417. Поле идентификации файла оканчивается кодовым словом 922 или 923, или завершается с окончанием закодированных данных в символе. Каждое кодовое слово преобразуется в 3-разрядное число в диапазоне 000 - 899 (т.е. номер кодового слова) и передается как три значения байтов (с десятичными значениями в диапазоне от 48 до 57) после управляющего заголовка: 92, 77, 70, который представлен \MF в интерпретации по умолчанию; 2) если последовательность начинается с кодового слова 923 (начало необязательного поля Макро PDF417): a) кодовое слово 923 передается как управляющая последовательность 92, 77, 79, которая представлена \МО в интерпретации по умолчанию; b) следующее кодовое слово представляет один из указателей необязательного поля (field designator), приведенных в таблице H.1, передается как отдельный байт, представляющий значение знака КОИ для указателя; c) следующие кодовые слова несут содержимое данных указателя необязательного поля. Необязательное поле оканчивается кодовым словом 922 или 923, или с окончанием закодированных данных в символе. Промежуточные кодовые слова следует преобразовывать в соответствии с правилами декодирования соответствующего режима уплотнения, приведенными в таблице H.1. Полученные в результате данные могут иметь переменную длину; 3) при идентификации ограничителя Макро PDF417 (кодовое слово 922) следует передать управляющую последовательность 92, 77, 90, которая представлена \MZ в интерпретации по умолчанию; 4) в конце управляющего блока Макро PDF417, как определено для окончания кодируемых данных в символе, следует передать управляющую последовательность 92, 77 89, которая представлена \MZ в интерпретации по умолчанию. Примечание - Эта управляющая последовательность не является явно закодированной в символе. Все поля управляющего блока Макро PDF417 для символа (сегмента) должны быть переданы как единый блок, начинающийся с \МI... и оканчивающийся \MY. Передача управляющего блока Макро PDF417 должна предварять передачу остатка закодированного сегмента файла даже в том случае, если управляющий блок Макро PDF417 закодирован в конце символа. Управляющий блок Макро PDF417 для первого символа, индекс сегмента = 0 и идентификация файла (100, 200, 300) будут закодированы в символе как последовательность кодовых слов: [928] [111] [100] [100] [200] [300] Она будет передаваться следующим образом: передача данных (байты): 92, 77, 73, 48, 48, 48, 48, 48, 92, 77, 70, 49, 48, 48, 50, 48, 48, 51, 48, 48, 92, 77, 89 интерпретация в знаках КОИ-7: \MI00000\MF100200300\МY После сканирования символов Макро PDF417 функция депакетирования восстановит исходное сообщение с учетом того, что символы могли быть сканированы не по порядку. Если система работает в буферизованном режиме, функция депакетирования находится в декодере; при работе в небуферизованном режиме эта функция находится в системе приема. Декодеры должны предусматривать специфичный для каждого декодера метод, посредством которого обработка заданной идентификации файла Макро PDF417 (Macro PDF417) может быть отменена таким образом, чтобы позволить декодеру начать обработку новой идентификации файла. Это необходимо для предотвращения условий блокировки, которая может возникнуть при потере или невозможности декодирования одного или более символов заданной идентификации файла. H.6.1 Работа в буферизованном режиме При работе в буферизованном режиме (buffered mode) депакетизация должна выполняться в декодере/считывающем устройстве. В зависимости от конфигурации оборудования он будет отправлять: - восстановленные данные, без управляющего блока Макро PDF417 или - один управляющий блок Макро PDF417 (который сам по себе может быть восстановлен для включения всех необязательных полей, присутствующих в любых символах) для нахождения в начале всего закодированного сообщения. Полученный в результате управляющий блок Макро PDF417 должен иметь свое поле индекса Макро (Macro Index) со значением, равным 0, и должен включать в себя поле окончания файла Макро (Macro-end-of-file) (в сущности, для обозначения всего восстановленного сообщения как первый и единственный Макро сегмент псевдосерий). H.6.2 Работа в небуферизованном режиме В небуферизованном режиме (unbuffered mode) депакетирование должно быть выполнено в системе приема. Каждый переданный управляющий блок Макро PDF417 должен представлять все обязательные и необязательные поля, которые в действительности закодированы в символе. При конфигурировании в небуферизованном режиме декодер может иметь необязательную конфигурацию, допускающую, чтобы последовательные символы имели одну идентификацию файла (File ID). Эта процедура может быть целесообразной только в том случае, если декодер сконфигурирован для передачи управляющего блока Макро PDF417 в систему приема, и эта система приема разработана для отслеживания идентификации файла управляющего блока Макро PDF417 с целью определения, когда был обработан весь файл. Символы с разной идентификацией файлов или без нее (например, отдельный символ, не являющийся частью комплекта символов Макро PDF417) должны рассматриваться в соответствии с установками системы приема. Для облегчения контроля того, что все символы набора символов Макро PDF417 (Macro PDF417) были получены в небуферизованном режиме, следует всякий раз, когда возможно, использовать необязательное поле числа сегментов как часть закодированного Управляющего блока Макро PDF417. H.6.3 Передача с возвратом к нулю В связи с тем, что в [2] и [3] были определены правила для GLI 0 и GLI 1, которые незначительно отличаются от правил для ECI, считывающее устройство, соответствующее этому международному стандарту, должно эмитировать особые управляющие последовательности при передаче символов, содержащих явные вызовы GLI 1, в двух ситуациях: 1) декодер должен передавать управляющую последовательность GLI 0 или управляющую последовательность ECI 000000 (в зависимости от того, какой протокол передачи запрограммирован для использования) после передачи данных любого символа Макро PDF417, данные которого заканчиваются в интерпретации GLI 1 (ECI 000001); 2) декодер должен передавать GLI 1 (ECI 000001) в начале каждого необязательного поля переменной длины, закодированного в режиме текстового уплотнения в управляющем блоке Макро PDF417, если данные, предваряющие это поле, заканчиваются в интерпретации GLI 1 (ECI 000001). Это требование применяется вне зависимости от режима (буферизованного или небуферизованного) и вне зависимости от того, использование какого из двух протоколов для передачи запрограммировано в декодере (протокола ECI или исходного протокола PDF417). ПРИЛОЖЕНИЕ J(обязательное) Испытание качества символа PDF417Поскольку в настоящее время ИСО/МЭК 15416 еще не полностью регламентирует испытание символов PDF417, для оценки символов PDF417 следует использовать процедуры, приведенные в J.1 - J.3. J.1 Класс, основанный на знаках СТАРТ и СТОП Знаки СТАРТ и СТОП PDF417 подлежат оценке в соответствии с ИСО/МЭК 15416 с использованием размера апертуры, указанного в соответствующем стандарте по применению. Следует использовать рекомендуемый алгоритм декодирования (в соответствии с K.2) для оценки параметров «декодирование» и «декодируемость» знаков СТАРТ и СТОП. Контрольные сканирования PDF417 должны быть классифицированы с использованием этих алгоритмов. Примечание - Этот метод не обеспечивает полной классификации качества символов PDF417 (J.2). При выполнении измерения линии сканирования должны быть перпендикулярны к знакам СТАРТ и СТОП. Это измерение для знака СТАРТ и СТОП может использоваться для целей управления процессом. Этот метод не должен быть чувствительным к отклонениям при печати, параллельным знакам СТАРТ и СТОП. Если требуется полный анализ процесса нанесения, то символы PDF417 должны быть напечатаны и проконтролированы при двух ориентациях. J.2 Класс, основанный на знаках символа Эта оценка основана на анализе всего символа PDF417, отсканированного с помощью подходящей апертуры, указанной в соответствующем стандарте по применению. Контрольные сканирования должны быть выполнены под небольшим углом к линии, перпендикулярной к знакам СТАРТ и СТОП, подобно тому, как используется перекрестное сканирование строк во всех сканированиях. 1) Необходимо определить значения глобального порога (global threshold) для каждого сканирования, равного (Rmax + Rmin)/2, где Rmax - наибольший коэффициент отражения при сканировании и Rmin - наименьший коэффициент отражения. Все элементы с коэффициентами отражения выше глобального порога (global threshold) считают пробелами, а те, в которых они ниже, - штрихами. Измерения E должны определяться в соответствии с рисунком K.1 и использованием положения края, определяемого в точке с коэффициентом отражения, являющимся средним арифметическим значением для соседних штриха и пробела. Обработка сканирований должна продолжаться до тех пор, пока не будет стабилизировано число декодированных кодовых слов. 2) Необходимо декодировать символ и для уровней коррекции ошибок от 1 до 8 вычислить содержание неиспользованных коррекций ошибок по формуле 1,0 - ((1 + 2f)/(2s+1 - p)), где p = 2 или 3 (в соответствии с формулами в 4.7.2). Для уровня коррекции ошибок, равного 0, при декодировании символа неиспользованная коррекция ошибок будет равна 1,0. Затем следует сравнить этот результат со значениями, указанными в таблице J.1, для определения класса, основанного на знаках символа штрихового кода. Таблица J.1 - Класс символа в зависимости от неиспользованной коррекции ошибок
J.3 Полный класс символа PDF417 За полный класс символа принимают меньшее значение класса, основанного на знаках СТАРТ и СТОП в соответствии с J.1, либо оценку, основанную на знаках символа в соответствии с J.2. ПРИЛОЖЕНИЕ K(обязательное) Рекомендуемый алгоритм декодирования для PDF417Рекомендуемый алгоритм декодирования применяют для вычисления декодируемости при оценке качества символа с использованием методов, приведенных в ИСО/МЭК 15416. При оценке качества символа с помощью настоящего рекомендуемого алгоритма декодирования символ PDF417 должен декодироваться в виде серии линий сканирования вдоль этого символа до знаков СТАРТ или СТОП, но необязательно строка за строкой. Символ может быть декодирован с помощью номера кластера и в том случае, если линия сканирования проходит через две или более строк. Последовательности штрихов и пробелов знаков символа PDF417 (е) декодируют с использованием измерений «от края до края». Символ PDF417 подлежит декодированию в четыре этапа: 1) инициализация для установки матрицы символа; 2) декодирование линии с использованием рекомендуемого алгоритма декодирования; 3) заполнение матрицы; 4) интерпретация. K.1 Инициализация В начале процесса декодирования для установления параметров структуры символа (числа строк r, числа столбцов c) и уровней коррекции ошибок должно быть выполнено достаточное количество декодирований вдоль линии сканирования (K.2). Эта информация кодируется в левом и нравом индикаторах строки, примыкающих соответственно к знакам СТАРТ и СТОП. После проведения инициализации параметров структуры символа должна быть установлена матрица, отражающая размер (число строк со столбцов) декодируемого символа. Матрица должна исключать знаки СТАРТ и СТОП и индикаторы строк. K.2 Рекомендуемый алгоритм декодирования для декодирования линии Декодируемая линия сканирования должна содержать свободную зону, знак СТАРТ и/или СТОП, один индикатор строки и один или более знаков символа в области данных. Линия сканирования может пересекать более чем одну строку. Алгоритм должен включать следующие этапы по декодированию линии: 1) подтверждают наличие свободной зоны; 2) для каждой последовательности штрихов и пробелов знака символа (включая знак СТАРТ и СТОП) подсчитывают ширину в соответствии с рисунком K.1: p, e1, e2, e3, e4, e5 и e6 Рисунок K.1 - Размеры для декодирования 3) преобразуют размеры e1, е2, е3, е4, е5 и е6 в нормализованные значения Е1, Е2, Е3, Е4, Е5 и Е6, которые должны представлять полную ширину этих размеров в модулях. Используют следующий способ для определения i-го значения: при 1,5p/17 ≤ еi < 2,5p/17 Еi = 2; при 2,5p/17 ≤ еi < 3,5p/17 Еi = 3; при 3,5p/17 ≤ еi < 4,5p/17 Еi = 4; при 4,5p/17 ≤ еi < 5,5p/17 Еi = 5; при 5,5p/17 ≤ еi < 6,5p/17 Еi = 6; при 6,5p/17 ≤ еi < 7,5p/17 Еi = 7; при 7,5p/17 ≤ еi < 8,5p/17 Еi = 8; при 8,5p/17 ≤ еi < 9,5p/17 Еi = 9. В противном случае последовательность штрихов и пробелов знака символа должна считаться ошибочной. 4) после нахождения знаков СТАРТ и СТОП предпринимают попытку декодировать индикатор строки и знаки символа в количестве, соответствующем числу столбцов матрицы в направлении, выведенном из декодированных знаков СТАРТ и СТОП. Последовательности штрихов и пробелов знаков символа декодируют в соответствии с этапом 5; 5) вычисляют номер кластера K знака символа по формуле K = (Е1 - Е2 + Е5 - Е6 + 9) mod 9. Примечание - Формула дает результаты, идентичные результатам уравнения, приведенного в 4.3.1. Номер кластера K должен быть равен 0, 3 или 6; в противном случае знак символа и связанное с ним кодовое слово должны считаться ошибочными; 6) восстанавливают значение кодового слова по таблице декодирования (приложение А) с использованием семи значений (значения кластера K и значений E1, E2, Е3, Е4, Е5 и Е6) в качестве ключевых. Эти значения можно вычислить из последовательностей штрихов и пробелов, приведенных в приложении А. Примечание - В вычислении неявно используют номер кластера для обнаружения всех ошибок декодирования, вызванных отдельными несистематическими ошибками положения края на величину одного модуля; 7) как только будут установлены знаки СТАРТ и СТОП, должны использоваться значения кодового слова левого индикатора строки и/или правого индикатора строки для установления параметров структуры символа. Применяют обращенные уравнения, приведенные в 4.11.3.1 и 4.11.3.2 для установления номера строки (F), числа строк (r), числа столбцов (c) и уровня коррекции ошибок (s); 8) выполнение вторичных проверок (ускорение сканирования, абсолютные синхронизированные размеры, свободные зоны и т.д.), результаты которых должны быть приемлемы для отдельных характеристик считывающего устройства. K.3 Заполнение матрицы Для заполнения матрицы строк (r) и столбцов (c), установленных с помощью процедуры инициализации, должна использоваться следующая процедура: 1) устанавливают начальное значение подсчета стираний r × c; 2) для каждого сканирования следует декодировать число кодовых слов, равное числу столбцов в матрице; 3) действительные результаты декодирования размещают в матрице на соответствующих местах, определенных по номеру строки (из индикаторов строк) и значению кластера. Если происходит пересечение строк, линия сканирования будет характеризоваться разными номерами строк, определяемыми левым и правым индикаторами строк. Номер кластера следует использовать для интерполяции правильного номера строки для каждого отдельного действительного кодового слова. Сканирование с декодированием характеризуется знаками СТАРТ и СТОП, в нем присутствует левый индикатор строки с номером строки 7 и правый индикатор строки с номером строки 10. В матрице присутствуют 10 столбцов. Линия сканирования при декодировании не охватила три кодовых слова, поскольку она не оставалась полностью в одной строке для полного перехода, однако на основании синхронизации элементов известно положение этих «неустановленных» кодовых слов. Рисунок K.2 - Схема, представляющая линию сканирования, пересекающую строки Кластеры расположены в следующей последовательности: «неустановленный», 6, 6, 6, «неустановленный», 0, 0, «неустановленный», 3, 3. Используя систему обозначений матрицы для строки (r) и столбца (c), кодовые слова подлежат заполнению согласно позициям: «неустановленная», (8,2), (8,3), (8,4), «неустановленная», (9,6), (9,7), «неустановленная», (10,9) и (10,10). Примечание - Этот пример является крайним случаем в связи с тем, что линия сканирования пересекает 4 строки, но с его помощью достигается декодирование 70 % кодовых слов; 4) по мере заполнения матрицы подсчет стираний V должен быть уменьшен на одно значение для каждого действительного кодового слова; 5) если уровень коррекции ошибок не равен 0, может быть предпринято исправление ошибок, когда число неустановленных кодовых слов (число стираний V) будет удовлетворять уравнениям, приведенным в 4.7.2 (при V = I и f = 0). Если устранить ошибки не удается, то должны быть собраны дополнительные кодовые слова; 6) если уровень коррекции ошибок равен 0, то следует ввести два кодовых слова коррекции ошибок. Дальнейшие подробности обнаружения и коррекции ошибок приведены в приложении L. K.4 Интерпретация Начиная с первоначального состояния подрежима прописные буквы режима текстового уплотнения, кодовые слова данных следует интерпретировать в соответствии с режимами уплотнения. ПРИЛОЖЕНИЕ L(обязательное) Процедуры коррекции ошибокСхема восстановления может быть вызвана при общем числе неустановленных кодовых слов v менее или равном заданному соответствующим уравнением в 4.7.2 (v = l, f = 0). Неустановленные кодовые слова подлежат замещению нулями, и позицией неустановленного кодового слова 1 является jl при l = 1, 2, ..., v. Составляют полином знака символа: C(x) = Cn-1xn-1 + Cn-2xn-2 + , ..., + C1x1 + C0, где показатели n являются считанными кодовыми словами с первым кодовым словом Cn-1; n - общее количество кодовых слов. Рассчитывают значения синдрома k (от S1 до Sk) путем следующих вычислений: C(x) при x = 3i для i = 1 до i = k, где k - число знаков коррекции ошибок в символе = 2s+1. Схема генерации синдромов приведена на рисунке L.1. Рисунок L.1 - Делитель синдрома символа Так как позиции неустановленных кодовых слов известны из jl при l = 1, 2, ..., v, полином местонахождения ошибок σ(x) для этих известных позиций можно вычислить по формуле σ(x) = (1 - β1x)(1 - β2x), ..., (1 - βvx) = 1 + σ1x + , ..., + σvxv, где βl = 3j. Полином местонахождения ошибок σ(x) можно корректировать, чтобы включить позиции ошибок. Это можно выполнить с помощью алгоритма Берлекампа-Массе (Berlekamp-Massey). Исходный текст приведен в [6]. Далее следует удостовериться, что количество стираний и ошибок удовлетворяет соответствующему уравнению, вычисляющему возможности исправления ошибок, приведенному в 4.7.2. Решение σ(x) = 0 дает позицию для t ошибок, где t ≥ 0; если t = 0, то ошибки отсутствуют. Далее рассчитывают значение ошибок ejl для позиции jl, l = 1, ..., v + t. Для вычисления ошибок требуется вспомогательный полином Z(x), который определяют следующим образом: Z(x) = 1 + (s1 + σ1)x + (s2 + σ1s1 + σ2)x2 + ... + (sη + σ1sη-1 + σ2sη-2 + ... + ση) xη, где η = v + t. Значение ошибок в позиции jl таким образом задается через
После успешного решения для ошибок дополнения значений ошибок добавляются к кодовым словам в соответствующих позициях. ПРИЛОЖЕНИЕ М(обязательное) Идентификатор символикиИСО/МЭК 15424 предусматривает унифицированную методику формирования сообщения о считываемой символике, наборе вариантов обработки в устройстве считывания и других особых свойствах символики. Идентификатор символики (symbology identifier) PDF417 должен быть представлен в виде ]Lm, где ] - знак флага идентификатора символики (десятичное значение КОИ-793); L - знак кода для символики PDF417; М - знак-модификатор, имеющий одно из значений, приведенных в таблице М.1. Таблица М.1 - Значения модификаторов идентификатора символики для PDF417
Эта информация не должна кодироваться в символе штрихового кода, однако должна генерироваться декодером после декодирования и передаваться как преамбула к данным сообщения. ПРИЛОЖЕНИЕ N(обязательное) Протокол передачи для декодеров, соответствующий первоначальным спецификациям PDF417Ранее опубликованные спецификации символики PDF417 ([2] и [3]) поддерживают режим базового канала, идентификаторы глобальной метки - GLI (предшествующие независимой от символики интерпретации расширенного канала - ECI) и Макро PDF417 (но без интегрирования с протоколом ECI). Настоящее приложение определяет протокол передачи, соответствующий первоначальной спецификации ([2] и [3]), который все еще может находиться в эксплуатации, и направлено на обеспечение совместимости. N.1 Режим базового канала В режиме базового канала (Basic Channel mode) все знаки данных символа передаются в соответствии с действующими режимами уплотнения и включаются в передачу данных как последовательность 8-битных байтов. Знаки СТАРТ и СТОП, индикаторы строк, дескриптор длины символа, кодовые слова переключения режима и кодовые слова коррекции ошибок не передаются. Примечание - Передача идентична процедуре, приведенной в 4.17.1. Ранние декодеры должны выдавать идентификатор символики ]L0, однако могут и не передавать префикс идентификатора символики. N.2 Символы, кодирующие GLI Ранее были установлены только GLI 1 и GLI 0, но исходным протоколом поддерживается передача всех управляющих последовательностей GLI/ECI. Три кодовых слова (925, 926 и 927) отмечают кодирование значения GLI и декодируются как значения байтов в соответствии с приведенной ниже процедурой: 1) если управляющая последовательность GLI начинается кодовым словом 927 (идентификатор ECI для набора знаков или кодовой страницы): a) кодовое слово со значением 927 передается как 4-байтовая управляющая последовательность 92, 57, 50, 55, которая представлена \927 в интерпретации знаков КОИ-7 b) следующее кодовое слово представляет номер GLI в области значений от 000 до 899. Кодовое слово преобразовывается в 3-разрядное значение. 3-разрядное значение передается как соответствующие значения байтов (с десятичными значениями от 48 до 57), которым предшествует байт со значением 92 В символе закодировано: [927] [001] Передача данных (байты): 92, 57, 50, 55, 92, 48, 48, 49 Интерпретация знаков КОИ-7: \927\001; 2) если управляющая последовательность GLI начинается кодовым словом 926 (идентификатор общего назначения формата ECI): a) кодовое слово 926 передается как 4-байтовая управляющая последовательность 92, 57, 50, 54, которая представлена \926 в интерпретации знаков КОИ-7 b) следующие два кодовых слова (допускаются кодовые слова со значениями от 000 до 899) представляют номер ECI следующим способом: Кодовое слово 1: Номер_ ECI div 900 - 1 Кодовое слово 2: Номер_ ECI mod 900. Каждое кодовое слово преобразовывается в 3-разрядное значение. 3-разрядное значение передается как соответствующие значения байтов (от 48 до 57), которым предшествует байт со значением 92. В символе закодировано: [926] [136] [156] Передача данных (байты): 92, 57, 50, 54, 92, 49, 51, 54, 92, 49, 53, 54 Интерпретация знаков КОИ-7: \926\136\156; 3) если управляющая последовательность GLI начинается кодовым словом 925 (идентификатор ECI, задаваемый пользователем): a) кодовое слово 925 передается как 4-байтовая управляющая последовательность 92, 57, 50, 53, которая представлена \925 в интерпретации в знаках КОИ-7 b) следующее кодовое слово представляет номер задаваемого пользователем GLI минус 810900 (допускаются кодовые слова со значениями от 000 до 899). Кодовое слово преобразуется в 3-разрядное значение. 3-разрядное значение передается как соответствующие значения байтов (от 48 до 57), которым предшествует байт со значением 92. В символе закодировано: [925] [456] Передача данных (байты): 92, 57, 50, 53, 92, 52, 53, 54 Интерпретация в знаках КОИ-7: \925\456 Эта процедура повторяется для каждого случая появления GLI. Примечание - Объяснения примеров с соответствующими ECI, но использующие протокол передачи ECI, приведены в 4.17.2 Если знак ОБРАТНАЯ ДРОБНАЯ ЧЕРТА или другой знак, представленный байтом со значением 92, необходимо использовать в качестве закодированных данных, передача должна происходить в соответствии с нижеуказанным примером. Всякий раз, когда байт со значением 92 появляется в качестве данных, должны быть переданы два байта этого значения; таким образом, единичное появление всегда является управляющим знаком, а двоичное появление означает достоверные данные. Закодированные данные: A\\B\C Передача: A\\\\B\\C Управляющий знак по умолчанию может быть изменен в декодере (в таком случае система получения должна быть соответственно сконфигурирована), но тогда не должны использоваться значения байтов от 47 до 58 (в основном интерпретируемые как цифровые разряды). Примечание - В протоколе для передачи ECI (4.17.2) значение 92 управляющего знака является фиксированным. В качестве варианта декодеры могут иметь режим работы, при котором управляющие знаки не определены; такие устройства считывания не могут ни передавать управляющие последовательности, ни дублировать любые знаки данных. Таким образом, этот режим не может поддерживать передачу ни управляющих последовательностей ECI, ни управляющих блоков Макро PDF417. N.3 Символы Макро PDF417 При работе по первоначальному протоколу передачи данных PDF417 после того как декодер PDF417 обработал символ Макро PDF417 с заданной идентификацией файла, он должен декодировать и передать все символы с той же идентификацией файла до передачи любых иных символов. Это требование применяется для каждого из нижеуказанных режимов передачи. N.3.1 Передача в буферизованном режиме Буферизованная система передачи требует, чтобы декодер собрал весь комплект символов до его передачи. Обработка обязательных полей управляющего блока Макро PDF417 проводится в рамках декодера. Передача необязательных полей в декодере может быть индивидуально разрешена или запрещена. Необязательные поля, если таковые присутствуют, должны единовременно передаваться в конце полного комплекта данных. Передача каждого поля должна начинаться с передачи соответствующей последовательности-указателя необязательного поля Макро PDF417. Последовательность-указатель состоит из кодового слова 923 (начало необязательного поля Макро PDF417), за которым следует значение указателя в соответствии с таблицей H.1; эта последовательность должна передаваться с помощью управляющего знака в соответствии с N.2. Декодированное высокоуровневое содержимое поля должно передаваться после этой последовательности-указателя. N.3.2 Передача в небуферизованном режиме Система небуферизованной передачи позволяет декодеру передавать отдельные символы по мере их декодирования. При использовании небуферизованной схемы должна быть разрешена передача управляющего заголовка Макро PDF417 (Macro PDF417 Control Header), поскольку символы в небуферизованной схеме не подлежат внутреннему упорядочиванию устройством считывания. Это позволяет системе сервера производить соответствующую систематизацию поступающих данных. Передача управляющего заголовка Макро PDF417 может быть разрешена или запрещена. Управляющий заголовок Макро PDF417 является частью управляющего блока Макро PDF417 (рисунок H.1), который состоит из кодового слова 928 (Макро-маркер), индекса сегмента (в режиме цифрового уплотнения) и последовательности кодовых слов идентификации файла. В случае, когда передача управляющего заголовка Макро PDF417 разрешена, кодовое слово Макро-маркера и кодовые слова идентификации файла следует передавать, используя управляющий знак в соответствии с N.2. Например, управляющий заголовок Макро PDF417 первого символа, индекс сегмента равный 0 и идентификация файла (значения кодовых слов 100, 200, 300) должны быть закодированы в символе как последовательность кодовых слов: [928] [111] [100] [100] [200] [300] и (принимая управляющий знак со значением 92 по умолчанию) переданы следующим образом: Передача данных (байты): 92, 57, 50, 56, 48, 48, 48, 48, 48, 92, 49, 48, 48, 92, 50, 48, 48, 92, 51, 48, 48 Интерпретация в знаках КОИ-7: \92800000\100\200\300. Управляющий заголовок Макро PDF417 (если разрешен) следует передавать после данных, закодированных в символе. Если последняя последовательность GLI, переданная считывающим устройством, не является GLI 0, тогда переданные данные из этого сегмента должны оканчиваться последовательностью байтов 92, 57, 50, 55, 92, 48, 48, 48 (эквивалент в знаках КОИ-7 \927\000), как если бы данные символа оканчивались последовательностью кодовых слов [927][000]. Это возвращает интерпретацию следующего блока к GLI 0. Передача необязательных полей может быть индивидуально разрешена или запрещена в декодере. Разрешенные необязательные поля должны передаваться вместе с каждым символом Макро PDF417, в котором они были закодированы. Каждое поле должно начинаться с передачи соответствующей последовательности-указателя необязательного поля Макро PDF417. Последовательность-указатель состоит из кодового слова 923, за которым следует значение указателя в соответствии с таблицей H.1; эта последовательность должна передаваться с использованием управляющего знака в соответствии с N.2. Декодированное высокоуровневое содержимое поля должно передаваться после этой последовательности-указателя. Базируясь только на передаче закодированного потока данных, могут возникнуть трудности или невозможность определения наличия границы между окончанием управляющего блока Макро PDF417 (особенно если он содержит необязательные поля) и началом содержимого данных следующего символа. Протокол передачи системы (например, использующий типовую передачу управляющих знаков STX (НТ)* и ЕТХ (КТ)* или другие процедуры установления связи) может использоваться для определения границ между переданными символами Макро PDF417. * В скобках приведены русские обозначения управляющих знаков по ГОСТ 27465. С целью облегчения контроля получения всех символов Макро PDF417 в небуферизованном режиме всякий раз, когда это возможно, следует использовать необязательное поле числа сегментов как часть закодированного управляющего блока Макро PDF417. N.4 Передача зарезервированных кодовых слов с использованием исходного протокола PDF417 При работе по исходному протоколу передачи PDF417 декодер должен передавать зарезервированное кодовое слово как управляющий знак (со значением 92 по умолчанию), за которым следуют 3 разряда, представляющие десятичное значение зарезервированного кодового слова. Кодовые слова данных, которые следуют после зарезервированного кодового слова, интерпретируются и передаются в соответствии с режимом уплотнения, действующим до зарезервированного кодового слова. В частности, будет установлена интерпретация, как если бы зарезервированное кодовое слово ввело кодовое слово фиксации в режиме в уже действующем режиме уплотнения. Такая функция фиксации в режиме байтового или цифрового уплотнения заново устанавливает новое «группирование» кодовых слов. Если доминирующим режимом является режим текстового уплотнения, то осуществляется повторный вызов в подрежим прописных букв режима текстового уплотнения. Примечание - Несмотря на то, что протокол может соответствующим образом передавать синтаксис сообщения любых зарезервированных кодовых слов, будущие определения которых заключаются в сигнальных функциях, он не будет предусматривать однозначного выхода данных для нового режима уплотнения. Следовательно, при использовании исходного протокола передачи PDF417 устройство приема не должно учитывать любые данные, которые следуют за управляющей последовательностью, представляющей вновь определенное кодовое слово режима уплотнения. N.5 Достижение согласованности между старым и новым оборудованием PDF417 N.5.1 Устройства кодирования Введение интерпретаций расширенного канала, которые не зависят от символики, подразумевает отделение функций кодирования ECI от кодирования символики. Кодирование GLI де-факто является внутренне связанным с символикой PDF417. Закодированный поток кодовых слов будет равнозначным независимо от того, какое кодирующее оборудование использовалось для его кодирования: существующее или новое. Возможно кодирование, например, данных в соответствии с интерпретацией ECI 000123 (которая еще не задана на момент публикации настоящего стандарта) с помощью кодирующего устройства, способного устанавливать GLI для PDF417; или, на первом этапе, кодирование с помощью кодирующего устройства для независимой от символики ECI, за которым, на втором этапе, следует кодирующее устройство для символики PDF417. Имеются два ограничения: - логическая схема с возвратом к GLI 0 должна применяться только для GLI 0 (ECI 000000) и GLI 1 (ECI 000001), - GLI 0 и GLI 1 не должны смешиваться с другими ECI в одном символе или комплекте символов Макро PDF417. N.5.2 Декодеры Ключом к взаимодействию декодеров, использующих исходный и новый протокол PDF417, является обязательная передача префикса идентификатора символики всякий раз, когда декодер сконфигурирован для работы в новом режиме расширенного канала (Extended Channel Mode) и требует обязательного использования префикса, когда старое и новое оборудование PDF417 используется в одной системе, т.е. декодер, имеющий разрешение для работы в режиме расширенного канала (даже при считывании разнородных символов режима базового канала и режима расширенного канала), будет отправлять идентификатор символики с каждой передачей. Примечание - Исходный стандарт PDF417 ([2] и [3]) не обязывает использовать идентификатор символики даже при дублировании управляющего знака (со значением 92 по умолчанию). Соответствие протоколу ECI, представленное в настоящем стандарте, обязывает использовать идентификатор символики. Декодеры подлежат проверке на соответствие по одному из следующих условий: A. Полностью соответствуют протоколу ECI и настоящему стандарту: 1) передают соответствующие идентификаторы символики; 2) имеют возможность установки или переключения на работу в режиме базового канала или режиме расширенного канала; 3) передают протокол ECI в соответствии с настоящим стандартом (4.17.2); 4) обрабатывают Макро PDF417 в соответствии с настоящим стандартом; B. Соответствуют стандартам 1994 года [2] и [3]: B.1 и имеют возможности взаимодействия с новым оборудованием и символами, кодирующими ECI: 1) передают идентификатор символики [L0; 2) имеют возможность установки или переключения на работу в режиме базового канала или в режиме расширенного канала; 3) передают протокол GLI в соответствии с N.2; 4) обрабатывают Макро PDF417 в соответствии с N.3, B.2 но не имеют возможности взаимодействия с новым оборудованием и символами, кодирующими ECI: 1) не передают идентификатор символики; 2) имеют возможность установки или переключения на работу в режиме базового канала или в режиме расширенного канала; 3) передают протокол GLI в соответствии с N.2; 4) обрабатывают Макро PDF417 в соответствии с N.3. C. Соответствуют только режиму базового канала: 1) передают идентификатор символики [L0 (старое оборудование) или [L2 (новое оборудование) или не передают идентификатор символики; 2) рассматривают символы, содержащие кодовые слова ECI, как ошибочные; 3) рассматривают символы Макро PDF417 как ошибочные, за исключением случая, когда устройство считывания работает в буферизованном режиме и передача управляющего заголовка Макро PDF417 запрещена. Допустим, что оборудование настроено в соответствии с вышеуказанным, что предоставит устройству считывания возможность обнаруживать и соответствующим образом реагировать на следующие условия: 1) идентификатор символики [L1 присутствует в начале передачи: В данном случае устройство приема достоверно информируется, что декодер работает в режиме расширенного канала для сканированного символа. Следовательно, все байты со значением 92, когда они появляются в качестве данных, были дублированы независимо от того, содержит ли символ ECI или является частью комплекта Макро PDF 417. Отдельные появления байта со значением 92 указывают начало управляющей последовательности. Все остальные свойства соответствуют настоящему стандарту. 2) идентификатор символики [L2 присутствует в начале передачи: В данном случае устройство приема информируется, что декодер работает в режиме базового канала для отсканированного символа. Следовательно, байт со значением 92 будет представлять отдельный байт данных. Символы с управляющими последовательностями ECI должны рассматриваться как ошибочные. Символы Макро PDF417 должны быть рассмотрены как ошибочные, за исключением случая, если устройство считывания работает в буферизованном режиме и передача управляющих заголовков Макро PDF417 запрещена. 3) идентификатор символики [L0 присутствует в начале передачи, указывая версию PDF417 1994 года: Этот случай является исключением по причине того, что стандарт PDF417 1994 г. ([2] и [3]), несмотря на то, что он подразумевает явную поддержку режима расширенного канала, определяет 0 (т.е. набор вариантов отсутствует) как единственное значение варианта обработки для идентификатора символики PDF417. Таким образом, существующее оборудование PDF417 при полном соответствии стандарту 1994 г. ([2] и [3]) не будет использовать новые значения вариантов, чтобы указать, действует ли режим расширенного канала или режим базового канала. Следовательно, если устройство приема встречает [L0, тогда оно должно ожидать режим, соответствующий стандарту 1994 г. В частности: - устройство приема не может распознать из передачи, в каком из режимов находится декодер: в режиме расширенного канала (всегда дублирует байт, задаваемый в качестве управляющего знака в соответствии с N.2) или в режиме базового канала (никогда не дублирует байтов); декодер должен быть конфигурирован таким образом, чтобы соответствовать данным, ожидаемым устройством приема; - если декодер установлен в режим расширенного канала и в символе закодированы ECI, декодер будет скорее передавать управляющие последовательности GLI в формате PDF417 1994 г. (в соответствии с N.2), чем управляющую последовательность ECI, как указано в 4.17.2. - при использовании исходного протокола, если присутствует управляющий блок Макро PDF417, содержимое управляющего блока Макро PDF417 скорее следует после байтов данных символа, чем предваряет их. 4) в начале передачи нет идентификатора символики: В этом случае: a) декодер соответствующим образом сконфигурирован для поддержки только символов режима базового канала. Система приема настроена на то, что декодер не дублировал ни одного значения байта и л0юбые очевидные ECI в потоке байтов являются случайными комбинациями знаков b) декодер неправильно сконфигурирован для возможности взаимодействия в открытой системе, где могут встречаться символы, кодирующие ECI. ПРИЛОЖЕНИЕ P(справочное) Алгоритм минимизации числа кодовых словОдни и те же данные могут быть представлены в виде различных последовательностей кодовых слов PDF417 использованием разных режимов уплотнения и процедур перехода. Не существует предписанной процедуры для минимизации числа требуемых кодовых слов, но для этих целей можно использовать следующий алгоритм: 1) принимают, что P указывает начало потока данных; 2) устанавливают текущий режим кодирования в режим текстового уплотнения; 3) принимают, что N - число последовательных разрядов, начинающихся от P; 4) если N ≥ 13, тогда: 5) фиксируют режим цифрового уплотнения; 6) кодируют N знаков с использованием цифрового уплотнения; 7) передвигают вперед указатель P на N; 8) переходят к шагу 3; 9) в противном случае, если N < 13, тогда: 10) принимают T длиной последовательности знаков в режиме текстового уплотнения, начинающейся с P. Последовательность заканчивается в том случае, если будут обнаружены либо знак, не находящийся в режиме текстового уплотнения, либо цифровая последовательность длиной 13 и более разрядов; 11) если T ≥ 5, тогда: 12) фиксируют режим текстового уплотнения; 13) кодируют T знаков с использованием режима текстового уплотнения; 14) перемещают вперед указатель P на T; 15) переходят к шагу 3 16) в случае, если T < 5, тогда: 17) принимают B в качестве длины кодируемой в двоичном виде последовательности, начинающейся с P. Последовательность заканчивают в случаях, если будут найдены либо последовательность в режиме текстового уплотнения, длиной 5 и более, либо цифровая последовательность, длиной 13 и более 18) если B = 1 и текущий режим текстового уплотнения, тогда: 19) переводят регистр в режим байтового уплотнения; 20) кодируют значение одного байта с использованием режима байтового уплотнения; 21) перемещают вперед указатель P на B; 22) переходят к шагу 3 23) иначе: 24) фиксируют режим байтового уплотнения; 25) кодируют B байтов с использованием режима байтового уплотнения; 26) перемещают вперед указатель P на B; 27) переходят к шагу 3. ПРИЛОЖЕНИЕ Q(Справочное) Рекомендации по определению матрицы символа PDF417Для определения матрицы символа в виде числа строк (r) и столбцов (c) до печати символа следует использовать ряд параметров. Каждый параметр назначает одну характеристику, которая может ограничивать матрицу символа. Обозначения (в нижеуказанных уравнениях) A, c, k, QH, QV, r, X и Y соответствуют обозначениям, установленным в 3.2. Формулы можно использовать непосредственно или для создания более сложного алгоритма. Параметр 1 - число строк r Параметр 2 - число столбцов c Параметр 3 - размер X Определяют в нормативном документе, устанавливающем требования по применению (4.8) Параметр 4 - размер Y Параметр 5 - горизонтальная свободная зона QH Параметр 6 - вертикальная свободная зона QV Параметр 7 - полезная длина символа W Этот параметр может быть ограничен полем обзора сканера или шириной этикетки W ≥ (17c + 69)X + 2QH Параметр 8 - полезная высота символа H Этот параметр может быть ограничен полем обзора сканера или шириной этикетки H ≥ Yr + 2QV Параметр 9 - параметры матрицы (n + k) = (c × r) < 929 Параметр 10 - коэффициент сжатия символа A До определения размера символа может быть вычислено число кодовых слов данных и кодовых слов коррекции ошибки. Следующий этап зависит от ограничений определенных параметров, указанных в применении. Если параметры применения определяют общий коэффициент сжатия символа, можно использовать рекомендации 2 настоящего приложения по вычислению числа столбцов области данных, требуемых для создания символа с данным коэффициентом сжатия. Если, в противном случае, в применении ограничивается допустимая высота либо длина символа (или оба параметра), можно использовать более простые вычисления. Рекомендации 1 демонстрируют этот простой алгоритм, который следует использовать при ограниченной длине символа. Рекомендации 1. В случае, когда общая длина W (включающая свободные зоны) задана, число столбцов данных можно вычислить, используя уравнение параметра 7 (округляя до ближайшего целого значения числа столбцов). В этом случае число строк выводится из общего числа кодовых слов: (n + k) = (r × c). Рекомендации 2. Коэффициент сжатия символа A представляет собой отношение высоты к длине символа, включая свободные зоны. Для получения заданного значения A необходимо решить приведенное ниже уравнение относительно числа столбцов (c), в котором допускается, что свободные зоны выражены в точных значениях X. Уравнение может использоваться для всех случаев получения наилучшей аппроксимации числа столбцов (c).
Таким образом
где A, c, n, k, X и Y соответствуют обозначениям, приведенным в 3.2. QH = 2X QV = 2X Уравнение может быть записано в следующем виде
Это уравнение (при замене c на X) является квадратным уравнением вида aX2 + bX + c = 0,
При подстановке значений параметров PDF417 решение квадратного уравнения, с отбрасыванием отрицательных значений, может быть записано в следующем виде
Значение n зависит от числа кодовых слов-заполнителей, которое неизвестно до определения параметров матрицы. Однако число исходных кодовых слов известно и оно может быть подставлено в виде m + 1 ≤ n в уравнении, представленном выше, следующим способом:
При определении положительного значения c может быть получен результат, не являющийся целым числом. Ближайшее значение целого числа с должно давать наилучшее значение числа столбцов для определения коэффициента сжатия. Число строк задается величиной r = INT [(m + 1 + k)/c] + 1. Если (c × r) ≥ m + 1 + k + c, то r = r - 1 При (c × r) = (n + k), число кодовых слов-заполнителей равно (n + k) - (m + 1 + k) Требуется получить коэффициент сжатия A = 0,5 для символа PDF417, в котором m + 1 + k = 277, X = 0,33 мм и Y = 1,00 мм.
r = INT (277/c) + 1 r = INT (34,6) + 1 r = 35. (m + 1 + k) ≤ (c × r) < 929; 277 ≤ 280 < 929. Число требуемых кодовых слов-заполнителей равно: (c × r) - (m + 1 + k); 280 - 277 = 3. Этот символ характеризуется следующими параметрами: длина 68,97 мм, высота 36,32 мм, фактический коэффициент сжатия 0,527, количество строк 35 и количество столбцов 8. Если не удается достичь каких-либо приемлемых параметров и символ не соответствует требуемому размеру этикетки, следует придерживаться следующих рекомендаций: a) по возможности, уменьшают содержание данных, b) увеличивают размер этикетки в одном или двух измерениях, c) уменьшают уровни коррекции ошибок, d) уменьшают размер X или высоту модуля (Y). ПРИЛОЖЕНИЕ R(справочное) Пример вычисления коэффициентов для генерации кодовых слов коррекции ошибокДля подсчета коэффициентов каждого уровня коррекции ошибок должен использоваться порождающий полином gk(x): gk(x) = (x - 3)(x - 32)(x - 33), ..., (x - 3k) = α0 + α1x + α2x2 + , ..., αk-1xk-1 + xk, где k - общее количество кодовых слов коррекции ошибок; αj - коэффициент показателей степени x, вычисляемых согласно порождающему полиному gk(x). Сначала раскладывают в ряд приведенное выше уравнение, затем вычисляют дополнение коэффициента. Для αj = α0, ..., αk-1 αj = αj mod 929 Требуется вычислить коэффициенты порождающего полинома для уровня коррекции ошибок 1. s = 1 (уровень коррекции ошибок 1) k = 2s+1 = 4 (количество кодовых слов коррекции ошибок) g4(x) = (x - 3)(x - 32)(x - 33)(x - 34) = 59049 - 29160x + 3510x2 - 120x3 + x4 α0 = 59049 mod 929 = 522 α1 = -29160 mod 929 = 568 α2 = 3510 mod 929 = 723 α3 = -120 mod 929 = 809 Примечание - В приложении F приведены таблицы коэффициентов для вычисления кодовых слов коррекции ошибок PDF417, содержащие все значения коэффициентов, необходимые для кодирования символа PDF417 любого уровня коррекции ошибок. ПРИЛОЖЕНИЕ S(справочное) Пример генерации кодовых слов коррекции ошибокДля генерации кодовых слов коррекции ошибок должен использоваться алгоритм в соответствии с 4.10 (обозначения, используемые в приведенном примере соответствуют обозначениям в 4.10). Данные PDF417 представлены кодовыми словами 5, 453, 178, 121, 239, перед которыми расположен дескриптор длины символа. Кодовые слова-заполнители отсутствуют. Тогда n = 5 (количество кодовых слов, включая дескриптор длины символа) d4 = 5 d3 = 453 d2 = 178 d1 = 121 d0 = 239 При выборе уровня коррекции ошибок 1 получают s = 1 k = 21+1 = 4 α0, ..., α3 = 522, 568, 723, 809 Примечание - Пример, приведенный для представления всего процесса, упрощен и содержит только пять кодовых слов данных и 4 кодовых слова коррекции ошибок. Процесс значительно усложняется при увеличении числа кодовых слов данных и кодовых слов коррекции ошибок. Порядок вычисления: устанавливают Е0, ..., Е3 на нуль. t1 = (d4 + E3) mod 929 = (5 + 0) mod 929 = 5 t2 = (t1 × α3) mod 929 = (5 × 809) mod 929 = 329 t3 = 929 - t2 = 929 - 329 = 600 E3 = (E2 + t3) mod 929 = (0 + 600) mod 929 = 600 t2 = (t1 × α2) mod 929 = (5 × 723) mod 929 = 828 t3 = 929 - t2 = 929 - 828 = 101 E2 = (E1 + t3) mod 929 = (0 + 101) mod 929 = 101 t2 = (t1 × α1) mod 929 = (5 × 568) mod 929 = 53 t3 = 929 - t2 = 929 - 53 = 876 E1 = (E0 + t3) mod 929 = (0 + 876) mod 929 = 876 t2 = (t1 × α0) mod 929 = (5 × 522) mod 929 = 752 t3 = 929 - t2 = 929 - 752 = 177 E0 = t3 mod 929 = 177 mod 929 = 177 t1 = (d3 + E3) mod 929 = (453 + 600) mod 929 = 124 t2= (t1 × α3) mod 929 = (124 × 809) mod 929 = 913 t3 = 929 - t2 = 929 - 913= 16 E3 = (E2 + t3) mod 929 = (101 + 16) mod 929 = 117 t2 = (t1 × α2) mod 929 = (124 × 723) mod 929 = 468 t3 = 929 - t2 = 929 - 468 = 461 E2 = (E1 + t3) mod 929 = (876 + 461) mod 929 = 408 t2 = (t1 × α1) mod 929 = (124 × 568) mod 929 = 757 t3 = 929 - t2 = 929 - 757= 172 E1 = (E0 + t3) mod 929 = (177 + 172) mod 929 = 349 t2 = (t1 × α0) mod 929 = (124 × 522) mod 929 = 627 t3 = 929 - t2 = 929 - 627 = 302 E0 = t3 mod 929 = 302 mod 929 = 302 t1 = (d2 + E3) mod 929 = (178 + 117) mod 929 = 295 t2 = (t1 × α3) mod 929 = (295 × 809) mod 929 = 831 t3 = 929 - t2 = 929 - 831 = 98 E3 = (E2 + t3) mod 929 = (408 + 98) mod 929 = 506 t2 = (t1 × α2) mod 929 = (295 × 723) mod 929 = 544 t3 = 929 - t2 = 929 - 544 = 385 E2 = (E1 + t3) mod 929 = (349 + 385) mod 929 = 734 t2 = (t1 × α2) mod 929 = (295 × 568) mod 929 = 340 t3 = 929 - t2 = 929 - 340 = 589 E1 = (E0 + t3) mod 929 = (302 + 589) mod 929 = 891 t2 = (t1 × α0) mod 929 = (295 × 522) mod 929 = 705 t3 = 929 - t2 = 929 - 705 = 224 E0 = t3 mod 929 = 224 mod 929 = 224 t1 = (d1 + E3) mod 929 = (121 + 506) mod 929 = 627 t2 = (t1 × α3) mod 929 = (627 × 809) mod 929 = 9 t3 = 929 - t2 = 929 - 9 = 920 E3 = (E2 + t3) mod 929 = (734 + 920) mod 929 = 725 t2 = (t1 × α2) mod 929 = (627 × 723) mod 929 = 898 t3 = 929 - t2 = 929 - 898 = 31 E2 = (E1 + t3) mod 929 = (891 + 31) mod 929 = 922 t2 = (t1 × α1) mod 929 = (627 × 568) mod 929 = 329 t3 = 929 - t2 = 929 - 329 = 600 E1 = (E0 + t3) mod 929 = (224 + 600) mod 929 = 824 t2 = (t1 × α0) mod 929 = (627 × 522) mod 929 = 286 t3 = 929 - t2 = 929 - 286 = 643 E0 = t3 mod 929 = 643 mod 929 = 643 t1 = (d0 + E3) mod 929 = (239 + 725) mod 929 = 35 t2 = (t1 × α3) mod 929 = (35 × 809) mod 929 = 445 t3 = 929 - t2 = 929 - 445 = 484 E3 = (E2 + t3) mod 929 = (922 + 484) mod 929 = 477 t2 = (t1 × α2) mod 929 = (35 × 723) mod 929 = 222 t3 = 929 - t2 = 929 - 222 = 707 E2 = (E1 + t3) mod 929 = (824 + 707) mod 929 = 602 t2 = (t1 × α1) mod 929 = (35 × 568) mod 929 = 371 t3 = 929 - t2 = 929 - 371 = 558 E1 = (E0 + t3) mod 929 = (643 + 558) mod 929 = 272 t2 = (t1 × α0) mod 929 = (35 × 522) mod 929 = 619 t3 = 929 - t2 = 929 - 619 = 310 E0 = t3 mod 929 = 310 mod 929 = 310 В конце вычисляют дополнения приведенных выше результатов и получают 4 кодовых слова коррекции ошибок для закодированных данных символа PDF417: Е3 = 929 - Е3 = 929 - 477 = 452 Е2 = 929 - Е2 = 929 - 602 = 327 Е1 = 929 - Е1 = 929 - 272 = 657 Е0 = 929 - Е0 = 929 - 310 = 619 ПРИЛОЖЕНИЕ T(справочное) Процедура схемы деления для генерации кодовых слов коррекции ошибокЭта процедура представляет собой альтернативу процедуре, установленной в 4.10, и использует схему деления в качестве базы определения кодовых слов коррекции ошибок. Схема деления приведена на рисунке Т1. Рисунок T.1 - Схема кодирования кодовых слов коррекции ошибок Регистры от b0 до bk-1 должны быть установлены в исходное состояние в виде нулей. Математика по модулю должна быть задана следующими уравнениями: где x и y являются числами от 0 до 928; Генерирование кодирования происходит в два этапа. На первом этапе с переключением в нижнее положение данные символа проходят и к выводу и к схеме. Первый этап завершается после n синхронизирующих импульсов. На втором этапе (синхронизирующие импульсы n + 1, ..., n + k) с переключением в верхнее положение генерируются кодовые слова коррекции ошибок Ek-1 E0 путем смещения регистров по порядку и дополнения вывода данных при удержании ввода данных на нуле. ПРИЛОЖЕНИЕ U(справочное) Совместимость с автоматическим распознаваниемPDF417 может считываться с помощью соответствующим образом запрограммированных декодеров штриховых кодов, которые были разработаны для автоматического распознавания его от других символик. Используемый декодером набор символик должен быть ограничен до количества, которое требуется в данном применении для обеспечения наивысшей надежности считывания. ПРИЛОЖЕНИЕ V(справочное) Соответствие международных и русских терминов и обозначений, встречающихся в тексте настоящего стандартаДанное приложение включено в дополнение к международному стандарту ИСО/МЭК 15438 и содержит соответствие терминов и обозначений на русском языке (в настоящем стандарте) и английском языке (в ИСО/МЭК 15438) для удобства пользователей при переводе документов с одного языка на другой. Таблица V.1 - Соответствие международных и русских наименований кодовых слов
Таблица V.2 - Соответствие международных и русских наименований знаков
Таблица V.3 - Соответствие международных и русских наименований и обозначений режимов и подрежимов и блоков PDF417
Таблица V.4 - Соответствие международных и русских наименований свойств PDF417
Таблица V.5 - Соответствие международных и русских наименований полей PDF417 и их атрибутов
Таблица V.6 - Соответствие международных и русских наименований и обозначений управляющих знаков
Примечания 1 Русские наименования и обозначения знаков по ГОСТ 27465, кроме знака NBSP. 2 Русские наименования и обозначения знака NBSP по ГОСТ 34.302.2 ПРИЛОЖЕНИЕ W(справочное) Соответствие межгосударственных стандартов международным стандартамВ таблице W.1 приведены сведения о соответствии межгосударственных стандартов международным стандартам, указанным в разделе 2. Таблица W.1 - Соответствие межгосударственных стандартов международным стандартам
Примечания 1 ГОСТ 27463 и ГОСТ 30721 разработаны на основе соответствующих международных стандартов и не содержат их аутентичный текст. 2 ГОСТ 30640 не действует на территории Российской Федерации, российским пользователям следует применять ГОСТ Р 51294.1. ПРИЛОЖЕНИЕ X(справочное) Соответствие государственных стандартов Российской Федерации международным стандартамВ таблице X.1 приведены сведения о соответствии государственных стандартов Российской Федерации международным стандартам, указанным в разделе 3. Таблица X.1 - Соответствие государственных стандартов Российской Федерации международным стандартам
Библиография[1] Техническая спецификация АИМ Интернешнл «Интерпретации расширенного канала» - Часть 1. Идентификационные схемы и протокол (AIM International Technical Specification: Extended Channel Interpretations - Part 1: Identification Schemes and Protocol) [2] АИМ США «Единые спецификации символики ПДФ417», 1994 (AIM USA «Uniform Symbology Specification PDF417», 1994) [3] АИМ Европа «Единые спецификации символики ПДФ417», 1994 (AIM Europe «Uniform Symbology Specification PDF417», 1994) [4] ANSI X3.4-1986 (R1997) Информационные системы - Наборы кодированных знаков - 7-битный Американский национальный стандартный код для обмена информацией (7-битный ASCII) (ANSI X3.4-1986 (R1997) Information Systems - Coded Character Sets - 7-Bit American National Standard Code for Information Interchange (7-Bit ASCII)) [5] Техническая спецификация АИМ Интернешнл «Интерпретации расширенного канала» - Часть 2. Регистрация наборов кодированных знаков и прочих форматов данных (AIM International Procedure Standard: Extended Channel Interpretations - Part 2: Registration of Coded Character Sets and Other Data Formats) [6] «Теория и практика кодов контроля ошибки» Richard E. Blahut (издано Addison Wesley, 1984 год) (с стр. 260) (Theory and Practice of Error Control Codes’ Richard E. Blahut (published by Addison Wesley, 1984) (page 260 etc.)
Ключевые слова: штриховой код, символика, символ, кодирование, многострочная символика, PDF417
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© 2013 Ёшкин Кот :-) |