Глоссарий основных терминов и определений используемых на сайте

Автоматическое распознавание номеров контейнеров

Автоматическое распознавание номеров контейнеров - автоматическое распознавание из видео потока либо изображений номеров контейнеров, нанесенных по международному стандарту нумерации ISO 6346.

Автоматическое распознавание номерных знаков автомобилей

Автоматическое распознавание номерных знаков автомобилей — применение технологии оптического распознавания символов на изображениях для считывания номерных знаков транспортных средств. Для получения изображений могут использоваться существующие системы видеонаблюдения, видеокамеры установленные на дорогах либо камеры, специально разработанные для выполнения данной задачи. Автоматическое распознавание номерных знаков автомобилей используется правоохранительными органами, включая дорожную полицию, по всему миру в целях обеспечения правопорядка, в том числе для проверки регистрации автомобилей. Кроме того, эта технология применяется для автоматизированного взимания платы за проезд по платным автодорогам, а дорожные службы собирают с ее помощью информацию об автомобильном движении.

ANPR

Автоматическое распознавание номерных знаков автомобилей.

ALPR

Автоматическое распознавание регистрационных знаков.

AVI

Автоматическая идентификация транспортных средств.

API, интерфейс прикладного программирования, application programming interface)

API — набор, содержащий определения сигнатур функций, протоколы и программные средства для создания прикладного программного обеспечения. По сути, это множество четко определенных способов взаимодействия между разными компонентами программы. Хороший интерфейс прикладного программирования облегчает разработку программного обеспечения, предоставляя программисту все необходимые «кирпичики» для создания программы. Например, API может быть у веб-приложения, операционной системы, системы управления базами данных, компьютерного аппаратного обеспечения или программной библиотеки. Хотя спецификации API могут быть самыми разными, они часто содержат спецификации функций, структур данных, классов объектов, переменных и удаленных вызовов процедур.

CCTV (video surveillance system, система видеонаблюдения)

Система видеонаблюдения — это программно-аппаратный комплекс, в котором множество видеокамер передают изображение на несколько экранов, установленных в помещении с персоналом. В отличие от вещательного телевидения, в этом случае сигнал от видеокамер не передается в эфир в открытом виде, хотя для его передачи могут использоваться проводные или беспроводные сети с топологиями «точка — точка», «точка — много точек» или клеточной топологией. Системы видеонаблюдения широко используются на территории таких объектов, как банки, казино, школы, гостиницы, аэропорты, больницы, рестораны, военные базы, круглосуточные магазины и др., где необходимо обеспечить безопасность.

Компьютерное зрение (Computer vision)

Компьютерное зрение  — научная область, основной целью которой является наделение компьютера (машины) зрением, подобным человеческому или даже превосходящим его. В системах компьютерного зрения происходит извлечение, анализ и интерпретация полезной информации, содержащейся в отдельном изображении или последовательности изображений.

Глубокое обучение, глубинное обучение (deep learning)

Глубокое обучение  — применение искусственных нейронных сетей, содержащих более одного скрытого слоя, для решения задач обучения. Глубокое обучение уже стало частью передовых систем в самых разных областях. В частности, оно применяется в задачах компьютерного зрения и автоматического распознавания речи.

Искусственный интеллект (ИИ, AI, Artificial intelligence)

Искусственный интеллект  — это интеллект, проявляемый машинами (компьютерами). В информатике область исследования ИИ определяет себя как изучение так называемых «интеллектуальных агентов» — устройств, которые воспринимают свое окружение и предпринимают действия для повышения вероятности достижения определенной цели. В обиходе термин «искусственный интеллект» означает, что машина имитирует когнитивные (познавательные) функции, такие как «обучение» и «решение проблем», традиционно приписываемые человеческому разуму.

Цифровая обработка изображений (Digital image processing)

Цифровая обработка изображений  — использование компьютерных алгоритмов для обработки цифровых изображений. Цифровая обработка изображений имеет ряд преимуществ перед аналоговой. Так, для обработки входных данных можно использовать более широкий набор алгоритмов; при этом можно избежать таких проблем, как накопление шума и искажений сигнала при обработке изображения. Поскольку плоские изображения являются двухмерными, их цифровую обработку можно моделировать в виде многомерных систем.

Intlab Auto LPR

Intlab Auto LPR — SDK для интеграции функции распознавания номеров автомобилей.

Intlab Auto MMR

Intlab Auto MMR - SDK для интеграции функции оптического распознавания типов, марок и моделей автомобильных транспортных средств.

Intlab Coach 

Intlab Coach - SDK для интеграции функции оптического распознавания восьмизначных двухстрочных номеров пассажирских и почтовых вагонов стран СНГ и других стран, где используется колея 1520 мм.

Intlab Container

Intlab Container - SDK для интеграции функции оптического распознавания идентификационных номеров контейнеров.

Intlab Recognition Engines

Intlab Recognition Engines - семейство движков оптического распознавания различных объектов производства Intlab.

Intlab Wagon

Intlab Wagon - SDK для интеграции функции оптического распознавания восьмизначных номеров вагонов стран СНГ и других стран, где используется колея 1520 мм.

Intlab UIC

Intlab UIC - SDK для интеграции функции оптического распознавания UIC номеров вагонов.

Интеллектуальная транспортная система (ИТС, ITS)

Интеллектуальная транспортная система — комплекс передовых приложений, которые, сами по себе не обладая интеллектом, предоставляют пользователям инновационные сервисы, относящиеся к различным видам транспорта и регулированию транспортных потоков. Такие системы снабжают пользователей необходимой информацией и повышают безопасность, согласованность и рациональность использования транспортных сетей. Хотя термин «ИТС» (ITS, intelligent transportation system) может относиться к любым видам транспорта, директива Европейского Союза 2010/40/ЕС от 07.07.2010 г. определяет ИТС как системы, в которых информационно-коммуникационные технологии используются в области автодорожного транспорта, включая инфраструктуру, транспортные средства и пользователей, в управлении дорожным движением и управлении мобильностью, а также для взаимодействия с другими видами транспорта.

Машинное обучение (Machine learning)

Машинное обучение  — применение искусственного интеллекта (ИИ) для автоматического обучения системы и приобретения ею опыта с целью улучшения достигаемых системой результатов без явного программирования. При этом в основном разрабатываются компьютерные программы, способные получать данные и использовать их для самообучения. Машинное обучение применяется, в частности, в таких областях, как оптическое распознавание символов, обучение ранжированию и компьютерное зрение.

Распознавание марок и моделей автомобилей (Make and Model Recognition, MMR)

Автоматическое распознавание марки и модели автомобилей.

Нейронная сеть (Neural Network)

Нейронная сеть — математическая модель, а также её программное или аппаратное воплощение, построенная по принципу организации и функционирования биологических нейронных сетей — сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы. После разработки алгоритмов обучения получаемые модели стали использовать в практических целях: в задачах прогнозирования, для распознавания образов, в задачах управления и др.

Классификация объектов (Object classification)

Классификация объектов — назначение объектам семантических меток. Это одна из фундаментальных проблем в области компьютерного зрения. Классификация объектов может быть «кирпичиком» при решении многих других задач, таких как локализация объектов, обнаружение объектов и семантический анализ сцены.

Детектирование объектов (Object detection)

Детектирование объектов — компьютерная технология, связанная с компьютерным зрением и обработкой изображений, которая занимается обнаружением экземпляров семантических объектов определенного класса (например, людей, автомобилей, вагонов или контейнеров) в цифровых изображениях и видеозаписях.

Распознавание объектов (Object recognition)

Распознавание объектов  — способность воспринимать физические свойства объекта (такие, как форма, цвет и текстура) и применять к нему семантические атрибуты (например, идентифицировать его как яблоко). При этом система «понимает» предназначение объекта, «помнит» предшествующее восприятие этого объекта и «понимает» его взаимосвязь с другими объектами. Система должна обнаружить все объекты (ограниченный класс объектов в зависимости от набора данных) в данном изображении, локализовать (выделить) каждый из них с помощью рамки (ограничивающего прямоугольника) и снабдить эти рамки соответствующими метками.

Трэкинг объектов (Object tracking)

Трэкинг объектов - процесс последовательной локализации (отслеживания) движущегося в поле зрения видеокамеры объекта (или нескольких объектов). Алгоритм анализирует кадры видео и выдает положение движущихся целевых объектов в текущем кадре. Основная проблема в трекинге состоит в сопоставлении положений целевого объекта на последовательности кадров, особенно если объект движется быстро относительно частоты кадров видеопотока. Таким образом, системы трекинга обычно используют модель движения, которая описывает как может изменяться изображение целевого объекта при всевозможных различных его движениях. Трэкинг объектов имеет широкое применение, некоторые из применений: безопасность и видеонаблюдение, видеосвязь и сжатие видеопотока, анализ и контроль транспортных потоков.

Оптическое распознавание символов (Optical character recognition, OCR)

Оптическое распознавание символов  — электронное преобразование изображений машинописных, печатных или рукописных текстов в «цифровой» текст. Примеры таких изображений — отсканированные документы, фотографии документов и фотографии или изображения с видеокамер каких-то объектов (например, автомобильных номерных знаков, номерных обозначений на железнодорожных вагонах или грузовых контейнерах). Оптическое распознавание символов — распространенный способ оцифровки печатных текстов. Его использование позволяет редактировать распознанные тексты в электронном виде, быстро находить в них информацию, более компактно их хранить, публиковать их в интернете и использовать в машинных процессах, таких как когнитивные вычисления, машинный перевод, использование в качестве ключевых данных в хранилищах и базах данных и интеллектуальный анализ текста. Оптическое распознавание символов — это также область исследований, связанная с распознаванием образов, искусственным интеллектом и компьютерным зрением.

Радиальная дисторсия (Radial distortion)

Радиальная дисторсия — наиболее часто встречающийся тип искажений изображения, вносимых съемочным объективом. Этот тип дисторсии обладает радиальной симметрией, отсюда и название. В простейших случаях радиальная дисторсия может быть отрицательной («бочка») или положительной («подушка»).

Бочкообразная дисторсия (Barrel distortion)
При бочкообразной дисторсии масштаб изображения уменьшается по мере удаления от оптической оси. Искаженное изображение выглядит так, как будто его нанесли на сферу (или на бочку). Такой тип дисторсии может быть даже полезным. Например, он используется в фотообъективах «рыбий глаз» (fish eye), с помощью которых получают полусферические снимки. По сути, предметная плоскость бесконечной ширины переносится на конечную область изображения. При использовании объектива с переменным значением фокусного расстояния бочкообразная дисторсия начинает проявляться в средней части диапазона фокусного расстояния и усиливается по мере приближения к «широкоугольному» концу этого диапазона.

Подушкообразная дисторсия (Pincushion distortion)
При подушкообразной дисторсии масштаб изображения увеличивается по мере удаления от оптической оси. Как результат, линии, не проходящие через центр изображения, изгибаются вовнутрь, к центру изображения, из-за чего оно становится похожим на подушку.

Дисторсия типа «усы» (Mustache distortion)
Эта сложная дисторсия — сочетание подушкообразной и бочкообразной дисторсий. Она встречается реже этих простых дисторсий, но всё равно достаточно часто. Искажения начинаются ближе к центру изображения как бочкообразная дисторсия, а по мере удаления от него постепенно переходят в подушкообразную дисторсию. Как результат, горизонтальные линии в верхней половине кадра становятся похожими на слегка закрученные вверх усы (в нижней половине кадра усы будут «вверх тормашками»).

Точность (Precision)

Точность (Precision) — это отношение числа правильно идентифицированных объектов к общему числу предсказанных объектов (отношение числа истинно положительных результатов к сумме истинно положительных и ложно-положительных результатов). Мера точности характеризует, сколько полученных от алгоритма (движка распознавания) положительных ответов являются правильными. Чем больше значение точности, тем меньше число ложных распознаваний. Мера точности, однако, не дает представления о том, все ли правильные ответы вернул алгоритм, то есть не оценивает какую долю верных отрицательных ответов дал алгоритм.

Полнота (Recall)

Полнота (Recall) — это отношение числа правильно идентифицированных объектов к общему числу объектов, которые действительно есть на изображении (отношение числа истинно положительных результатов к сумме истинно положительных и истинно отрицательных результатов). Мера полноты характеризует способность алгоритма (движка распознавания) «предсказывать» как можно большее количество положительных ответов из ожидаемых. Необходимо отметить, что ложно-положительные ответы никак не влияют на эту метрику, то есть метрика Recall не оценивает сколько дополнительно к правильным было выдано ложно-положительных ответов.

Достоверность распознавания (Recognition accuracy) 

Достоверность распознавания - мера оценки качества распознавания какого-либо алгоритма(движка распознавания), обычно оценивается с помощью метрики F-мера, F = 2 * (Precision * Recall) / (Precision + Recall). Precision и Recall обеспечивают довольно исчерпывающую характеристику алгоритма, причем «с разных углов».  Recall демонстрирует способность алгоритма обнаруживать данный класс вообще, а precision — способность отличать этот класс от других классов. Обычно при создании алгоритмов для задач классификации, детектирования либо распознавания приходится постоянно балансировать между двумя этими метриками. Если вы пытаетесь повысить Recall, делая алгоритм более «оптимистичным», это приводит к ухудшению показателя Precision из-за увеличения числа ложно-положительных ответов. Если же вы модифицируете свой алгоритм, делая его более «пессимистичным», например, строже фильтруя результаты, то при росте Precision это вызывает одновременно и снижение показателя Recall из-за отбраковки какого-то числа правильных ответов.

Research & Development (НИОКР)

Research & Development (НИОКР) - совокупность работ, направленных на получение новых знаний и практическое применение при создании нового изделия или технологии. Научно-исследовательские работы — работы поискового, теоретического и экспериментального характера, выполняемые с целью определения технической возможности создания новой техники в определенные сроки.

Скользящий затвор (построчный перенос, rolling shutter)

«Скользящий затвор» (англ. rolling shutter) — способ получения изображения, при котором фотография при фотосъемке или каждый кадр при видеосъемке снимается не сразу целиком, а путем быстрого сканирования области изображения (например, сверху вниз или слева направо). Иными словами, разные части изображения формируются в разное время, а при воспроизведении изображение показывается сразу целиком, как будто его сняли одномоментно. Этот способ привносит предсказуемые искажения в изображения быстродвижущихся объектов или резких вспышек света. Есть другой способ получения изображения, так называемый «глобальный затвор» или «полнокадровый затвор» (англ. global shutter), при котором всё изображение формируется одномоментно.

Скользящий затвор может быть механическим или электронным. Преимущество этого способа состоит в том, что светочувствительная матрица поглощает фотоны на протяжении всего процесса формирования кадра, что фактически повышает чувствительность. Скользящий затвор используется во многих цифровых фото- и ​​видеокамерах с КМОП-матрицами. Привносимые искажения наиболее заметны при съемке быстродвижущихся объектов или резких вспышек света. Хотя в некоторых КМОП-матрицах используется принцип полнокадрового затвора, большинство КМОП-матриц в потребительских фото- и ​​видеокамерах работают по принципу скользящего затвора.

Альтернативой КМОП-матрицам являются приборы с зарядовой связью (ПЗС). Как правило, они более чувствительные, но и стоят дороже. В фото- и ​​видеокамерах на основе ПЗС часто используется полнокадровый затвор, то есть всё изображение формируется одномоментно, благодаря чему отсутствуют артефакты движения, свойственные изображениям, полученным по принципу скользящего затвора. Для обеспечения достаточно высокого качества распознавания (в частности, если речь идет о номерах движущихся в горизонтальном направлении вагонов или контейнеров) при скоростях выше 5 км/ч необходимо использовать камеры с глобальным затвором.

SDK (комплект средств разработки, комплект для разработчика, software development kit)

SDK - комплект средств разработки, который позволяет разработчикам программного обеспечения создавать собственные приложения используя функционал содержащийся в данном SDK, который доступен для интеграции через API этого SDK. SDK также часто включают в себя примеры кода и технические материалы по поддержке или другие помогающие быстро понять как работать с библиотеками из SDK.

UIC

UIC - Международный союз железных дорог, международная организация, объединяющая национальные железнодорожные компании с целью совместного решения задач в области развития железнодорожного транспорта. На сегодняшний день Международный союз железных дорог (МСЖД) насчитывает 194 члена на пяти континентах.

Распознавание номеров вагонов стран СНГ (Wagon CIS Number Recognition, Wagon CIS Code Recognition)

Распознавание номеров вагонов - распознавание номеров локомотивов, пассажирских и грузовых железнодорожных вагонов, нанесенных по стандарту стран бывшего СССР (колея 1520 мм).

Распознавание UIC номеров вагонов (Wagon UIC Number Recognition, Wagon UIC Code Recognition)

Распознавание UIC номеров вагонов - распознавание номеров локомотивов, пассажирских и грузовых железнодорожных вагонов, нанесенных согласно стандарту UIC (колея 1435 мм).


При подготовке данного глоссария были использованы материалы с сайта https://www.wikipedia.org.