Регулярные выражения для автомат. сопоставления товаров
Добавлено: 21 июл 2009 09:15
Это нововведение появилось в версии E-Trade PriceList Importer 1.9.0.
В программе E-Trade PriceList Importer появилась возможность создавать правила на основании регулярных выражений для выбранных категорий, для последующего автоматического сопоставления товаров между списками СТУС и СТИПП. Так же имеется возможность использовать настроенные регулярные выражения для формирования (заполнения): Артикула и Модели.
Справочный материал:
Регуля́рные выраже́ния (англ. regular expressions, сокр. RegExp, RegEx, жарг. регэ́кспы или ре́гексы) — система синтаксического разбора текстовых фрагментов по формализованному шаблону, основанная на системе записи образцов для поиска. Образец (англ. pattern), задающий правило поиска, по-русски также иногда называют «шаблоном», «маской». Регулярные выражения произвели прорыв в электронной обработке текста в конце XX века. Они являются развитием символов-джокеров (англ. wildcard characters).
Истоки регулярных выражений лежат в теории автоматов и теории формальных языков. Эти области изучают вычислительные модели (автоматы) и способы описания и классификации формальных языков. В 1940-х гг. Уоррен Маккалок и Уолтер Питтс описали нервную систему, используя простой автомат в качестве модели нейрона. Математик Стивен Клини позже описал эти модели, используя свою систему математических обозначений, названную «регулярные множества». Кен Томпсон встроил их в редактор QED, а затем в редактор ed под UNIX. С этого времени регулярные выражения стали широко использоваться в UNIX и UNIX-подобных утилитах, например: expr, awk, Emacs, vi, lex и Perl. Регулярные выражения в Perl и Tcl происходят от реализации, написанной Генри Спенсером. Филип Хейзел разработал библиотеку PCRE (англ. Perl-compatible regular expressions — Perl-совместимые регулярные выражения), которая используется во многих современных инструментах, таких как PHP и Apache.
Ссылки на другие справочные материалы:
MSDN - Знакомство с регулярными выражениями(рус.)
Онлайн-редактор регулярных выражений (PCRE) с полной подсветкой синтаксиса (java-applet)(англ.)
Программа на JavaScript для тестирования регулярных выражений(англ.)
Сборник регулярных выражений в разных форматах(англ.)
Работа с регулярными выражениями в программе E-Trade PriceList Importer.
Регулярные выражения настраиваются в справочнике категорий товаров для каждой категории в отдельности.
Вид окна настройки рег. выражений:
Описание колонок:
"А" - запись активна и участвует в обработке данных.
"З" - замена результатом данного выражения поля "Назначение" в импортируемом товаре.
"Назначение" - применение строки с выражениями для выбранного назначения, возможные значения: Артикул, Модель, Наименование.
"У" - условие между выражениями в строке, возможные значения: "И" и "ИЛИ".
"Регулярное выражение №1-5" - регулярные выражения для идентификации строки с товаром, возможно задавать до 5 различных выражений и объединять их условиями "И" и "ИЛИ".
"МДР" - минимальная длина результата выполнения регулярного выражения, количество символов в итоговом результате. Если результат выполнения регулярного выражения меньше заданного в этой ячейке, тогда эта строка не участвует в сопоставлении товаров.
"Примечание" - комментарий к строке с регулярными выражениями.
Тестирование регулярных выражений:
Так же можно тестировать на основании списка товаров из прайс-листов поставщиков (СТИПП), тестируются только не найденные товары (без флажка "Н"), результат тестирования экспортируется в файл MS Excel:
Тестирование на основании СТИПП более эффективно для проверки ваших регулярных выражений на реальных товарах из прайсов, в отчете видно какой из товаров в СТИПП с каким товаром в СТУС сопоставился, так же видно как сработали регулярные выражения для товаров.
В программе E-Trade PriceList Importer появилась возможность создавать правила на основании регулярных выражений для выбранных категорий, для последующего автоматического сопоставления товаров между списками СТУС и СТИПП. Так же имеется возможность использовать настроенные регулярные выражения для формирования (заполнения): Артикула и Модели.
Справочный материал:
Регуля́рные выраже́ния (англ. regular expressions, сокр. RegExp, RegEx, жарг. регэ́кспы или ре́гексы) — система синтаксического разбора текстовых фрагментов по формализованному шаблону, основанная на системе записи образцов для поиска. Образец (англ. pattern), задающий правило поиска, по-русски также иногда называют «шаблоном», «маской». Регулярные выражения произвели прорыв в электронной обработке текста в конце XX века. Они являются развитием символов-джокеров (англ. wildcard characters).
Истоки регулярных выражений лежат в теории автоматов и теории формальных языков. Эти области изучают вычислительные модели (автоматы) и способы описания и классификации формальных языков. В 1940-х гг. Уоррен Маккалок и Уолтер Питтс описали нервную систему, используя простой автомат в качестве модели нейрона. Математик Стивен Клини позже описал эти модели, используя свою систему математических обозначений, названную «регулярные множества». Кен Томпсон встроил их в редактор QED, а затем в редактор ed под UNIX. С этого времени регулярные выражения стали широко использоваться в UNIX и UNIX-подобных утилитах, например: expr, awk, Emacs, vi, lex и Perl. Регулярные выражения в Perl и Tcl происходят от реализации, написанной Генри Спенсером. Филип Хейзел разработал библиотеку PCRE (англ. Perl-compatible regular expressions — Perl-совместимые регулярные выражения), которая используется во многих современных инструментах, таких как PHP и Apache.
Ссылки на другие справочные материалы:
MSDN - Знакомство с регулярными выражениями(рус.)
Онлайн-редактор регулярных выражений (PCRE) с полной подсветкой синтаксиса (java-applet)(англ.)
Программа на JavaScript для тестирования регулярных выражений(англ.)
Сборник регулярных выражений в разных форматах(англ.)
Работа с регулярными выражениями в программе E-Trade PriceList Importer.
Регулярные выражения настраиваются в справочнике категорий товаров для каждой категории в отдельности.
Вид окна настройки рег. выражений:
Описание колонок:
"А" - запись активна и участвует в обработке данных.
"З" - замена результатом данного выражения поля "Назначение" в импортируемом товаре.
"Назначение" - применение строки с выражениями для выбранного назначения, возможные значения: Артикул, Модель, Наименование.
"У" - условие между выражениями в строке, возможные значения: "И" и "ИЛИ".
"Регулярное выражение №1-5" - регулярные выражения для идентификации строки с товаром, возможно задавать до 5 различных выражений и объединять их условиями "И" и "ИЛИ".
"МДР" - минимальная длина результата выполнения регулярного выражения, количество символов в итоговом результате. Если результат выполнения регулярного выражения меньше заданного в этой ячейке, тогда эта строка не участвует в сопоставлении товаров.
"Примечание" - комментарий к строке с регулярными выражениями.
Тестирование регулярных выражений:
Так же можно тестировать на основании списка товаров из прайс-листов поставщиков (СТИПП), тестируются только не найденные товары (без флажка "Н"), результат тестирования экспортируется в файл MS Excel:
Тестирование на основании СТИПП более эффективно для проверки ваших регулярных выражений на реальных товарах из прайсов, в отчете видно какой из товаров в СТИПП с каким товаром в СТУС сопоставился, так же видно как сработали регулярные выражения для товаров.