И ещё по поводу поиска описаний хотел сказать. Программа при поиске по Маркету (на еМатриксе не проверял) может найти несколько описаний (для некоторых ноутов, Самсунга, например есть одинаково называющиеся модели, отличающиеся ОС, HDD и пр.), но так как не будет знать какое нужно, она не добавит никакого.
Можно такие ситуации, когда есть несколько вариантов описания, как-то по другому обрабатывать, предлагать, например, после поиска в ручную выбрать нужное описание. А ещё лучше было бы, если бы программа могла в таких ситуациях сверять описание из прайса (например, Samsung R610-FS07 16"(1366*768), C2D P7450(2,13GHz), 3G, 250G, DVDRW, NV 9200 GS 512Mb, WiFi, BT, camera, VistaHomePremium) с найденными описаниями. Естественно предварительно нужно будет подсказать ей что "VistaHomePremium" это ОС, BT - BlueTooth, 250G это объем HDD, P7450 это код процессора и т. д.
Например, как это может выглядеть:
Программа находит несколько описаний, и не может из них выбрать, она откладывает задачу в конец очереди, и возвращается к ней, когда с остальными закончила. Перед пользователем появляется диалог, предлагающий указать как обозначаются в описании из прайса основные характеристики для данной группы товаров (определяемые пользователем, но вобще было бы хорошо, если для группы "Принтеры", к примеру, по умолчанию был какой-то набор характеристик, которые обычно в прайсах пишут), пользователь выделяет какие-то части описания из прайса, и сообщает программе что это. После этого программа парсит несколько найденных описаний, и сопоставляет их с описанием из прайса, после чего выдает наиболее вероятные описания для данной позиции.
Ну вот как-то так. Было бы полезно, у Самсунга может быть пяток-другой разных модификаций для ноутов, автоматизация процесса ручного поиска не помешала бы.
И ещё по поводу поиска описаний, программа при поиске по Маркету
И ещё парсер характеристик не повредил бы, что бы делать из одной характеристики несколько. Например, из "385x275x39 мм, 3.5 кг" две характеристики:
Размеры: 385x275x39 мм
Вес: 3.5 кг
И ещё было бы здорово что бы можно как-то шире работать с унификацией характеристик, не только автоматически менять 15" (видимая область 15") на 15", но и, к примеру, делать из "4 x USB 2.0, VGA x HD-15F" => "USBx4, VGA (D-Sub)". Такой функционал ещё не реализован, когда не вся характеристика, а только её часть подменяется? Т. е. что бы в примере "4 x USB 2.0" менялось на то что мне нужно не только когда рядом есть про VGA, но и когда дальше о RJ-45 идет, например.
Размеры: 385x275x39 мм
Вес: 3.5 кг
И ещё было бы здорово что бы можно как-то шире работать с унификацией характеристик, не только автоматически менять 15" (видимая область 15") на 15", но и, к примеру, делать из "4 x USB 2.0, VGA x HD-15F" => "USBx4, VGA (D-Sub)". Такой функционал ещё не реализован, когда не вся характеристика, а только её часть подменяется? Т. е. что бы в примере "4 x USB 2.0" менялось на то что мне нужно не только когда рядом есть про VGA, но и когда дальше о RJ-45 идет, например.
C уважением, Алексей.
Этот функционал находится в разработке.Aleksey писал(а):И ещё по поводу поиска описаний хотел сказать. Программа при поиске по Маркету (на еМатриксе не проверял) может найти несколько описаний (для некоторых ноутов, Самсунга, например есть одинаково называющиеся модели, отличающиеся ОС, HDD и пр.), но так как не будет знать какое нужно, она не добавит никакого.
Можно такие ситуации, когда есть несколько вариантов описания, как-то по другому обрабатывать, предлагать, например, после поиска в ручную выбрать нужное описание. А ещё лучше было бы, если бы программа могла в таких ситуациях сверять описание из прайса (например, Samsung R610-FS07 16"(1366*768), C2D P7450(2,13GHz), 3G, 250G, DVDRW, NV 9200 GS 512Mb, WiFi, BT, camera, VistaHomePremium) с найденными описаниями. Естественно предварительно нужно будет подсказать ей что "VistaHomePremium" это ОС, BT - BlueTooth, 250G это объем HDD, P7450 это код процессора и т. д.
С уважением, поддержка ElbuzGroup.
В догонку - не помешал бы ещё инструмент, который бы вообще следил за форматом, в котором информация попадает в БД, так как я думаю большинство собирает информацию для одного проекта, и формат подачи информации должен быть единообразен.Aleksey писал(а):И ещё парсер характеристик не повредил бы, что бы делать из одной характеристики несколько. Например, из "385x275x39 мм, 3.5 кг" две характеристики:
Размеры: 385x275x39 мм
Вес: 3.5 кг
И ещё было бы здорово что бы можно как-то шире работать с унификацией характеристик, не только автоматически менять 15" (видимая область 15") на 15", но и, к примеру, делать из "4 x USB 2.0, VGA x HD-15F" => "USBx4, VGA (D-Sub)". Такой функционал ещё не реализован, когда не вся характеристика, а только её часть подменяется? Т. е. что бы в примере "4 x USB 2.0" менялось на то что мне нужно не только когда рядом есть про VGA, но и когда дальше о RJ-45 идет, например.
Было бы здорово, что бы такой инструмент мог ещё предупреждать о том что в БД попала информация с HTML-тегами, и предложил бы варианты работы с ними (убрать теги - оставить только текст, или заменить теги на запятые, если это BR какой-нибудь, например).
C уважением, Алексей.
когда разработка будет закончена?, а то у меня несколько сотен ноутов, раз 10 пробовал парсить, и сразу бросал эту идею-- бред получается, правда тут всё равно проблема на маркете не успевают появляться описания моделей с теми маркировками что поступают в продажу, а может они и есть просто отличаются по цвету ( маркировка) и по региону( маркировка)
вот если бы с сайта производителя...
их вытягивать
но это наверное фантастика
вот если бы с сайта производителя...
но это наверное фантастика
Я лично ноуты таскаю с мэйла - там они отлично ищутся по артикулуdaniley писал(а):когда разработка будет закончена?, а то у меня несколько сотен ноутов, раз 10 пробовал парсить, и сразу бросал эту идею-- бред получается, правда тут всё равно проблема на маркете не успевают появляться описания моделей с теми маркировками что поступают в продажу, а может они и есть просто отличаются по цвету ( маркировка) и по региону( маркировка)
вот если бы с сайта производителя...их вытягивать
но это наверное фантастика
прикольно, а когда их 700 моделей? все в полуавтоматическом режиме...
Я уже поднял в форуме тему, что надо бы мэйл на автоматические рельсы перекладывать!
была б моя воля я б все парсеры поставил на автомат 
Ага!daniley писал(а):была б моя воля я б все парсеры поставил на автомат
Вы случайно не парсите моноблоки и десктопы? Сбился с ног - нигде не могу их найти - ни в мэйле ни в маркете
