Розмістіть свій проєкт безплатно й почніть отримувати пропозиції від фрилансерів-виконавців уже за лічені хвилини після публікації!

Написать парсер электронных деклараций.

1700 UAH

Додатки 2

Перегляд контактної інформації доступний тільки зареєстрованим користувачам.

Відгук замовника про співпрацю з Вадимом Koc

Якість
Професіоналізм
Вартість
Контактність
Терміни

Вадим выполнял работу не смотря на все трудности, искусственно не растягивая выполнение задач, докапывался до решения поставленной проблемы и решал её. Легко шёл на контакт.
Следует обратить внимание на чёткое обсуждение ТЗ на начальном этапе, так как склад ума всё же программный, то есть- Вадим видит способы решения задачи программно-прямолинейные, это не в коем случае не минус, но это стоит учитывать для более раннего этапа сотрудничества.

По результатам у меня остался полностью рабочий парсер елекронных деклараций, который может с экономить многие часы потенциальной работы. Большое спасибо за работу, так держать!

Відгук фрилансера про співпрацю з Валентином А.

Оплата
Постановка завдання
Чіткість вимог
Контактність

Интересное задание, интересный заказ. Но пришлось сделать больше, чем в ТЗ. По времени - лояльное отношение. Контактность - не часто и не редко, что очень хорошо.

Вадим Koc | Сейф Сейф

  1. 307    18  1
    Переможець7 днів1700 UAH

    Парсил разные сайты. Для парсинга использую php. Наиболее удобная для использования и по скорости - MySQL БД/СУБД. Могу сделать выгрузку в CSV или XML. Но я могу написать парсер и на C# + загрузка в AСсeSS, я так тоже делал, просто так может быть немного дольше, особенно если учесть, что у них сайт лагающий.

  1. 1748    31  0
    2 дні5000 UAH

    Здравствуйте! Обращайтесь) Опыт в выполнении подобных задач есть. Готов приступить прямо сейчас.

  • Андрей Л.
    29 квітня 2021, 19:02 |

    Приветствую!

    Действительно запросы выдают много хлама. Тестировал но так и не добился четкого ответа. Подскажите, что будет в запросе, т.к. вы заявили о фильтрации.

    Сразу скажу с Access не работаю......

  • Валентин А.
    29 квітня 2021, 21:49 |

    Мне по сути не обязателен именно access, после отбора мной данные будет вноситься все равно в ibm ibase, поэтому не принципиально, главное что бы хорошо структурировано было на выходе.


    Фильтрация нужна что бы по большей мере получать только актуальную и нужную информацию. Указать год подачи декларации, указать категорию державной посади. В общем только те что уже продуманы в самой системе сайта.

    image


    Мне кстати удавалась добиться хорошего результата проводя поиск не через сам сайт, а через запрос в гугле используя “site:”

    Лишних результатов совсем не было, только года все подряд.

  • Андрей Л.
    3 травня 2021, 16:16 |

    Добрый день! Да так и есть, я брал ФИО из выдачи гугла, и пытался найти по айпи и фамилии анкеты, из выдачи в 500 результатов
    у меня не было 100% совпадения по ФИО. Что ставит под сомнение использование айпи по поиску информации с входными данными ФИО. В документах
    по айпи, говорится об указании индификатора персоны, и в дальнейшем можно производить сортировку.
    Похоже что решение - это получение индификатора. из выдачи гугла, и дальнейшей обработки данных.
    Другого решения по получению валидных данных, я пока не вижу.

  • Валентин А.
    4 травня 2021, 9:18 |

    Хм, а на сколько результат портиться лишними данными?

    Из 10 результатов если 2 неверных то это довольно терпимо, главное тогда что бы от них можно было без труда избавиться.


    хотя элегантным решением это не назовёшь.


    а если проиндексировать сайт НАЗК с помощью какого-то из инструментов, например YACY (с другими не знаком)?

    И использовать данные для получений id людей.

    Я думаю это куда проще чем тянуть информацию из гугла и не требует сильной ручной настройки(хотя не совсем понимаю как индексировать НАЗК, там же нет каталога лиц по которому может пройтись паук.


    Как вы вообще, смогли бы взяться за это задание, или теперь оно выглядит неподъёмным?

  • Андрей Л.
    4 травня 2021, 11:02 |

    Там ничего не нужно индексировать, каталог там есть ..... Но я предполагаю что вам надо графический интерфейс и по другому никак,
    я же работаю в консоле.