Jorik
21.06.2016, 01:35
Кто парсит контент с помощью датакул 7, делюсь базой стоп слов от нашей партнерки + добавлены такие слова как "папа, мама, сестру, животн" и.т.д.
Завешивать дорвеи банерами для фильтрации стоп слов не вижу смысла. И так поисковики негативно к ним относятся.
База готовая для импорта.
Думал сразу кормить базой синонимов для обычной замены, но боюсь что парсинг затянется на очень долго.
P.S По мере добавления слов, буду обновлять и тут.
Не стал заморачиваться синонимами, тупо проставлены цыфры.
Base 0.1 (https://yadi.sk/d/srgtQHpTsfSEc)
Завешивать дорвеи банерами для фильтрации стоп слов не вижу смысла. И так поисковики негативно к ним относятся.
База готовая для импорта.
Думал сразу кормить базой синонимов для обычной замены, но боюсь что парсинг затянется на очень долго.
P.S По мере добавления слов, буду обновлять и тут.
Не стал заморачиваться синонимами, тупо проставлены цыфры.
Base 0.1 (https://yadi.sk/d/srgtQHpTsfSEc)