Синонимайзер. Продолжение

Posted Опубликовал cross в Разработка сайтов     Comments 14 comments
Янв
15

Подошел к созданию собственного синонимайзера вплотную. Что есть:

  1. Шаблон сайта под ру-трафик
  2. База для его наполнения (распарсенная) 2000 страниц
  3. База слов синонимов на 5000+

Необходимо сделать синонимайзер, который качественно, то есть удобоваримо для пользователей и поисковых систем превратит все эти 2000 страниц контента в уникальные тексты. О том, что такое уникальный контент именно для Google и Яндекс информацию от первоисточника найти сложно. Статья о качественном для пользователей и поисковых систем контенте есть. Вывод делаю такой:

  1. Неуникальный контент можно использовать без синонимирования
  2. Лучше разбавлять его 15-30% уникального контента, тоесть менять, допустим, каждое 5ое слово в тексте на синоним или добавлять предложения
  3. Получить несколько входящих ссылок на каждую такую страницу

2ой пункт - как раз я и собираюсь реализовать. Для этого первым делом нужно сформировать базу синонимов в MySQL. Это пожалуй самый выгодный вариант, поскольку иначе, работая с файлом например, пришлось бы каким-либо образом формировать или структуировать все синонимы, формировать индексы и заботиться о быстродействии. MySQL же все эти вопросы снимает и любая выборка будет лишь долями секунды.

Осталось лишь придумать алгоритм самого синонимирования. Основных вариантов вижу два:

  • Разбиение контента на слова, выкидывание, слов менее 3х букв, синонимирование каждого 4ого слова
  • Разбиение контента на слова, вытягивание самых длинных слов и их синонимирование

Конечно же примитивно, но думаю с этого вполне можно начать. Пока все, начинаю делать.

Отступление.

Не успел написать пост "XAP и продвижение блога", как уже вижу на него дубль в интеренете, копирайт конечно же сохранен, но вот не совсем понял логики этого копирования. Надеюсь просто статья понравилась, хотя по всей видимости это сплог. А вот этот пост о "Лекарстве против Supplimental" натолкнул меня на ответ моих недавних размышлений о том, почему же все таки так снизилась посещаемость на блоге - оказывается смена шаблона может значительно на это повлиять...

Похожие посты:

  1. Низкочастотные запросы. Продолжение эксперимента
  2. В продолжение зайцева
  3. Синонимайзер
  4. Открытая админка. Продолжение
  5. Моя стратегия продвижения. Продолжение

14 Комментов к “Синонимайзер. Продолжение”

  • интересная статейка. спасибки!

  • Ну что тут скажешь, если реализуешь достойный продукт я готов стать твоим первым покупателем :)

  • А как узнать о достойности продукта? Лично я ещё подожду некоторое время и подожду первых отзывов.

  • готовьте…буду следить за новостями…если все получится как надо – готов купить…

  • Как только будут первые результаты, сразу же выложу в инет посмотреть и поюзать.

  • да не забудь я тоже хочу поюзать

  • ну ты прав.. спасибо за ссылочки))

  • [...] достаточно простым для меня. Первый взгляд на технологию синонимазации текста я описал в одном из предыдущих постов. Сегодня [...]

  • Есть синонимайзер(прога) и база 6000 слов – отдам за 15$

    ася 416 609 878

  • Мне нужен скрипт скорее. Прога не подходит. Но за предложение спасибо.

  • Тоже ищу качественный синомайзер. Пока путного ничего не встречал.

  • Качественного не найдете… особенно бесплатно! Базы надо покупать в любом случае.

  • Как продвигается работа над синомайзером, можно ли уже скачать демку какую-нибудь. Хочу быть тестером.

  • У меня качественный, только работает пока медленно, т.к. базу не накопил. Если слова нет в базе, ищет в интернете. Первыми подставляются более распространенные слова, работает со словоформами. Есть возможность выбора из предложенных вариантов. Планирую сделать учет выбора пользователем, так сказать обучаемость. Сервис абсолютно бесплатный

Оставить коммент

Donation Bar

Order Links

Топ комментаторов

  • No commentators.