Синонимайзер
Хотел было дать определение и начал с поиска в википедии. Как ни странно самая крупная энциклопедия не знает слова "синонимайзер", а значит будет так:
Синонимайзер - это скрипт любого вида на любом языке программирования, позволяющий реализовать замену всех возможных и значимых слов исходного текста на их синонимы. Чаще всего применяется для создания уникального текста.
О нем я задумался после того, как проанализировал сделанную мною работу. Не согласится с тем, что админка - это хорошо, с тем, что с ее помощью можно будет добавлять, редактировать, удалять, структуировать и перемещать информацию в базе дабы привести сайт в идеальное состояние - никак нельзя.
Но возникает вопрос: стоит ли заниматься созданием чистого сайта, который в последствии будет наполнен, если за несколько рабочих дней можно создать начальную базу для него, просто распарсив уже имеющуюся информацию в интернете?
Я лично склоняюсь к парсингу с условием уникализации текстов. Вот только, когда попробовал найти в инете готовый синонимайзер, у меня ничего не вышло. Все они или платные или их качество совершенно не понятно.
А по существу-то необходима база слово-синоним в необходимых падежах и с правильными окончаниями, которая просто будет выполнять strtr функцию php. Качество работы такого скрипта будет лишь определятся качеством этой базы. А платить $150 за одну функцию... Как-то не правильно.
С другой стороны, если не использовать синонимайзер, будет ли результат и смысл в проделанной работе, ведь сайт скорее всего попадет под пессимизацию. Вот и получается, что и синонимайзер наверное прийдется писать самому.
Похожие посты:
18 Комментов к “Синонимайзер”
Оставить коммент
Donation Bar
- Как сюда попасть
- Блог о доменных именах (5.1$)
- Заработок в интернет (5$)
- Магазин духов с феромонами (2$)
- Арбитраж трафика. Обзор бирж трафика (2$)
- Блог Поискового Робота (1.51$)

Опубликовал cross в
[YS.PRO] :
Синонимайзер – вещь полезная. Только вот писать ее на php, на мой взгляд, нерационально. Ну это если учесть скорость выполнения скрипта. Все ж лучше для этих целей C/C++. Думаю сам как-нибудь взяться за написание оного.
cross :
Мы наверное о разных объемах и сферах применения синониимайзера говорим.
У меня цель такая – парсинг ресурса, синонимайзер для текстов – новый ресурс среднего и большого объема.
Синонимайзер :
[...] сделать синонимайзер, который качественно, то есть удобоваримо для [...]
Синонимизация. Мы ее теряем :) | cross{blog} :
[...] сейчас не хватает – уникального контента. А так как я синонимайзер еще ранее хотел написать, под другой сайт, разработке [...]
Arhat :
Синонимайзер на PHP – это очень даже реальная вещь. Когда-то на заре своей программерской деятельности, я на Delphi писал кучу маленьких прог для работы с текстом, например “склонялку” и перестановщик фраз, генератор приключенческих и ситорических текстов… Позже понял, что и синонимайзер написать очень даже реально, на любом языке. Всё упирается в знание языка и понимание того, что и как ты хочешь сделать с текстом. Сейчас почитал и прям руки зачесались написать такую штуку на PHP – совместить парсер сайтов и синонимайзер… А впоследствии можно из этого генератор html-ек сделать, и будет клепать сайты
cross :
У меня к сожалению опыта в этом деле нет и впервые сам решил попробовать написать синонимайзер…
Как оказалось, русский язык непобедим…
Попробую чуть позже его сделать.
Пока же уникальность текстов пытаюсь сохранить иными путями.
Wincert :
Вот кажется написать синонимайзер то несложно, одна функция там preg_replace() и все, а попробуй хорошую базу синонимов составь для замены, вот тут то и возникает проблема.
cross :
Так введь в том и суть, что необходимо составить лингвистический анализатор, который по корням слов будет заменять слова в нужных формах.
Вопрос о базе в таком случае снимается. Но поднимается следующий – до какой степени сложности можно развивать этот анализатор, учитывая, что в одном лишь русском языке просто тысячи правил
Потому собственно я пока и отошел от этой идеи. Одному ничего достойного не написать. (
cross :
Покапался в интернете и нашел две интересные заметки:
1. Система предлагает варианты замены фрагментов текста (синонимайзер) и перефразирование (на основе синтаксического анализа), при этом пользователь может согласиться с предложенным вариантом замены фрагмента, выбрать другой вариант или отказаться от замены. Более подробно о данном синонимайзере и синонимизации в целом.
2. Синонимайзер текстов для русского языка работающей на основе Microsoft Word.
Вован :
Яндекс когда-то выкладывал программу для анализа слов, довольно интересная штука. Если нужно, пиши мне на мыло, у меня где-то валяется, поищу. Ещё большая проблема — это подобрать синоним учитывая тематику текста. Например слово “окно”. В тексте про пластиковые окна и в тексте про программы синонимы надо использовать разные. Или взять слово “при”. Это одновременно предлог и одновременно глагол. И таких ситуаций кучи.
Я думаю, что нельзя автоматически глубоко синонимизировать текст не правратив его в кашу.
Юрий :
Для грамотной синонимизации необходимо базы синонимов делить по тематикам, как, например словари в электронных переводчиках – тогда на выходе получится нормально воспринимаемый человеком текст. А на чем писать – это кому какой язык больше по душе. Я например – за PHP, т.к. синонимайзер более ценен, если его можно прикрутить к движку сайта
Natali :
А какой нибудь бесплатный и нормальный синонимайзер посоветуете?
Skazka252 :
Хороших, бесплатных наверное нет. Если покопаться то возможно найти взломанные.
Sedoi :
Хороших бесплатных конечно нет. Но можно найти альтернативный способ.То бишь серверные сервисы, за небольшие вложения. Покупать конечно за 40-50 уев,думаю дороговато.
Вадим :
Народ, сам синонимайзер рисуется одной строчкой на php за пару минут используя регулярку, вся задача состоит в качественной базе синонимов
работает наура при качественной базе, текст получается 100% уник и при чтении хрен отличишь, что писал это не человек, хотя единственное что бросается в глаза так это грамотность такого текста, создается впечатление, что писал даун
Вадим :
А вот пример работы, мой комментарий, только синонимизирован, получилось процентов 30% синонимизации, я же говорю, все зависит от базы синонимов, чем она больше, тем глубже будет синонимизация.
——————————
Народ, сам синонимайзер рисуется одной строкой на php за несколько минут используя регулярку, вся проблема состоит в высококачественной базе синонимов работает наура при высококачественной базе, текст выходит 100% уник и при чтении хрен отличишь, что писал это не человек, хотя единственное что кидается в глаза так это грамотность такового текста, создается впечатление, что писал даун
David :
Как насчет того, что написать синонимайзер можно одной строкой я не знаю, а вот из всех что я видел, phpsin наверное одиз из немногих, после которого текст не теряет смысла и остается читаемым….
Валера :
согласен, phpsin неплохой синонимайзер ,тоже им пльзуюсь пока доволен