Закон Ципфа: как и зачем производить новомодный анализ текста? Источник: http://lifeacademy.pearl.pp.ua/zakon-cipfa-kak-i-zachem-proizvodit-novomodnyj-analiz-teksta.html
QUOTE | Солнце поднимается, рисуя в небе траекторию, так похожую на закон Ципфа… С Вами Ирина Иваськив. Сегодня поисковой маркетинг набирает внушительные обороты, в результате чего появляется множество сервисов для текстового анализа. Помимо проверки грамматики, уникальности, заспамленности и прочего, тексты начали анализировать и на естественность. Поисковые системы без труда распознают искусственно сформированные тексты, автоматически выводя их из первых страниц результатов поиска. Вот почему для успешного продвижения продукта или услуги важно проверять тексты на естественность. Анализ текста по такому критерию осуществляется по закону Ципфа. Что такое «закон Ципфа»? Как практически производится анализ текста по закону Ципфа? Обо всём этом поговорим в статье. |
QUOTE | Значимость слов в тексте
Суть закона можно понять, взяв для примера компьютерную клавиатуру. Буквы на ней располагаются не в алфавитном порядке, а учитывая частоту встречаемости в словах. Это означает, что буквы, которые используются в словах русского языка чаще других, располагаются на русской клавиатуре ближе к центру (так удобнее для глаз и пальцев), а буквы, которые используются реже (например, буквы ё, ъ, э, й), располагаются на клавиатуре дальше от центра. Так же и поисковые системы распределяют сайты по позициям (в топе или подальше от него) в зависимости от значимости слов в тексте, условно разделяя их на 3 группы:
Важные слова: значимые ключевые тематические слова, несущие в себе основной смысл, в тексте встречаются не часто, в тексте их примерно 20% (но именно они и «вытягивают» тексты на высокие оценки – практическое действие закона Парето) Случайные: такие слова к основному смыслу текста прямого отношения не имеют, встречаются не часто (в этом их плюс), влияния на распределение сайтов в поисковых результатах не оказывают Вспомогательные: такие слова используются в предложениях, в основном, как связующие, к смыслу текста напрямую не относятся и, как и случайные слова, на результаты поисковой выдачи не влияют
|
|