Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Студенческий форум > Международный конгресс юмористов (в Питере) + Text mining > Закон Ципфа: как и зачем производить новомодный


Автор: VAL 26.09.2019 19:38
Закон Ципфа: как и зачем производить новомодный анализ текста?
Источник: http://lifeacademy.pearl.pp.ua/zakon-cipfa-kak-i-zachem-proizvodit-novomodnyj-analiz-teksta.html

QUOTE
Солнце поднимается, рисуя в небе траекторию, так похожую на закон Ципфа… С Вами Ирина Иваськив. Сегодня поисковой маркетинг набирает внушительные обороты, в результате чего появляется множество сервисов для текстового анализа. Помимо проверки грамматики, уникальности, заспамленности и прочего, тексты начали анализировать и на естественность. Поисковые системы без труда распознают искусственно сформированные тексты, автоматически выводя их из первых страниц результатов поиска. Вот почему для успешного продвижения продукта или услуги важно проверять тексты на естественность. Анализ текста по такому критерию осуществляется по закону Ципфа. Что такое «закон Ципфа»? Как практически производится анализ текста по закону Ципфа? Обо всём этом поговорим в статье.


QUOTE
Значимость слов в тексте

Суть закона можно понять, взяв для примера компьютерную клавиатуру. Буквы на ней располагаются не в алфавитном порядке, а учитывая частоту встречаемости в словах. Это означает, что буквы, которые используются в словах русского языка чаще других, располагаются на русской клавиатуре ближе к центру (так удобнее для глаз и пальцев), а буквы, которые используются реже (например, буквы ё, ъ, э, й), располагаются на клавиатуре дальше от центра. Так же и поисковые системы распределяют сайты по позициям (в топе или подальше от него) в зависимости от значимости слов в тексте, условно разделяя их на 3 группы:

    Важные слова: значимые ключевые тематические слова, несущие в себе основной смысл, в тексте встречаются не часто, в тексте их примерно 20% (но именно они и «вытягивают» тексты на высокие оценки – практическое действие закона Парето)
    Случайные: такие слова к основному смыслу текста прямого отношения не имеют, встречаются не часто (в этом их плюс), влияния на распределение сайтов в поисковых результатах не оказывают
    Вспомогательные: такие слова используются в предложениях, в основном, как связующие, к смыслу текста напрямую не относятся и, как и случайные слова, на результаты поисковой выдачи не влияют

Автор: VAL 26.09.2019 19:39
QUOTE
Условная схема “1-2-3”

Согласно закону Ципфа, естественный текст будет выглядеть примерно так. Допустим, самым часто употребляемым словом в тексте является слово «программист». Следующее за ним по частоте употребления – слово «сайт», а после него – слово «продвижение». Если слово «программист» используется в тексте 12 раз, то для естественности слово «сайт» должно быть использовано в тексте 6 раз, а слово «продвижение» – 3 раза. Текст, составленный таким образом, пройдёт проверку на естественность и будет включён в верхние позиции поисковых запросов. Другими словами, суть закона Ципфа можно выразить так:

    второе слово должно использоваться в 2 раза реже, чем первое (12:2=6 раз)
    третье слово должно использоваться в 3 раза реже, чем первое (12:3=4 раза)
    и так далее

Давайте назовём эту закономерность условным названием «1-2-3», где 1 – первое слово, 2 – второе слово, 3 – третье слово. Цифры 2 и 3 напомнят также, что второе слово надо использовать в 2 раза реже, а третье – в 3.

Автор: VAL 26.09.2019 19:40
QUOTE
Важные предостережения

Сегодня уже доказано, что набор несвязных случайных слов тоже будет подчиняться теории Ципфа. Другими словами, анализ текста по закону Ципфа – это самый обычный математический анализ, статистический феномен, искусственно созданный инструмент. Закон Ципфа не имеет отношения:

    к содержательности текста, ведь если проверить литературные произведения великих классиков, то окажется, что многие из них не соответствуют данному закону
    к профессионализму автора, ведь любую бессмысленную кучку слов можно «заточить» таким образом, что закон Ципфа определит текст как «профессиональный»
    к оригинальности текста, ведь 100%-ную уникальность могут иметь как тексты с высокими оценками по Ципфу, так и тексты с низкими оценками по Ципфу
    к продвижению сайтов, ведь на первой странице выдачи часто оказываются тексты с низкими оценками по Ципфу, а на 99-й – тексты с высокими оценками по Ципфу

Автор: VAL 26.09.2019 19:41
Закон Хипса в копирайтинге

QUOTE
Очень похож на закон Ципфа, являясь его следствием. Если не влезать в дебри формул, то закон Хипса показывает количество уникальных слов в тексте в зависимости от его длины. Классический график по закону Хипса строится примерно так: по горизонтали – объём текста, по вертикали – количество уникальных слов в тексте. Чем длиннее текст, тем количество уникальных слов должно быть выше. Если этот показатель не повышается, автор начинает лить воду. По графику будет заметно, с какого момента оригинальность текста остановится в развитии.

Автор: VAL 26.09.2019 19:44
(2018) Увеличиваем естественность текста по закону Ципфа
Источник: https://copywriting-tarasov.ru/?p=552

Автор: VAL 21.02.2021 08:34
doh.gif

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)