Описание алгоритма Leegle

Leegle cканирует любые тексты и находит влияющие / гипнотические конструкции, выделяет и анализирует их.

Исходная база данных состоит из 200000 корневых морфем русского языка и размечена вручную, специалистами компании. Каждое слово наделено весом (оценкой) от 1 до 5 в зависимости от степени влияния на подсознание. Критерии оценки слов разработаны на основе предварительных исследований и выводов, описанных в статье «___».

Оценку 1-2 имеют нейтральные слова,
оценку 3 — слова имеющие среднее влияние,
оценку 4-5 — слова, отражающие образы сильно воздействующие на подсознание.

Алгоритм принимает текст на любом из языков, обрабатываемых Google Translate API. Текст, при надобности, переводится на русский язык. После разбивается на отдельные слова и к каждому слову определяется оценка.

Согласно предложенной разработчиками концепции, гипнотическое воздействие передается при помощи образов, поэтому при переводе, достигается практически 100% передача образов используемых в тексте.

Благодаря этому алгоритм Leegle является лингвонезависимым и может определять гипнотическое воздействие на любом из переводимых на русский языков.

Основные показатели

Показатель РАСПРЕДЕЛЕНИЕ отображает общий уровень манипулятивного влияния текста. Он определяется как среднее арифметическое полученных оценок в тексте.

Поскольку на силу внушающего воздействия текста влияет частота появления внушающих образов, следующий показатель ЧАСТОТА учитывает отклонение от средней частоты использования слова в языке. Для этого используется частотный словарь.
В случае, если частота использования слова существенно превышает средний показатель, оценка слова пропорционально увеличивается. Показатель ЧАСТОТА отражает возможное использование нескольких приемов внушения.

Последний показатель ОБЪЕМ демонстрирует долю высоких оценок в тексте. Сколько процентов 5-к и 4-к относительно всех оценок.
В психологически нейтральных текстах, этот показатель редко превышает 15-20% от общего объема слов. Когда текст специально насыщается словами-аттрактантами, способствующими гипнозу, показатель превышает этот уровень, о чем и сигнализирует Leegle.

Определение итоговой оценки

Текст признается имеющим потенциал внушения, если один из трех показателей превышает норму. Если зашкаливают два или три показателя, текст признается опасным для прочтения.
Например, известный фейковый сюжет о «распятом мальчике», превышает средние уровни по показателям Распределение и Объем. Речь женщины, которая дала интервью, изобилует пугающими образами. Именно поэтому, сюжет быстро распространился и получил известный отклик.

Анализ эмоционального влияния (Фактор эмоций)

Наличие выраженных эмоций в тексте, способствует его восприятию и закреплению в памяти слушателя. Неслучайно, новейшим маркетинговым трендом является story telling (рассказывание историй). Чем сильнее активируется чувственный аппарат слушателя, тем больше доверия к сказанному, надежнее запоминается информация, растет стремление поделиться услышанным.

Для анализа эмоций применяется система IBM Watson Natural Language Understanding. При помощи алгоритмов машинного обучения, эта система может выделить основные эмоции в тексте и определить их уровень. (Страх, Гнев, Радость, Печаль, Отвращение)

На основе определенной комбинации эмоций и их интенсивности, а так же, с учетом основных показателей, генерируется отчет об эмоциональном влиянии текста.

Этот отчет помогает сделать заключение, насколько сильно выражена чувственная составляющая контента.
Уместность наличия эмоциональной составляющей в тексте, служит хорошим маркером для определения манипулятивного потенциала.
Проект TEXTY.ORG.UA при анализе новостей на признаки манипулятивности, основным критерием называет излишне выраженную эмоциональность текста.

Анализ влияния категории (фактор контекста)

Для некоторых категорий текста, наличие слов с высокой оценкой может быть вполне уместным. Например, в медицине частое упоминание крови. При этом, в других категориях этот страшный образ, может указывать на попытку напугать читателя.

Классификацию введенного текста по категории осуществляет Google Natural Language API.
Для каждой из ___ категорий дается пояснение, насколько уместным является применение обнаруженных слов в тексте.

Тепловая карта манипулятивных слов

Слова, получившие наивысшую оценку 5, выделяются в исходном тексте красным цветом. Наглядно демонстрируется наличие влияющих слов и их распределение в тексте.

Визуализация наиболее влияющих образов

Гипноз — это передача образов. Каждое сказанное нами слово отражает предмет, явление или концепцию. Понимая, какие образы наиболее внушающие, заинтересованные стороны насыщают ими свой текстовый контент при помощи слов. Алгоритм Leegle предназначен для выявления таких слов и стоящих за ними образов.

Найденные наиболее влияющие слова, визуализируются при помощи набора иконок через API сервиса https://www.iconfinder.com/
Это позволяет пользователю лучше представлять набор образов, через который достигается гипнотический эффект.

Дополняет анализ комментарий живого эксперта. В комментарии дается пояснение результатов. Указываются приемы манипуляций, примененные в тексте со ссылками на соответствующие статьи ВикиLeegle.

Заключение

Leegle — это приложение для быстрого определения уровня манипулятивного влияния текста. Leegle помогает увидеть скрытые между строк посылы и приемы в виде наглядного отчета, понятного неспециалисту. Приложение используется для развития медиа-грамотности и поддержания психо-гигиены.

Описание алгоритма Leegle

How Can We Help?

Описание алгоритма Leegle

Основные показатели

Определение итоговой оценки

Анализ эмоционального влияния (Фактор эмоций)

Анализ влияния категории (фактор контекста)

Тепловая карта манипулятивных слов

Визуализация наиболее влияющих образов

Заключение