Помощь      Поиск      Участники      Календарь      Новости
 Учебные Материалы      ВАЛтест     Фотогалерея Фотогалерея
 Правила форума      Виртуальные тренажеры      Мемуары


VAL

Статистика активности
Всего полезных сообщений 31332
( 65.71% всех сообщений форума )
Сообщений в день 5.6
Регистрация 6.03.2004
Наибольшая активность в Мужской хор МИФИ
826 сообщений в этом форуме
( 3% всех активных сообщений пользователя )
Часовой пояс пользователя Нет информации
Связь
E-mail Отправить
Integrity Messenger Нет информации
Имя в AIM Нет информации
Номер ICQ Нет информации
Имя в Yahoo Нет информации
Имя в MSN Нет информации
Личное письмо Отправить
Информация
Вебсайт http://www.valinfo.ru
Дата рождения 28 Январь 1952
Место жительства www.VALinfo.ru
Увлечения Рыбалка, путешествия, пение под гитару и в мужском хоре, не расстаюсь с фотоаппаратом и видеокамерой, собираю стихи о любви и пивные наклейки, пивные кружки и оригинальные авторучки, монеты и купюры разных стран, общение со студентами и умными женщинами.
Личные данные
Группа Администраторы
Статус Мэтр, проФАН любви... proFAN of love
Аватар
Подпись www.valinfo.ru
Всегда... Always....
Quod licet jovi, non licet bovi!
10 последних сообщений пользователя VAL
Международный конгресс юмористов (в Питере) + Text mining [ (2019) The 7 Basic Functions of Text Analytics ]
QUOTE
Further reading and resources

Hungry for more information about text analytics?
I’m a big fan of the Wikipedia article on this subject (don’t tell my high school English teacher). Note that Wikipedia considers Text Analytics and Text Mining to be one and the same thing. I don’t necessarily agree with that position, but we’ll discuss that another time.
You can also visit to our technology webpage for more explanations of sentiment analysis, named entity recognition, summarization, intention extraction and more.
Lastly, if you’d like to see text analytics in action, feel free to play around with our free online web demo.
Одноклассники и друзья в контакте [ Бисмарк "Никогда столько не лгут.." и др. афоризмы ]
doh.gif
Международный конгресс юмористов (в Питере) + Text mining [ (2016) Short text corpus with focus on humor ]
(2016) Short text corpus with focus on humor detection
Источник: https://github.com/CrowdTruth/Short-Text-Co...Humor-Detection

This repository was created for publication of the datasets useful for humor recognition in one-liners. This repository contains six datasets and the python code used in the process of gathering the datasets. The six datasets are the following:
Международный конгресс юмористов (в Питере) + Text mining [ (2016) Текст майнинг: инструменты ]
doh.gif
Международный конгресс юмористов (в Питере) + Text mining [ (2019) The 7 Basic Functions of Text Analytics ]
(2019) The 7 Basic Functions of Text Analytics
Источник: https://www.lexalytics.com/lexablog/text-an...tions-explained

QUOTE
Text analytics and natural language processing are often portrayed as ultra-complex computer science functions that can only be understood by trained data scientists. But the truth is that the core concepts are pretty easy to understand (though to be fair, the the actual technology is quite complicated). In this quick, high-level overview we’re going to review the basic functions of text analytics, and explore how each contributes to deeper natural language processing features.

Quick background: text analytics refers to a discipline of computer science that combines machine learning and natural language processing (NLP) to draw meaning from unstructured text documents.


QUOTE
Much like a student writing an essay on Hamlet, a text analytics engine must break down sentences and phrases before it can actually analyze anything. Tearing apart unstructured text documents into their component parts the first step in pretty much every NLP feature, including named entity recognition, theme extraction, and sentiment analysis.


QUOTE
There are 7 basic steps involved in preparing an unstructured text document for deeper analysis:

    Language Identification
    Tokenization
    Sentence Breaking
    Part of Speech Tagging
    Chunking
    Syntax Parsing
    Sentence Chaining
Международный конгресс юмористов (в Питере) + Text mining [ (2009) Evaluating Humorous Features: ]
(2009) Evaluating Humorous Features: Towards a Humour Taxonomy
Источник: https://pdfs.semanticscholar.org/7a29/8e3dd...c2fb28d3284.pdf

QUOTE
Abstract

The importance of the analysis of processes related to cognitive phenomena through Natural Language Processing techniques is acquiring a greater relevance every day. Opinion Mining, Sentiment Analysis or Automatic Humour Recognition are a sample about how this kind of research works grows.

In this paper we focus on the study of how the features that define a corpus of humorous data (one-liners) may be used for obtaining a set of parameters that allow us to build a primitive taxonomy of humour. We analyse, through several experiments, a set of well-known features defined in the literature, besides a set of new ones, in order to determine the importance of each one for a humour taxonomy. An evaluation of all the features was performed by means of an automatic classification task over a collection of humorous blogs. The results obtained show that some of the features may represent elemental information for the purpose of creating a hum our taxonomy.


QUOTE
Важность анализа процессов, связанных с познавательными явлениями, с помощью методов обработки естественного языка приобретает все большую актуальность с каждым днем. Добыча мнений, анализ настроений или автоматическое распознавание юмора-это пример того, как растет этот вид исследований.

В данной работе мы сосредоточимся на изучении того, как признаки, определяющие корпус юмористических данных (однострочные), могут быть использованы для получения набора параметров, позволяющих построить примитивную таксономию юмора. Мы анализируем с помощью нескольких экспериментов набор известных признаков, определенных в литературе, помимо набора новых, чтобы определить важность каждого из них для таксономии юмора. Оценка всех признаков была выполнена с помощью задачи автоматической классификации по коллекции юмористических блогов. Полученные результаты показывают, что некоторые из признаков могут представлять элементарную информацию с целью создания гул нашей таксономии.
Международный конгресс юмористов (в Питере) + Text mining [ (2018) Visual Knowledge Discovery and Machine ]
(2018) Visual Knowledge Discovery and Machine Learning
Источник: https://books.google.ru/books?id=l8FHDwAAQB...0mining&f=false

Автор: Boris Kovalerchuk

См. Главу 9. Visual Text Mining: Discovery of Inconguity in Humor Modeling
Международный конгресс юмористов (в Питере) + Text mining [ (2007) Characterizing Humour: An Exploration of ]
(2007) Characterizing Humour: An Exploration of Featuresin Humorous Texts
Источник: https://www.cs.ox.ac.uk/files/244/mihalcea.cicling07.pdf

QUOTE
Abstract.

This paper investigates the problem of automatic humour recognition,and provides and in-depth analysis of two of the most frequently observed fea-tures of humorous text: human-centeredness and negative polarity. Through ex-periments performed on two collections of humorous texts, we show that theseproperties of verbal humour are consistent across different data sets.
Международный конгресс юмористов (в Питере) + Text mining [ (2012) Text Mining Framework (Java) ]
(2012) Text Mining Framework (Java)
Источник: https://habr.com/ru/post/158165/

QUOTE
Данный проект — реализация на практике некоторых, разработанных мною, теоретических положений. Как следствие этого я представляю возможности, которыми он может потенциально обладать в конце внедрения всех идей. Названо сее творение: «Text Mining FrameWork»(TextMF). Давайте в кратце рассмотрим, что именно будет позволять TextMF в своей первой финальной версии и что работает уже сейчас.


QUOTE
Должно быть в финальной версии:

    Статистический анализ текста;
    Поиск всех слов и словоформ каждого слова в тексте;
    Ранжирование слов по весу в тексте;
    Поиск субъектов в тексте, о которых идет речь;
    Связи между субъектами в тексте (прямые и не прямые связи);
    Реферирование текста;
    Определение темы текста;
    Обучение языку;
    Организация взаимодействия с пользователем по средствам общения (чата).


ЗЫ. Проект распространяется через репозиторий https://bitbucket.org/b0noI/textmf/src/default/
Аникеевка: летние слеты хора и КСП МИФИ [ (2019) 17-й слет КСП МИФИ (29-30 июня) ]
doh.gif