Классификация, кластеризация и оценка сходства текстов

Архив. Мы больше не анонсируем данное мероприятие. Возможно информация полностью устарела. Что там дальше мы не знаем.

Зовём на лекцию

Организатор:

Культурно-просветительский центр "Архэ"

Когда?

с 20 декабря 2017

Город

Москва

Где?

Центр АРХЭ. В здании Физического факультета МПГУ (бывш. МПГИ им. Ленина), ул. Малая Пироговская, д.29.

Метро

Спортивная

Сайт:

arhe.msk.ru

Контакты:

По всем вопросам звоните по телефону: 8-495-088-92-81 или пишите на почту: arhe.msk@gmail.com

Условия участия:

Стоимость участия: 500 руб.

Одна из важных задач компьютерной лингвистики — объединение похожих текстов в группы. Это может быть как деление на заранее заданные классы («Спорт», «Политика» и т. п.), так и деление на основе сходства самих текстов. К примеру, новостные агрегаторы сперва объединяют похожие тексты в один сюжет, а затем относят его к определенному классу. На занятии мы поговорим о том, как можно оценивать расстояние между текстами, чем отличается задача классификации от задачи кластеризации и как такие задачи решаются.