Совмещение «экспертного» и «статистического» подходов к исследованию обсуждений в блогосфере (на примере темы ислама)
В докладе на примере темы ислама рассматриваются проблемы, связанные с преобразованием исследовательского представления об общественно значимой теме в процедуры автоматического отбора релевантных текстов из коллекции блогов. Кроме того, обсуждаются методы оценки правомерности вычленения заданной исследователем темы и её места в структуре обсуждений в блогосфере в целом.
В работе использованы два независимых подхода для выявления общей совокупности текстов на заданную тему: традиционный «экспертный», в котором темы отбираются при помощи списка ключевых слов, составленного на основании мнений экспертов, и «статистический», когда тематическая структура текстовой коллекций блогов анализируется полностью автоматически (используется технология Topic modelling, основанная на вычислительной методике Latent dirichlet allocation).