Можно ли создать такую компьютерную программу, которая была бы способна оценить качество анекдота? А такую, которая бы оценила персональные особенности человеческого чувства юмора? Оказывается можно!
С первого взгляда это может показаться невозможным. Но нам не раз приходилось убеждаться в том, что для современной науки нет почти ничего невозможного. Особые возможности предоставляет современным исследователям всемирная сеть интернет. Ведь именно благодаря интернету, говоря о компьютерной программе, мы можем подразумевать сайт, имеющий дело с тысячами людей.
В наши дни дан старт интересному, на мой взгляд, эксперименту в этой области. Молодой программист-исследователь разработал алгоритм, позволяющий анализировать такие чисто чувственные понятия, как юмор, статистическими методами. О чём, собственно речь? Речь о сайте, который предлагает всем своим посетителям читать анекдоты, и оценивать их. Каждая оценка фиксируется в специальной базе данных, оставаясь связанной с конкретным посетителем. Затем программа анализирует все оценки для каждого посетителя, оценивает таким образом вкус этого посетителя в области юмора, и в дальнейшем подбирает для каждого посетителя анекдоты, соответствующие его персональному вкусу.
На самом деле, вспомните, как интересно бывает услышать к месту и ко времени рассказанный анекдот в подходящей компании. А многие ли из нас любят читать анекдоты в книжке, или на юмористических сайтах? Думаю, не все. Почему так получается? Всё дело в том, что хороший рассказчик всегда (осознанно или нет) учитывает вкус аудитории, выбирая тот или иной анекдот. На самом деле, чувство юмора у нас на много индивидуальнее, чем может казаться. То, от чего одни люди катаются по полу от смеха, держась за животы, у других может едва ли вызвать скромную улыбку. В то время, как другие шутки заставили бы смеяться именно представителей второй группы. Поэтому, читая, к примеру, анекдоты на сайте юмора, даже если они отсортированы по популярности, часто приходится прочесть десятки посредственных анекдотов, прежде чем наткнёшься на один по-настоящему смешной. А ведь кто-то (и не малое количество) за все эти анекдоты голосовали в рейтинге. Это говорит как раз о том, что персональные особенности чувства юмора тех людей отличаются от нашего.
Возвращаясь к новому сайту, как же всё-таки он это делает? Упрощённо, это можно обьяснить следующим образом. После того, как посетитель оценил несколько десятков анекдотов, программа может сопоставить его оценки с оценками всех других пользователей, поставленными тем же анекдотам. Прграмма анализирует количество совпадающих и несовпадающих оценок, и на основании эого, составляет коэффициент релевантности для каждого посетителя, по отношению к актитивному посетителю. Этот коэффициент указывает на сколько близки персональные особенности чувства юмора двух посетителей. Далее, используя этот коэффициент, и анализируя оценки каждого посетителя тем анекдотам, которые текущий посетитель ещё не прочёл, можно выбрать из них такие, которые с наибольшей вероятностью будут соответствовать его вкусу. Иначе говоря, такие анекдоты, которые понравились людям со схожим чувством юмора.
Современные вычислительные мощности позволяют просчитывать все эти расчёты вслед за выставлением каждой оценки. То есть, каждый следующий анекдот будет выбран уже с учётом даже самой последней оценки.
Думаю, не лишне будет упомянуть, что благодаря тому, что в базе данных хранится информация о каждом прочитанном анекдоте для каждого посетителя, сайт может гарантировать, что никому из посетителей не будет предложен один анекдот два раза. Разумеется, для работы с персональной статистикой сайт требует регистрации. Но обязательным является только выбор уникального имени и пароля.
Независимо от создателя этого сайта, учёные из Калифорнийского уиверситета Беркли под руководством профессора Кена Голдберга несколько лет занимались исследованием именно этой темы, и в результате, построили аналогичный сайт: Jester, только, естественно, на английском языке и с американскими анекдотами. В мире технология использования статистики персональных предпочтений для выработки рекоммендаций называется Collaborative filtering. Обычно она применялась в интернет-магазинах. В случае с анекдотами, на мой взгляд, она будет работать на много эффективнее.