К вопросу об использовании цепей Маркова

Главная » Рефераты на русском » К вопросу об использовании цепей Маркова

В последнее время можно услышать о применении цепей Маркова в самых разных областях: современных веб-технологиях, при анализе литературных текстов или даже при разработке тактики игры футбольной команды. У тех, кто не знает что такое цепи Маркова, может возникнуть ощущение, что это что-то очень сложное и почти недоступное для понимания. Цепи Маркова служат хорошим введением в теорию случайных процессов, т.е. теорию простых последовательностей семейства случайных величин, обычно зависящих от параметра, который в большинстве приложений играет роль времени. Она предназначена, главным образом, для полного описания как долговременного, так и локального поведения процесса. Приведем некоторые наиболее изученные в этом плане вопросы. Броуновское движение и его обобщения – диффузионные процессы и процессы с независимыми приращениями. Теория случайных процессов способствовала углублению связи между теорией вероятностей, теорией операторов и теорией дифференциальных уравнений, что, помимо прочего, имело важное значение для физики и других приложений. К числу приложений относятся процессы, представляющие интерес для актуарной (страховой) математики, теории массового обслуживания, генетики, регулирования дорожного движения, теории электрических цепей, а также теории учета и накопления товаров. Мартингалы. Эти процессы сохраняют достаточно свойств цепей Маркова, чтобы для них оставались в силе важные эргодические теоремы. От цепей Маркова мартингалы отличаются тем, что когда текущее состояние известно, только математическое ожидание будущего, но необязательно само распределение вероятностей, не зависит от прошлого. Помимо того, что теория мартингалов представляет собой важный инструмент для исследования, она обогатила новыми предельными теоремами теорию случайных процессов, возникающих в статистике, теории деления атомного ядра, генетике и теории информации. Стационарные процессы. Самая старая из известных эргодических теорем, как отмечалось выше, может быть интерпретирована как результат, описывающий предельное поведение стационарного случайного процесса. Такой процесс обладает тем свойством, что все вероятностные законы, которым он удовлетворяет, остаются инвариантными относительно сдвигов по времени. Эргодическую теорему, впервые сформулированную физиками в качестве гипотезы, можно представить как утверждение о том, что при определенных условиях среднее по ансамблю совпадает со средним по времени. Это означает, что одну и ту же информацию можно получить из долговременного наблюдения за системой и из одновременного (и одномоментного) наблюдения многих независимых копий той же самой системы. Закон больших чисел есть не что иное, как частный случай эргодической теоремы Биркгофа. Интерполяция и предсказание поведения стационарных гауссовских процессов, понимаемых в широком смысле, служат важным обобщением классической теории наименьших квадратов. Теория стационарных процессов – необходимое орудие исследования во многих областях, например, в теории связи, которая занимается изучением и созданием систем, передающих сообщения при наличии шума или случайных помех. Марковские процессы (процессы без последействия) играют огромную роль в моделировании систем массового обслуживания (СМО), а также в моделировании и выборе стратегии управления социально-экономическими процессами, происходящими в обществе. Также цепь Маркова можно использовать для генерации текстов. На вход подается несколько текстов, затем строится цепь Маркова с вероятностями следования одних слов за другими и на основе данной цепи создается результирующий текст. Связь SEO и цепей Маркова. В математике цепи Маркова описываются рядом формул, в сфере же SEO они применяются для создания текстов с условной грамотностью, связностью и определенным набором ключевых слов. Такое использование математических формул для генерации текстов возможно, потому как любое предложение можно приравнять к Марковской цепи первого порядка, в которой каждое последующее слово будет зависеть от предыдущего. Суть цепей Маркова состоит в том, что из исходного текста, с помощью деления его на слова и сохранения результатов, какие слова за какими идут в тексте, потом генерируется совершенно новый текст, который для поисковых систем получается уникальным. Впервые цепи Маркова придумали применять для генерации текстов дорвейщики, так как большое количество дорвеев требовало большого количества текстового контента с минимальным уровнем грамотности. Да, такой текст не особо читабелен для реального человека, но поисковые роботы распознают Марковские цепи далеко не сразу. Но, конечно, как правило, использование Марковских цепей относят к черной оптимизации. Принцип работы. Генераторы псевдо осмысленных текстов на основе цепей Маркова работают в два этапа. Для начала необходимо создать словарную базу на основе достаточно большого текста. Текст разбивается на отдельные слова, для каждого из которых определяются другие слова, чаще всего после него встречающиеся. На основе такой базы и будут выстраиваться предложения – собственно, Марковские цепи, где в качестве дискретных значений выступают слова. Первое слово отбирается случайным образом. Второе – из списка тех, которые чаще всего встречаются после первого. Третье – из числа слов, возможных после второго. И так далее. Смысла в таком тексте, конечно, не много, однако простейшую проверку роботами на связность такой текст может пройти. Следовательно, страница будет проиндексирована поисковой машиной. Изначально можно задать как общее количество слов в генерируемом тексте, так и число слов в каждом отдельном предложении. Исходный словарь для генерации текстов на основе цепей Маркова должен быть размером хотя бы в килобайт, иначе сгенерированный текст будет иметь очень низкую уникальность. Пример использования. Для наглядности можно рассмотреть пример использования Марковских цепей для генерации текста на основе заданных слов на примере одного предложения. Допустим, «SEO форум «Курсовая» – лучший форум казнета на тему SEO и продвижения сайтов». Теперь необходимо составить словарную базу, подбирая все возможные слова к каждому последующему. Получился замкнутый цикл из всех слов данного предложения, так как в словарной базе для генерации текстов после последнего слова будет снова использоваться первое. Теперь начинает собственно создание текста, причем, первое слово выбирается случайным образом и на его основе формируется цепочка. Например, это будет «Курсовая». В результате получается: «Курсовая» – лучший форум казнета на тему SEO и продвижения сайтов. Безусловно, в данном примере текст не особо отличается от исходного, но причина лишь в малом количестве заданных слов. Ключевые же слова получились вполне ходовые – «лучший форум», например. Таким образом, у текста, сгенерированного с помощью Марковских цепей, безусловно, нет никакой литературной ценности и пользователям он не интересен. Однако, в качестве технического решения может вполне использоваться. Рассмотрев несколько вариантов использования марковских цепей можно сделать логический вывод, что марковские цепи фактически универсальны и позволяют продумывать и выполнять сложные логические цепочки, как при организации очередей, так и при SEO-оптимизации. Кроме того, есть мнение, что Google научился достаточно быстро распознавать псевдотексты, сгенерированные с помощью Марковских цепей, поэтому использовать ли этот явно не совсем белый метод оптимизации или нет, решать стоит отдельно в каждом конкретном случае, исходя из поставленной задачи, временных рамок и материальных возможностей.

ОСТАВИТЬ КОММЕНТАРИЙ

Лимит времени истёк. Пожалуйста, перезагрузите CAPTCHA.