суббота, 13 июля 2019 г.

К ВОПРОСУ ОБ АВТОРСТВЕ РОМАНА «ДВЕНАДЦАТЬ СТУЛЬЕВ»

6 К ВОПРОСУ ОБ АВТОРСТВЕ РОМАНА «ДВЕНАДЦАТЬ СТУЛЬЕВ» 
© 2019 Миронова Любовь Борисовна, доцент кафедры математик и прикладной информатики, Елабужский институт Верещагина Ольга Валерьевна, студент, Елабужский институт Казанский (Приволжского) федеральный университет (423600, Россия, Елабуга, улица Казанская, 89, e-mail: olka_02@mail.ru) 
Аннотация. В настоящее время для определения авторства и подлинности литературных текстов применяются методы теории распознавания образов, математической статистики, теории вероятностей, широко используется вычислительная техника. Для определения автора текста часто требуется экспертиза, которая может установить создателя неизвестного текста или определить принадлежность произведения определенному автору при помощи статистических методов. С развитием вычислительной техники появилась возможность реализовать указанные методы, требующие больших по объему вычислений. Атрибуция текста есть установление авторства произведения литературы или искусства, времени и места его создания. Статья посвящена атрибуции широко известного романа «Двенадцать стульев». Целью статьи является проверка гипотезы Ирины Амлински о том, что автором романа «Двенадцать стульев» является М.А. Булгаков, выдвинутой ею в книге «12 стульев от Михаила Булгакова». Для проверки этой гипотезы использовался статистический метод подсчета авторского инварианта. Под авторским ин- вариантом понимается количественная характеристика литературных текстов, которая однозначно характеризует своим поведением произведения одного автора или небольшого числа «близких авторов» и принимает существенно разные значения для произведений разных групп авторов. В качестве такого инварианта берется частота служебных слов в больших выборках, принадлежащих исследуемым литературным текстам. Проведенное исследование позво- ляет отклонить гипотезу И. Амлински. Ключевые слова: Атрибуция текста, авторский инвариант, математическая статистика, идентификация, автор- ство, текст, служебные слова, информационные технологии, математическая лингвистика, количественные харак- теристики текста, экспертиза текста, роман «Двенадцать стульев». TO THE QUESTION OF THE AUTHORSHIP OF THE NOVEL “THE TWELVE CHAIRS» © 2019 Mironova Lyubov Borisovna, associate professor, department of mathematics and applied informatics, Elabuga Institute Vereshchagina Olga Valerievna, student, Elabuga Institute Kazan (Volga region) Federal University (423600, Russia, Yelabuga, Kazanskaya street, 89, e-mail: olka_02@mail.ru) Abstract. Currently, methods of pattern recognition theory, mathematical statistics, probability theory are used to determine the authorship and authenticity of literary texts, computer technology is widely used. To determine the author of a text often requires expertise that can establish the creator of an unknown text or determine the ownership of a work of a certain author using statistical methods. With the development of computer technology, it became possible to implement these methods, which require large amounts of calculations. Attribution of the text is the establishment of the authorship of a work of literature or art, the time and place of its creation. The article is devoted to the attribution of the well-known novel “The Twelve Chairs”. The aim of the article is to test the hypothesis of literary critic Irina Amlinsky that the author of the novel “The Twelve Chairs” is M. Bulgakov, put forward by her in the book “12 chairs from Mikhail Bulgakov”. To test this hypothesis, we used a statistical method for calculating the author’s invariant. The author’s invariant is understood as a quantitative characteristic of literary texts, which uniquely characterizes the behavior of the work of one author or a small number of “close authors”, takes significantly different values for the works of different groups of authors. As such an invariant, the frequency of service words in large samples of texts belonging to the literary texts under study is taken. This study allows to reject hypothesis of I. Amlinski. Keywords: Text attribution, author’s invariant, mathematical statistics, identification, authorship, text, service words, in- formation technology, mathematical linguistics, quantitative characteristics of the text, text examination, novel “The Twelve Chairs”. Проблемы атрибуции, установления авторства литературных и других (например, нарративных) текстов давно привлекает внимание исследователей, в том числе весьма авторитетных в научной среде [1-3]. В настоящее время исследования ведутся в различных направлениях: используются лингво-теоретические методики [4], различные методы, основанные на сравнении количественных характеристик текста [5, 6], интенсивно применяются математические методы, сопряженные с использованием вычислительной техники, как в России [7-12], так и в других странах [13-17]. Для определения авторства и подлинности литературных текстов с успехом применяются подходы из теории распознавания образов, математической статистики и теории вероятностей. Большой интерес представляют изучение гендерной дифференциации авторов, автороведческая экспертиза в юридической практике [18-20]. В 2013 году в свет вышла книга Ирины Амлински «12 стульев от Михаила Булгакова» [21], в которой литературовед обосновывает свою гипотезу, согласно которой Илья Ильф и Евгений Петров не являются истинными авторами литературного произведения «Двенадцать стульев». Цель данной работы заключается в исследовании справедливости гипотезы Ирины Амлински. Для поиска подлинного автора мы будем использовать статистический метод «авторского инварианта», разработанный В. П. Фоменко и Т. Г. Фоменко [22, 23]. Метод был разработан с целью определения авторства текста на основе некой его числовой характеристики, а именно частоты употребления автором служебных слов: частиц, предлогов и союзов. Указанный метод зарекомендовал себя как простой, но эффективный метод, неоднократно проверенный на практике [24, 25]. Дадим точное определение авторского инварианта. Под авторским инвариантом понимается такая количественная характеристика текстов, прежде всего литературных, которая, во-первых, однозначно характеризует произведения одного автора или «близких авторов», во-вторых принимает такие значения для произведений Mironova Lyubov Borisovna, Vereshchagina Olga Valerievna TO THE QUESTION OF THE AUTHORSHIP ... Балтийский гуманитарный журнал. 2019. Т. 8. № 1(26) 109 филологические науки - языкознание разных групп авторов, что эти значения уверенно раз- личаются. Из этого определения следует, что авторский инвари- ант позволяет установить авторов исследуемого текста, либо резко сузить круг претендентов на авторство. Книга Ирины Амлински «12 стульев от Михаила Булгакова» содержит массу аргументов в пользу того, что автором произведения «Двенадцать стульев» являет- ся Михаил Афанасьевич Булгаков. Исследовательница указывает на удивительные совпадения в текстах «Мастер и Маргарита» и «Двенадцать стульев». С ней соглашается, например, В. Козаровецкий [26]. Число таких совпадений вызывает подозрения о несостоятель- ности традиционной версии создания романа. С другой стороны, скрыть подобную мистификацию непросто. Возникает много вопросов, например для чего это могло понадобиться самому Булгакову? Существуют рассказы современников о том, что И. Ильф и Е. Петров напряжен- но работали над романом «Двенадцать стульев», стара- ясь не выбиться из графика издателя. Общеизвестно, что И. Ильф, Е. Петров и М. Булгаков работали в редакции газеты «Гудок», постоянно общались, делились творче- скими замыслами. Однако аргументация И. Амлински преследует цель доказать, что роман «Двенадцать сту- льев» не мог быть написан И. Ильфом и Е. Петровым. И. Амлински считает, что анализ совместного творче- ства Ильфа и Петрова демонстрирует массу противо- речий. Отношения авторов были не настолько близки, чтобы мог проявиться феномен соавторства (познако- мились Ильф и Петров уже сложившимися немолодыми людьми, друг к другу обращались на «вы» и т.д.). При этом структура повествования романа весьма сложная, включает много второстепенных персонажей, нетриви- альных сюжетных ходов, аллюзий и реминисценций. Остается непонятым, как И. Ильф и Е. Петров работали совместно, да ещё с такой большой производительно- стью, доступной лишь профессиональному писателю. Подозрения И. Амлински вызывает и то, что черновых вариантов рукописи не сохранилось, имеется только написанный рукой Е. Петрова экземпляр окончательной рукописи и две машинописные копии с неё с редакторской правкой. Эти и некоторые другие аргументы заставляют усомниться в том, что И. Ильф и Е. Петров действительно являются авторами романа «Двенадцать стульев». Вместе с тем, подход И. Амлински грешит определенной однобокостью, ею подобраны только те факты, которые ставят под сомнение авторство И. Ильфа и Е. Петрова, подтверждают эту заранее принятую гипотезу. Поэтому бесспорно признать правоту И. Амлински мы тоже не можем. Здесь мы попытаемся определить подлинного автора теперь уже методами математической статистики, а именно используя авторский инвариант. Пусть в нашем распоряжении оказалось два произведения разных писателей. В данном случае «Двенадцать стульев» от И. Ильфа и Е. Петрова и «Мастер и Маргарита» от М. Булгакова. Выделим теперь из этих текстов отдельные фрагменты — выборки одинакового объема, то есть состоящие из одного и того же (фиксированного заранее) количества слов. Это количество слов естественно назвать объемом выборки. Итак, последовательно двигаясь по тексту одного ав- тора, затем другого, мы, берем один и тот же объем двух произведений, например, в 16000 слов. Чем длиннее ис- следуемое литературное произведение, тем больше вы- борок мы сможем сделать. Для коротких произведений число выборок невелико, что усложняет анализ, делает результаты неустойчивыми. Пусть теперь мы избрали какой-либо лингвистический параметр, использование служебных слов, например, частоту употребления писателем предлога «в». Можно изучить эволюцию этого параметра вдоль всего текста этого произведения. Для этого сделаем последовательные выборки и подсчитаем для каждой из них значение интересующего нас параметра. В результате для каждого произведения получим свое число. Например, в произведении «Мастер и Маргарита» предлог «в» встречается 434 раза, что составляет 2,713%, в романе «Двенадцать стульев» — 427 раз, что составляет 2,669%. Продолжая анализ двух произведений таким обра- зом, построим таблицу из 54 служебных слов. В список служебных слов мы внесли следующие: Предлоги — для, во, в, на, с, у, от, без, до, о, над, изза, через, со, при, про, об, ко, за, к, по, из, из-под, под. Союзы — и, но, а, то есть, зато, когда, да, хотя, тоже, или, чтобы, если, будто, что. Частицы — не, ведь, как, же, даже, бы, ли, вон, -ни- будь, -либо, только, вот, то, ни, лишь, уже. Общий процент использования предлогов в произ- ведениях: «Мастер и Маргарита» — 1515 (9,468%); «Двенадцать стульев» — 1516 (9,468%). Общий процент использования союзов в произведе- ниях: «Мастер и Маргарита» — 650 (4,063%); «Двенадцать стульев» — 496 (3,100%). Общий процент использования частиц в произведе- ниях: «Мастер и Маргарита» — 675 (4,219%); «Двенадцать стульев»— 593 (3,706%). Таким образом, используя полученные данные, мо- жем составить таблицу. Таблица 1 - Доля служебных слов в сопоставленных романах. Авторский инвариант для М.А. Булгакова равен 17,75%, а для автора романа «Двенадцать стульев» — 16,28%. Разность равна 1,47, что значительно превы- шает колебания этого параметра внутри произведений этих авторов. Такое существенное различие в значении авторского инварианта позволяет отклонить гипотезу И. Амлински о том, что автором романа «Двенадцать стульев» является М.А. Булгаков. Таким образом, можно утверждать, что действительным авторами указанного романа являются И. Ильф и Е. Петров. СПИСОК ЛИТЕРАТУРЫ: 1. Виноградов В.В. Проблема авторства и теория стилей. М.: Государственное издательство художественной литературы, 1961. 616 с. 2. От Нестора до Фонвизина. Новые методы определения авторства. Под. ред. Л.В. Милова. М.: Прогресс, 1994. 448 с. 3. Хьетсо Г., Густавссон С., Бекман Б., Гил С. Кто написал «Тихий Дон»? (Проблема авторства «Тихого Дона»). М.: Книга, 1989. 263 с. 4. Верхозин С.С. К вопросу о лингво-теоретических основах методик авторизации текста // Вестник Иркутского государственного лингвистического университета. 2013. № 1. С. 24-28. 5. Быстров А.В., 3лобин Е.В. К вопросу об авторстве предсмертного письма Б.В. Савинкова - опыт комплексного исследования // Круг идей: Новое в исторической информатике. М., 1994. С.129-133. 6. Шабага И.Ю. Опыт исследования галльских панегириков количественными методами // Вестник Древней истории. 1993. № 1. С.147-161. 7. Муха А.В., Розалиев В.Л., Орлова Ю.А., Заболеева-Зотова А.В. Автоматизированный подход к определению авторства текста // Известия ВолГТУ. 2013. № 14 (117). С. 51-54. 8. Кукушкина О.В., Поликарпов А.А., Хмелёв Д.В. Определение авторства текста с использованием буквенной и грамматической информации // Проблемы передачи информации. 2001. Т. 37. Вып. 2. С. 96-109. 9. Шевелев О.Г. Разработка и исследование алгоритмов сравнения стилей текстовых произведений: дис. ...канд. техн. наук. Томск, 2006. 176 с. 10. Романов А.С., Шелупанов А.А., Бондарчук С.С. Обобщенная методика идентификации автора неизвестного текста // Доклады Томского государственного университета систем управления и радиоэлектроники. 2010. № 1(21). С. 108-112. 11. Романов А.С., Мещеряков Р.В. Идентификация автора текста с помощью аппарата опорных векторов // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной междунар. конф. «Диалог 2009» (Бекасово, 27-31 мая 2009 г.). М.: РГГУ, 2009. Вып. 8 (15). С. 432-437. 12. Романов А.С. Методика идентификации автора текста на 

Комментариев нет:

Отправить комментарий

Красильщиков Аркадий - сын Льва. Родился в Ленинграде. 18 декабря 1945 г. За годы трудовой деятельности перевел на стружку центнеры железа,километры кинопленки, тонну бумаги, иссушил море чернил, убил четыре компьютера и продолжает заниматься этой разрушительной деятельностью.
Плюсы: построил три дома (один в Израиле), родил двоих детей, посадил целую рощу, собрал 597 кг.грибов и увидел четырех внучек..