понедельник, 15 апреля 2024 г.

Исследователи из Беэр-Шевы используют искусственный интеллект для чтения неразборчивых слов на иврите и арамейском языке

 

Исследователи из Беэр-Шевы используют искусственный интеллект для чтения неразборчивых слов на иврите и арамейском языке

С каждым годом на Ближнем Востоке обнаруживается все больше древних надписей на иврите и арамейском языках. Анализ этих текстов чрезвычайно важен для исследователей, изучающих культуру и историю региона, пишет журналистка «The Jerusalem Post» Джуди Зигель-Ицкович.

Оставайтесь в курсе последних событий! Подписывайтесь на наш канал в Telegram.

Поскольку многие из этих текстов со временем повреждаются из-за землетрясений, пожаров, политических конфликтов и других природных и антропогенных причин, эпиграфисты – эксперты, которые отвечают за реконструкцию, перевод и датировку надписей. А также за поиск любых соответствующих обстоятельств, оставляя определение и интерпретацию записанных событий историкам, – до сих пор используются трудоемкие ручные процедуры для оценки недостающего контента. Это было серьезной проблемой при восстановлении недостающих частей этих ценных надписей. Теперь студенты факультета разработки программного обеспечения и информационных систем Университета Бен-Гуриона в Негеве (BGU) в Беэр-Шеве подошли к решению этой задачи как к задаче расширенного моделирования замаскированного языка, в которой поврежденный контент может содержать отдельные символы, n-граммы (статистические модели, которые предсказывают следующий символ или слово после N-1 слов на основе вероятности их сочетания) символов (неполные слова), отдельные полные слова и многоязычные тексты со словами n-граммами.

Это исследование является первой попыткой применить подход к моделированию скрытого языка к искаженным надписям на иврите и арамейском языках, в которых используется еврейский алфавит, состоящий в основном из согласных символов. В своем последнем проекте под руководством профессора Марка Ласта студенты четвертого курса Нив Фоно, Харел Мошайоф, Эльдар Кароль и Итай Ашраф применили метод моделирования замаскированного языка к поврежденным надписям на иврите и арамейском. Их модель, получившая название «Embible», была представлена на последнем заседании Европейского отделения Ассоциации компьютерной лингвистики (ACL) в прошлом месяце. Они опубликовали свои выводы в журнале ACL «Anthology» под названием ««Embible»: реконструкция древнееврейских и арамейских текстов с использованием трансформеров».

Система проанализировала тысячи предложений из еврейской Библии. Студенты обучили систему работе с 22 144 предложениями из еврейской Библии. Система была протестирована на остальных 536 предложениях и добилась значительного успеха. Набор моделей предсказания слов и символов показал высочайшую точность. Мы можем помочь историкам, которые посвятили свою жизнь максимально точному воссозданию этих древних текстов. Более того, я считаю, что модель может быть расширена и охватывать другие морфологически богатые древние языки», – заключил Ласт.

Источник

1 комментарий:

  1. Извините, но "еврейского алфавита" нет. Есть первый в мире фонетический алфавит, он же арамейский. Именно в Ромее впервые разъяли человеческую речь на два десятка звуков. И на базе аккадо-шумерских языков изобрели первый фонетический алфавит с 22 согласными буквами, для которых была создана своя графика. Один знак обозначал один звук. Значение гласных оставляли на понимание читателя. То есть основанием этого понимания предполагали общий жизненный опыт всех тех, кто этой письменностью пользовался. А кроме этого, названия букв были образованы от слов, которые обозначают предметы, начинающиеся с соответствующей фонемы. Это были как бы «подсказки» пишущему и читающему. Например: א «алеф» – бык, ב «бет» – дом и т.д.
    Всё это позволило ввести консонантное линейное письмо. Так и возникло первое универсальное средство общения между носителями самых разных наречий Ойкумены. Кстати, слово לשון Лашон «язык» в арамейском языке ещё существует как повелительная форма глагола «помочь».

    ОтветитьУдалить