2.1. Облако слов как воплощение авторского замысла сквозь призму искусственного интеллекта
XXI век, отличающийся интенсивным приращением объема новой информации, осуществляемым в том числе за счет включения новых технологий в процесс коммуникации, интенсификацией глобальной коммуникации, обусловливает включение искусственного интеллекта во все сферы жизни и деятельности человека, в том числе и в научную область.
Очевидно, что обмен и приращение информации невозможны без актуализации средств ее компрессии, предполагающих ранжирование информации на более и менее значимую, выделение основной и дополнительной информации, формирование иерархически организованного комплекса субтем текста. Рассматривая в качестве одного из результатов компрессии научных текстов аннотацию научной статьи, обратимся к облаку слов как методу сжатия информации посредством возможностей искусственного интеллекта.
Как мы уже обозначили выше, научную статью и аннотацию к ней создает адресант с учетом существующих норм медицинского дискурса, включая его институциональность и стандартизированность, требования издательств и свои представления об идеальном читателе. Автор репрезентирует в своем тексте наиболее релевантные, по его мнению, и определенным образом организованные субтемы. Исследуя аннотации и статьи, мы получаем данные о взгляде автора на содержательный компонент текста аннотации.
Облако слов генерируется искусственным интеллектом, представляющим собой модель человеческого разума, и тем не менее позволяет увидеть обработку текста программой. При этом важно определить, совпадает ли взгляд автора, выделяющего наиболее значимые, с его точки зрения, субтемы статьи, отраженные в аннотации, с позицией искусственного интеллекта, который, быть может, уже стал еще одним участником научной коммуникации и компонентом научного дискурса. В подавляющем большинстве текстов субтемы, выделенные разными коммуникантами и искусственным интеллектом, имеют как совпадения, так и отличия. Сопоставление разных взглядов на один текст позволяет выделить его универсальные, неоспоримо релевантные признаки и относительные характеристики, а также проанализировать взаимосвязь таких совпадений со степенью инклюзии текста в коммуникативное пространство дискурса. Это обусловило наше обращение к анализу текстов с помощью искусственного интеллекта, представленному в этой части монографии, а также его сопоставление с аннотациями.
Облако слов (существующие вариации тегов tag cloud, word cloud, wordle) является визуализированной моделью компрессии представленной в тексте информации, состоящей из лексических операторов, дифференцированных по размеру в зависимости от частотности их употребления, это репрезентация ряда категорий или тегов (в нашем исследовании — субтем), также называемых метками или ключевыми словами. Каждое слово в структуре облака являлось при появлении этой технологии своеобразной гиперссылкой, то есть сноской на другой элемент контента, в современном использовании каждое слово для читателя содержит самостоятельный элемент исходного текста, его субтему, причем, интенсивность актуализации лексемы в тексте воплощается с помощью ее размера в облаке.
Среди сервисов, предусмотренных для создания облака слов, можно назвать WordClouds.com, WordWanrderе, ABCya, Word It Out, Облакослов.рф, отличающиеся графическими возможностями, разными электронными форматами представления обработанной информации и степенью влияния субъекта, создающего облако (выбор формы, цвета, шрифта, количества слов, наличия служебных частей речи в облаке, возможность поделиться в социальных сетях и т.д.).
Выбор автора пал на сервис Облакослов.рф, представляющий, на наш взгляд, наиболее объективный анализ текста искусственным интеллектом, связанным с отсутствием влияния создателя текста или облака на содержание модели текста. Нами были исследованы две медицинских статьи на русском языке и две англоязычные статьи. 1. Статья Шальновой С.А., Балановой Ю.А., Константинова В.В., Тимофеевой Т.Н., Иванова В.М., Капустиной А.В., Деева А.Д. «Артериальная гипертония: распространенность, осведомленность, прием антигипертензивных препаратов и эффективность лечения среди населения Российской Федерации» (далее — статья 1) находится в свободном доступе на сайте «Российского кардиологического журнала» (2006. Т. 4. № 60). URL: https://cyberleninka.ru/article/n/arterialnaya-gipertoniya-rasprostranennost-osvedomlennost-priem-antigipertenzivnyh-preparatov-i-effektivnost-lecheniya-sredi. 2. Статья Булатовой И.А., Щёкотовой А.П., Насибуллиной Н.И., Падучевой С.В., Щёкотова В.В. «Лабораторные маркеры поражения печени при хроническом гепатите C» (далее — статья 2) находится в свободном доступе на сайте научной электронной библиотеки КиберЛенинка.ру. URL: https://cyberleninka.ru/article/n/laboratornye-markery-porazheniya-pecheni-pri-hronicheskom-gepatite-c. 3. Статья Torre L.A. , Bray F., Siegel R.L., Ferlay J. et al. «Global cancer statistics, 2012» (далее — статья 3), опубликованная в издании «CA: a cancer journal» в 2015 г., находится в свободном доступе по ссылке https://acsjournals.onlinelibrary.wiley.com/doi/full/10.3322/caac.21262. 4. Статья Callahan С.М., MD, Bateman D.R., MD, Wang S., MD, Boustani М.А., MD, MPH «State of Science: Bridging the Science-Practice Gap in Aging, Dementia and Mental Health» (далее — статья 4), полный текст находится в свободном доступе на сайте http://europepmc.org/ по ссылке http://europepmc.org/article/MED/29659003. Познакомиться с текстом статей можно с помощью QR-кодов: