Поиск
Озвучить текст Озвучить книгу
Изменить режим чтения
Изменить размер шрифта
Оглавление
Для озвучивания и цитирования книги перейдите в режим постраничного просмотра.

Глава 2. Цифровые инструменты исследования содержания медицинского текста

2.1. Облако слов как воплощение авторского замысла сквозь призму искусственного интеллекта

XXI век, отличающийся интенсивным приращением объема новой информации, осуществляемым в том числе за счет включения новых технологий в процесс коммуникации, интенсификацией глобальной коммуникации, обусловливает включение искусственного интеллекта во все сферы жизни и деятельности человека, в том числе и в научную область.

Очевидно, что обмен и приращение информации невозможны без актуализации средств ее компрессии, предполагающих ранжирование информации на более и менее значимую, выделение основной и дополнительной информации, формирование иерархически организованного комплекса субтем текста. Рассматривая в качестве одного из результатов компрессии научных текстов аннотацию научной статьи, обратимся к облаку слов как методу сжатия информации посредством возможностей искусственного интеллекта.

Как мы уже обозначили выше, научную статью и аннотацию к ней создает адресант с учетом существующих норм медицинского дискурса, включая его институциональность и стандартизированность, требования издательств и свои представления об идеальном читателе. Автор репрезентирует в своем тексте наиболее релевантные, по его мнению, и определенным образом организованные субтемы. Исследуя аннотации и статьи, мы получаем данные о взгляде автора на содержательный компонент текста аннотации.

Облако слов генерируется искусственным интеллектом, представляющим собой модель человеческого разума, и тем не менее позволяет увидеть обработку текста программой. При этом важно определить, совпадает ли взгляд автора, выделяющего наиболее значимые, с его точки зрения, субтемы статьи, отраженные в аннотации, с позицией искусственного интеллекта, который, быть может, уже стал еще одним участником научной коммуникации и компонентом научного дискурса. В подавляющем большинстве текстов субтемы, выделенные разными коммуникантами и искусственным интеллектом, имеют как совпадения, так и отличия. Сопоставление разных взглядов на один текст позволяет выделить его универсальные, неоспоримо релевантные признаки и относительные характеристики, а также проанализировать взаимосвязь таких совпадений со степенью инклюзии текста в коммуникативное пространство дискурса. Это обусловило наше обращение к анализу текстов с помощью искусственного интеллекта, представленному в этой части монографии, а также его сопоставление с аннотациями.

Облако слов (существующие вариации тегов tag cloud, word cloud, wordle) является визуализированной моделью компрессии представленной в тексте информации, состоящей из лексических операторов, дифференцированных по размеру в зависимости от частотности их употребления, это репрезентация ряда категорий или тегов (в нашем исследовании — субтем), также называемых метками или ключевыми словами. Каждое слово в структуре облака являлось при появлении этой технологии своеобразной гиперссылкой, то есть сноской на другой элемент контента, в современном использовании каждое слово для читателя содержит самостоятельный элемент исходного текста, его субтему, причем, интенсивность актуализации лексемы в тексте воплощается с помощью ее размера в облаке.

Среди сервисов, предусмотренных для создания облака слов, можно назвать WordClouds.com, WordWanrderе, ABCya, Word It Out, Облакослов.рф, отличающиеся графическими возможностями, разными электронными форматами представления обработанной информации и степенью влияния субъекта, создающего облако (выбор формы, цвета, шрифта, количества слов, наличия служебных частей речи в облаке, возможность поделиться в социальных сетях и т.д.).

Выбор автора пал на сервис Облакослов.рф, представляющий, на наш взгляд, наиболее объективный анализ текста искусственным интеллектом, связанным с отсутствием влияния создателя текста или облака на содержание модели текста. Нами были исследованы две медицинских статьи на русском языке и две англоязычные статьи. 1. Статья Шальновой С.А., Балановой Ю.А., Константинова В.В., Тимофеевой Т.Н., Иванова В.М., Капустиной А.В., Деева А.Д. «Артериальная гипертония: распространенность, осведомленность, прием антигипертензивных препаратов и эффективность лечения среди населения Российской Федерации» (далее — статья 1) находится в свободном доступе на сайте «Российского кардиологического журнала» (2006. Т. 4. № 60). URL: https://cyberleninka.ru/article/n/arterialnaya-gipertoniya-rasprostranennost-osvedomlennost-priem-antigipertenzivnyh-preparatov-i-effektivnost-lecheniya-sredi. 2. Статья Булатовой И.А., Щёкотовой А.П., Насибуллиной Н.И., Падучевой С.В., Щёкотова В.В. «Лабораторные маркеры поражения печени при хроническом гепатите C» (далее — статья 2) находится в свободном доступе на сайте научной электронной библиотеки КиберЛенинка.ру. URL: https://cyberleninka.ru/article/n/laboratornye-markery-porazheniya-pecheni-pri-hronicheskom-gepatite-c. 3. Статья Torre L.A. , Bray F., Siegel R.L., Ferlay J. et al. «Global cancer statistics, 2012» (далее — статья 3), опубликованная в издании «CA: a cancer journal» в 2015 г., находится в свободном доступе по ссылке https://acsjournals.onlinelibrary.wiley.com/doi/full/10.3322/caac.21262. 4. Статья Callahan С.М., MD, Bateman D.R., MD, Wang S., MD, Boustani М.А., MD, MPH «State of Science: Bridging the Science-Practice Gap in Aging, Dementia and Mental Health» (далее — статья 4), полный текст находится в свободном доступе на сайте http://europepmc.org/ по ссылке http://europepmc.org/article/MED/29659003. Познакомиться с текстом статей можно с помощью QR-кодов:

Для продолжения работы требуется Registration
На предыдущую страницу

Предыдущая страница

Следующая страница

На следующую страницу
Глава 2. Цифровые инструменты исследования содержания медицинского текста
На предыдущую главу Предыдущая глава
оглавление
Следующая глава На следующую главу