“Фиктивные цитаты оптом”. Черный рынок цитирования: схемы продажи фальшивых статей и цитирований тревожат ученых

Черный рынок цитирования: схемы продажи фальшивых ссылок тревожат ученых

Количество способов, с помощью которых исследователи могут искусственно завышать количество ссылок, растет.
Close up of a desk and laptop with a man's hand resting on an envelope filled with US dollar bills.
Цитирование за наличные: исследователи определили сервисы, с помощью которых ученые могут купить цитаты на свои статьи оптом.Фото: Vergani_Fotografia/Getty

 

Наблюдатели за честностью исследований обеспокоены растущими способами, с помощью которых ученые могут подделывать или манипулировать количеством цитирований своих исследований. 

В последние месяцы появляются все более смелые практики.

 Один из подходов был раскрыт в ходе спецоперации, в ходе которой группа исследователей купила 50 цитат, чтобы заполнить профиль созданного ими фальшивого ученого в Google Scholar.

Ученые купили цитаты за 300 долларов США у фирмы, которая, по-видимому, продает фиктивные цитаты оптом. 

Это подтверждает существование черного рынка поддельных рекомендаций, о котором давно догадываются сыщики, занимающиеся вопросами честности исследований, говорят эксперты.

 

Наука, которая никогда не цитировалась

«Мы начали замечать несколько профилей Google Scholar с сомнительными тенденциями цитирования», — говорит Ясир Заки, специалист по информатике из Нью-Йоркского университета (NYU) в Абу-Даби, чья команда описала свою операцию в февральском препринте.

 «Когда рукопись набирает сотни цитирований в течение нескольких дней после публикации или когда у ученого наблюдается резкий и большой рост цитирований, вы знаете, что что-то не так».

Эта практика проблематична, потому что многие аспекты карьеры исследователя зависят от того, сколько ссылок собирают его работы. 

Многие учреждения используют подсчет цитирований для оценки ученых, а количество цитирований используется для таких показателей, как индекс Хирша, который предназначен для измерения продуктивности ученых и влияния их исследований.

Манипуляции с цитированием могут иметь реальные последствия. 

В июне испанская газета El País сообщила, что Комитет по этике научных исследований страны призвал Университет Саламанки расследовать работу своего недавно назначенного ректора Хуана Мануэля Корчадо, ученого в области информатики, обвиняемого в искусственном завышении своих показателей в Google Scholar. (Корчадо не ответил на просьбу Nature о комментарии.)

Реализованные проекты на продажу

Наблюдатели за честностью исследований уже подозревали, что цитаты продаются на бумажных фабриках, сервисах, которые штампуют исследования низкого качества и продают места авторов на уже принятых работах, говорит Сирил Лаббе, специалист по информатике из Университета Гренобль Альпы во Франции. «Бумажные фабрики имеют возможность вставлять цитаты в газеты, которые они продают», — говорит он.

В ноябре 2023 года аналитическая фирма Clarivate в Филадельфии, штат Пенсильвания, исключила более 1 000 исследователей из своего ежегодного списка высокоцитируемых исследователей из-за опасений по поводу игры с цитированием и «гиперпубликации».

 

Сотни самоцитирующих себя ученых раскрыты в новой базе данных

В ходе своей операции Заки и его коллеги создали профиль вымышленного ученого в Google Scholar и загрузили 20 выдуманных исследований, которые были созданы с использованием искусственного интеллекта.

Затем команда обратилась в компанию, которую они обнаружили, анализируя подозрительные цитаты, связанные с одним из авторов в их наборе данных, которая, по-видимому, продавала цитаты в профилях Google Scholar. 

Авторы исследования связались с фирмой по электронной почте, а затем общались через WhatsApp.

 Компания предлагала 50 упоминаний за 300 долларов или 100 упоминаний за 500 долларов. 

Авторы выбрали первый вариант, и через 40 дней в профиль вымышленного исследователя в Google Scholar были добавлены 50 цитат из исследований в 22 журналах, 14 из которых индексируются научной базой данных Scopus.

Команда не поделилась названием компании с Nature, сославшись на опасения, что раскрытие информации может привлечь внимание к ее веб-сайту или поддельному профилю Google Scholar, который они создали, потому что это может раскрыть личности авторов исследований, которые подбросили поддельные цитаты. 

Отвечая на вопрос Nature, знает ли Google Scholar о том, что на его сайте могут быть созданы поддельные профили, Анураг Ачарья, заслуженный инженер компании, сказал:

«Хотя академические ошибки возможны, они редки, потому что все аспекты видны — статьи проиндексированы, статьи автора включены в его профиль, статьи с цитированием автора, где размещены цитирующие статьи и так далее. Любой человек в мире может позвонить вам по этому поводу».

Еще одной демонстрацией манипуляций с цитированием стало то, что в прошлом месяце исследователи создали поддельный профиль в Google Scholar для кота по имени Ларри, перечислив дюжину поддельных статей с Ларри в качестве единственного автора. 

Исследователи опубликовали еще дюжину бессмысленных исследований в академической социальной сети ResearchGate, в которых цитировались работы Ларри. 

Примерно через неделю после того, как личность Ларри была раскрыта, Google Scholar удалил исследования кота, те, в которых упоминался Ларри, и накопившиеся цитаты. 

ResearchGate также удалил фиктивные исследования со ссылкой на Ларри.

Поддельные препринты

Операция Заки и его коллег родилась из более широких усилий по оценке масштаба проблемы поддельных цитирований. 

Они использовали программное обеспечение для изучения около 1,6 миллиона профилей Google Scholar, в которых было не менее 10 публикаций. 

Они искали профили с более чем 200 ссылками и случаи, когда цитирование исследователей увеличивалось в 10 или более раз каждый год или когда рост представлял собой скачок не менее чем на 25% от их общего числа цитирований. Команда обнаружила 1016 таких профилей.

 

Борьба с фабриками фальшивой бумаги, которые штампуют фиктивную науку

Заки говорит, что многие ссылки на статьи в этих профилях взяты из препринтов, которые не были рецензированы, и что они обычно указываются в библиографии статей, но не цитируются в основной части рукописей.

«Цитатами можно легко манипулировать, создавая поддельные препринты и используя платные сервисы», — говорит соавтор Талал Рахван, специалист по информатике из Нью-Йоркского университета в Абу-Даби.

Авторы также опросили 574 исследователя, работающих в 10 университетах с самым высоким рейтингом в мире.

 Они обнаружили, что из тех университетов, которые учитывают количество цитирований при оценке ученых, более 60% получают эти данные из Google Scholar.

Рыбные узоры

Лаббе не убежден утверждением опроса о том, что Google Scholar широко используется для получения метрик цитирования исследователей. 

По его словам, обвинения в манипулировании цитатами в Google Scholar всплывали в прошлом, и ученые давно подозревали, что есть поставщики, предлагающие такого рода услуги. 

Но операция по выявлению продавца цитирования является первой в своем роде, говорит он.

Гийом Кабанак (Guillaume Cabanac), специалист по информатике из Университета Тулузы во Франции, который создал инструмент, который помечает сфабрикованные статьи, содержащие странные обороты речи, добавленные для обхода программного обеспечения для обнаружения плагиата, говорит, что многие исследования появляются со ссылками на работы, которые не имеют ничего общего с темой исследования.

Команда Лаббе создает инструмент, который автоматически отмечает подозрительные шаблоны цитирования, которые могут указывать на манипуляции.

 

Насколько велика проблема поддельных бумаг в науке?

Чтобы помочь в этом, команда Заки предлагает метрику, называемую индексом концентрации цитирований, предназначенную для выявления случаев, когда ученый получает много цитат из нескольких источников. 

Такая активность часто является признаком «кольца цитирования», в котором ученые соглашаются цитировать друг друга, чтобы завышать показатели друг друга. 

«Подозрительные источники, как правило, имеют массовые цитаты, основанные всего на нескольких источниках», — говорит Рахван.

Один из опасений среди детективов заключается в том, что мошенники будут придумывать более тонкие методы, чтобы избежать разоблачения. 

Например, один из способов избежать обнаружения по индексу концентрации цитирования, отмечает Лаббе, — это покупать несколько цитат за раз, а не оптом.

По мнению Лаббе, способ решения проблемы игры с цитированием заключается в том, чтобы изменить стимулы в академических кругах, чтобы ученые не испытывали давления с целью накопления как можно большего количества цитирований для продвижения по карьерной лестнице. «Требование публикации и цитирования пагубно сказывается на поведении ученых», – говорит он.

Last Updated on 20.08.2024 by iskova