Рейтинг публикаций статей

Ц

итирование, при котором автор ссылается на более ранние работы в своей предметной области, является средством, благодаря которому ученые признают первоисточник своих методов, идей и выводов, что может быть использовано в качестве приблизительной оценки значимости цитируемой работы.

Пятьдесят лет назад американский ученый Юджин Гарфилд разработал индекс цитирования научных статей, положив начало так называемому Science Citation Index (SCI), который в настоящее время в составе целого семейства других индексов цитирования (Social SCI, Arts and Humanity CI, Chemical CI и др.) издается Институтом научной информации (компания Thomson Reuters) в Калифорнии.

Отмечая очередную годовщину этого события, журнал «Nature» обратился в компанию Thomson Reuters с просьбой составить список из ста наиболее цитируемых работ всех времен (см. интерактивную инфографику ниже или полный список Web of Science Топ-100.xls). Поисковый анализ агентства Thomson Reuters базировался на использовании мультидисциплинарной аналитической реферативной базы данных Web of Science, включающей в себя 5 индексов: SCIE (Science Citation Index Expanded – мультидисциплинарная реферативная база данных журнальных статей по естественным наукам (начиная с 1898 года); SSCI (Social Science Citation Index – мультидисциплинарная реферативная база данных журнальных статей по социальным (общественным) наукам; AHCI (Arts & Humanities Citation Index – реферативная база данных журнальных статей по искусству и гуманитарным наукам; CPCI (Conference Proceeding Citation Index) – мультидисциплинарная база данных по материалам конференций, конвенций, семинаров, симпозиумов, коллоквиумов и круглых столов (с 1990 года); BkCI (Book Citation Index – самая новая (создана в 2005 году) мультидисциплинарная база данных, индексирующая монографии).

Анализ, проведенный Thomson Reuters, выявил множество сюрпризов. Некоторые открытия, как, например, первое исследование углеродных нанотрубок (№ 36 в списке ТОП-100), являются действительно классическими. Тем не менее подавляющее большинство наиболее цитируемых работ описывает по большей части экспериментальные методы или приемы, которые уже стали неотъемлемыми в своих областях.

Так, самой цитируемой работой в истории, является статья 1951 года, описывающая методику количественного определения белка в растворе. На настоящий момент эта работа имеет более чем 305000 цитирований – признание того, что всегда озадачивало его главного автора, ныне покойного американского биохимика Оливера Лори, который высказался об этом в 1977 году: «Хотя я знаю, что это не самая лучшая моя статья…, тем не менее я тайно получаю удовольствие от этого».

База данных Web of Science содержит примерно 58 миллионов различных статей. Если это собрание текстов сравнить с горой Килиманджаро, то 100 наиболее цитируемых статей представляли бы всего 1 сантиметр на ее вершине. Примерно полтора метра её высоты – это 14499 статей, которые имеют более чем 1000 цитирований. Тем временем статьи, которые не цитировались ни одного раза, составили бы примерно половину от их общего числа.

В ряде случаев мы сталкиваемся с ситуацией, при которой публикации, описывающие ныне широко известные исследования или открытия, имеют невысокие показатели цитирования. Пол Уоутерс, директор Центра исследований науки и технологий (центр STS) в Лейдене (Нидерланды), говорит, что результаты таких работ со временем «становятся классикой науки, известной каждому». Примером этого может быть тот факт, что такие фундаментальные открытия, как, например, специальная теория относительности Эйнштейна, получают меньше цитирований, чем они, возможно, заслуживают, т.к. они настолько важны для науки, что уже вошли в учебники и включаются в статьи, как нечто привычное и не нуждающееся в цитировании.

Показатели цитирования пронизаны многими сопутствующими факторами. Так, количество цитирований увеличился у более ранних статей, т.к. у них было больше временны́х возможностей, чтобы накопить значительный объем ссылочной массы. Биологи, как правило, ссылаются в работе друг на друга чаще, чем, скажем, физики. К тому же различные области знаний генерируют разное число научных публикаций. В связи с этим современная библиометрия все дальше отходит от примитивных методов, таких как простой подсчет цитирований, когда речь идет о необходимости оценить степень значимости той или иной статьи: вместо этого проводят сравнение по временнóму диапазону для соответствующих областей знаний.

Для корректного отображения интерактивных материалов требуется современный браузер (Chrome, Safari, Firefox или Internet Explorer 9+) с включенной поддержкой JavaScript.

Инфографика: ТОП-100 научных статей

  • Верхняя диаграмма показывает динамику цитирований конкретной статьи в промежутке между 1920-2014 гг.
  • Нижняя диаграмма иллюстрирует наиболее цитируемые в мире научные публикации в той или иной дисциплине.

По данным Web of Science на 07/10/2014.

< >

Ранг: Цитирований:

Научные дисциплины

Список ТОП-100 агентства Thomson Reuters — не единственный доступный рейтинговый список научных публикаций. Академия Гугл (Google Scholar) составила свой собственный список наиболее цитируемых статей (см. «Альтернативный рейтинг»). Он базируется на большем количестве публикаций, т.к. поисковая система Google отбирает ссылки из гораздо большего массива данных, в том числе из монографий и книг. В своем списке (Google Scholar Top 100.xls) Google Scholar особое внимание уделяет, например, исследованиям по экономике. В списке Google Scholar также есть монографии, которые не были проанализированы агентством Thomson Reuters, хотя среди научных трудов обнаруживаются многие из тех же самых исследований.

В этой статье мы продемонстрируем, какие научные работы, проводимые в той или иной области знаний, перевели их авторов в разряд самых цитируемых ученых.

Биологические методы

В течение нескольких десятилетий, в списке 100 самых цитируемых статей доминирует биохимия белка. Статья 1951 года, описывающая метод Лоури для количественного определения белка, долгие годы остается на первой позиции, хотя многие биохимики утверждают, что этот и конкурирующий с ним метод Брэдфорда – значащийся в списке под номером 3 – несколько устарели. Работа, в которой описан способ электрофоретического разделения белков в полиакриламидном геле (метод Лэммли), занимает почетное второе место в этом списке. Использование данных методов объясняет большое число цитирования в области клеточной и молекулярной биологии, где они до сих пор остаются незаменимыми.

По крайней мере два биологических метода, имеющиеся в списке ТОП-100 самых цитируемых статей, были отмечены Нобелевской премией.

Исследование под номером 4 описывает метод Сэнгера для определения последовательности нуклеотидов ДНК, также известный как метод обрыва цепи. Впервые этот метод секвенирования был предложен Фредериком Сэнгером в 1977 году, за что он был удостоен Нобелевской премии по химии в 1980 году.

Исследование под номером 63 описывает полимеразную цепную реакцию (ПЦР) – экспериментальный метод молекулярной биологии, позволяющий добиться значительного увеличения малых концентраций определенных фрагментов нуклеиновой кислоты (ДНК) в биологическом материале, который разработал американский биохимик Кэри Муллисом, удостоившийся Нобелевской премии в 1993 году.

Другие методы получили меньше общественного признания, но не остались не замеченными. В 1980-х годах итальянский генетик Николетта Сакки (Nicoletta Sacchi) совместно с польским молекулярным биологом Петром Чомцзынски опубликовали быстрый и недорогой способ извлечения РНК из биологического материала (гуанидин-изотиоцианатного метод). Метод стал очень популярным и по числу цитирований занял 5 место в списке ТОП-100 научных публикаций. П. Чомцзынски запатентовал несколько модификаций этого метода и наладил собственный бизнес.

Биоинформатика

Быстрое развитие методов секвенирования, начиная со вклада Сэнгера, способствовало повышению рейтинга статей, описывающих способы определения последовательностей. Ярким примером является BLAST (Basic Local Alignment Search Tool) — семейство компьютерных программ, служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или ее фрагмент, которые на протяжении двух десятилетий были именем нарицательным для биологов, молекулярных биологов, биоинформатиков, систематиков. Используя BLAST, исследователь может сравнить имеющуюся у него последовательность с последовательностями из базы данных и найти последовательности предполагаемых гомологов. BLAST стал настолько популярным методом в руках ученых, что разные версии программы отмечены дважды в списке ТОП-100 научных публикаций и занимают 12 и 14 позиции.

Но несмотря на свою популярность, BLAST уступил позиции в ТОП-100 одной из самых широко используемых в настоящее время компьютерных программ Clustal. Clustal удобна для множественного выравнивания нуклеотидных и аминокислотных последовательностей одновременно и позволяет исследователям описывать эволюционные отношения между последовательностями у разных объектов, искать совпадения среди, казалось бы, не связанных последовательностей и прогнозировать, как изменения в определенном звене гена или белка могут повлиять на его функцию. В 1994 году вышла статья с описанием ClustalW (с интерфейсом командной строки), которая в настоящее время занимает 10 место в списке ТОП-100 самых цитируемых публикаций. Статья 1997 года с описанием версии с графическим интерфейсом ClustalX занимает 28 место в списке.

Эволюцию линейки Clustal продолжила более современная версия Clustal Omega, позволяющая выравнивать сотни последовательностей в течение нескольких часов и являющаяся одной из наиболее эффективных программ для множественного выравнивания по данным тестов производительности.

Филогенетика

Другой областью знаний, опирающейся на передовые методы секвенирования генома, является филогенетика – область биологической систематики, которая занимается идентификацией и прояснением эволюционных взаимоотношений среди разных видов жизни на Земле, как современных, так и вымерших.

Номером 20 в списке ТОП-100 является работа, авторы которой ввели в обиход так называемый метод «присоединения соседей», — быстрый, эффективный способ поместить большое количество организмов в филогенетическое дерево согласно некоторой мере эволюционного расстояния между ними, таких как генетическая изменчивость. Алгоритм обычно используется для деревьев, основанных на ДНК или белковых последовательностях, и требует знания расстояний между каждой парой таксонов (например, видов или последовательностей) для построения дерева. Метод разработан антропологом Наруя Сайтоу и Масатоши Ней в лаборатории университета Техаса в Хьюстоне в 1980-х г.

«Мы, антропологи, столкнулись с так называемыми «большими данными» того времени», — говорит Сайтоу, работающий теперь в Национальном институте генетики в Мисима (Япония). «Наша методика позволила создать филогенетические деревья с большими наборами данных без использования значительных компьютерных ресурсов».

Работа под номером 41 в списке ТОП-100 научных публикаций посвящена использованию статистики в филогенезе. В 1984 году биолог-эволюционист Джо Фельзенштейн из университета Вашингтона в Сиэтле адаптировал инструмент, известный как «бутстреп-анализ» (или просто бутстреп) для определения точности различных частей эволюционного дерева. Хотя по началу эта статья не считалась высокоцитируемой, она стала значительно популярнее в 1990-х и 2000-х, когда молекулярные биологи признали необходимость использования описанного метода.

Д. Фельзенштейн говорит, что концепция бутстреп, разработанная в 1979 году Брэдли Эфроном, статистом Стэнфордского университета в Калифорнии, была гораздо более фундаментальна, чем его работы. Но применение метода к биологическим системам способствовало тому, он стал упоминается гораздо большим числом исследователей. Увеличение количества цитирований в этом случае также является следствием того, что автор суммировал результаты большого числа своих исследований в одной работе вместо того, чтобы разбить их на несколько статей. «В тот период я был физически не в состоянии написать несколько статей по этой теме, поэтому я объединил все полученные мной результаты в одну статью и это для меня было не принципиально», — сообщил автор.

Статистика

Хотя в списке ТОП-100 научных публикаций имеется богатый пласт работ по статистике, «эти публикации являются не самыми важными для нас – статистиков-теоретиков», – говорит Стивен Стиглер, статистик и историк из Университета Чикаго в Иллинойсе. Очевидно, что результаты данных исследований наиболее полезны для ученых-практиков.

Большая часть этих взаимно пересекающихся исследований генерируется постоянно возрастающим потоком данных, поступающих из биомедицинских лабораторий. Например, наиболее цитируемой статьей по статистике (номер 11) является статья 1958 года американских исследователей Эдварда Каплана и Пола Мейера, которые описали статистический прием для оценки продолжительности жизни при изучении эффективности методов лечения больных. Данный прием ныне известен как процедура (оценка) Каплана-Мейера. Второй статьей (номер 24 в ТОП-100) стала статья 1972 года британского статистика Дэвида Кокса, которая расширила эти исследования, включив в себя такие факторы, как пол и возраст.

Работа Э. Каплана и П. Мейера по началу почти не цитировалась, пока вычислительная способность компьютеров не начала расти с 1970-х годов, сделав методы более доступными для неспециалистов. Связанная с появлением компьютерных программ простота в использовании статистических методов также повысило популярность статей в этой области. Британские статистики Мартин Бленд и Дуглас Альтман предложили (номер 29 в ТОП-100) описательный метод (ныне известный как метод Бленда-Альтмана) оценки согласованности измерений. Та же самая идея была введена другим статистиком 14 годами ранее, но метод Бленда-Альтмана был представлен более доступным способом, резко повысив число цитирований работы ученых.

Как самые первые, так и самые последние статьи в группе статистики имеют дело с одной и той же проблемой – многократным сравнением данных, но от самых разных областей исследований. Статья 1955 года американского статистика Дэвида Дункана (номер 64 в ТОП-100) полезна для тех случаев, когда необходимо сравнить несколько небольших групп данных. В то же время статья 1995 года (номером 59 в ТОП-100) израильских статистиков Иоаве Бенямини и Иозефа Хохберга идеально подходит для сравнения данных из таких областей, как геномика или нейровизуализация, где объемы данных исчисляются другими порядками, которые Д. Дункан вряд ли мог себе представить.

Альтернативный рейтинг

База данных Web of Science – не единственный доступный индекс цитирования. Академия Гугл (Google Scholar) также составила свой список из наиболее цитируемых публикаций (Google Scholar Top 100.xls). В исследовании Google две трети источников – это монографии, которые не были проанализированы агентством Reuters Thomson. «Большинство рейтингов сосредоточиваются на журнальных статьях, но нельзя не учитывать монографии и книги», — говорит Анураг Ачария, инженер-программист, который руководит командой Академии Гугл (Google Scholar) в Маунтин-Вью, штат Калифорния. Наиболее цитируемым изданием в рейтинге Google (номер 4) является руководство по молекулярному клонированию. Тем не менее из анализа списка следует, что научные статьи, остаются столь же влиятельным фактором, что и монографии, отмечает Ачария. Возглавляют рейтинги как Google, так и Thomson Reuters все те же три научные статьи, хотя и в другом порядке.

Отдельный список ТОП-100 Академии Гугл, демонстрирующий только высокоцитируемые научные публикации (Google Scholar Top 100 articles only.xls), имеет много общих статей с рейтинговым списком Web of Science. Список Google включает в себя так же работы по экономике и психологии, возможно из-за того, что они чаще цитируются в монографиях и книжных изданиях, нежели в научных статьях. Так, под номером 21 находится статья 1976 года об управленческом поведении компаний (M.C. Jensen & W.H. Meckling J. Financ. Econ. 3, 305–360; 1976), получившая 45119 цитирований в списке Google и всего лишь 8372 в списке Web of Science. (Google дает большинству статей более высокие показатели цитирований, чем Web of Science, однако 5-кратная разница значений является необычной). Самой высокорейтинговой из статей, которые есть только в списке Академии Гугл, под номером 4 стала статья 1948 года Клода Шеннона, с которой берет свое развитие современная теория информации (C.E. Shannon Bell Syst. Tech. J .27, 379–423; 1948). Академия Гугл приписывает ей 69273 циттирования, в то время как в Web of Science она имеет 10239 цитирований.

Теория функционала плотности

Когда теоретики ставят перед собой задачу моделирования свойств веществ на атомно-молекулярном уровне, они часто используют программное обеспечение для расчета электронной структуры систем, которая определяет их свойства, такие, как, например, реактивность белка или то, насколько сильно меняется теплопроводность ядра Земли при тех или иных условиях.

Большая часть этого программного обеспечения построена на теории функционала плотности (ТФП). Работы, посвященные ТФП наиболее часто цитируются в рамках физических наук. Двенадцать работ в списке ТОП-100 имеют отношение к ТФП, в том числе 2 из них входят в первую десятку. Традиционные методы определения электронной структуры, в частности, метод Хартри – Фока и производные от него, описывают систему с помощью многоэлектронной волновой функции. Основная цель теории функционала плотности – при описании электронной подсистемы заменить многоэлектронную волновую функцию электронной плотностью. Это ведет к существенному упрощению задачи.

«Для изучения поведения электронов в кристалле кремния с учетом того, что каждый электрон и каждое ядро взаимодействует с любым другим электроном и ядром, исследователю потребуется проанализировать один секстиллион (1021) терабайт данных, что далеко за пределами возможностей любого компьютера. Использование для расчетов приближений ТФП снижает требования к данным до несколько сотен килобайт, что в пределах возможностей стандартного ноутбука», — говорит Фелисиано Джустино, физик-материаловед из Оксфордского университета, Великобритания.

Физик-теоретик Вальтер Кон полвека назад занимался развитием методов ТФП, обобщив свои исследования в работах, которые сейчас занимают 34 и 39 места в рейтинге ТОП-100 самых цитируемых публикаций. В рамках ТФП трудноразрешимая задача об описании нескольких взаимодействующих электронов в статическом внешнем поле (атомных ядер) сводится к более простой задаче о независимых электронах, которые движутся в некотором эффективном потенциале. Этот эффективный потенциал включает в себя статический потенциал атомных ядер, а также учитывает кулоновские эффекты, в частности, обменное взаимодействие и электронную корреляцию. Оказалось, что методы, базирующиеся на ТФП, несмотря на подчас очень грубые приближения, во многих случаях и для многих систем дают отличные результаты. За развитие ТФП В. Кон был удостоен Нобелевской премии по химии в 1998 г.

Но прошло нескольких десятилетий, прежде чем исследователи нашли способ воплотить идею В. Кона в реальность. Две работы, входящие в ТОП-100 самых цитируемых публикаций, описывают приемы, на основе которых базируются самые популярные методы ТФП, используемые так же для программного обеспечения. Один из методов (№ 8 в ТОП-100) разработан Акселем Бекке из университета Дальхаузи в Галифаксе (Канада), другой (№ 7 в ТОП-100) группой химиков-теоретиков из США и называемый BLYP (Becke, Lee, Yang, Parr). В 1992 году химик-программист Джон Попл (который разделил с В. Коном Нобелевскую премию по химии в 1998 году) на основе теории функционала плотности разработал популярный программный пакет Гауссиан.

«Пользователи программного обеспечения, вероятно, цитируют оригинальные теоретические работы по ТФП даже если они не полностью понимают теорию», — говорит А. Бекк.

«На фундаментальном уровне ТФП может использоваться для описания всей химии, биохимии, биологии, наносистем и материалов. Все в нашем материальном мире зависит от движений электронов, поэтому ТФП буквально лежит в основе всего», — говорит он.

Кристаллография

Джордж Шелдрик, химик из Геттингенского университета в Германии, в 1970-х годах решил написать компьютерную программу для расчета растворимости кристаллических соединений. В те дни он говорил: «Моя работа состояла в том, чтобы облегчить преподавание химии и для этого я решил написать простую программу в свое свободное время». С тех пор прошло более 40 лет и его работа переросла в регулярно обновляемый пакет компьютерных программ SHELX, который стал одним из самых популярных инструментов для рентгеноструктурного анализа.

Рост популярности SHELX связан с публикацией в 2008 обзорной статьи в журнале Acta Crystallographica, в которой автор описал историю развития системы SHELX. В ней была фраза о том, что данная статья должна быть процитирована во всех исследованиях, где речь идет о применении SHELX в процессе определения структуры кристаллов. Читатели последовали его призыву и за последние 6 лет этот обзор получил почти 38000 цитирований, тем самым, закрепив работу на 13 месте в рейтинге ТОП-100 самых цитируемых публикаций и сделав его самым высокорейтинговым обзором, опубликованным за последние два десятилетия.

В список ТОП-100 самых цитируемых публикаций попали и другие инструментальные исследования, используемые для целей кристаллографии и структурной биологии. К ним относятся работы, описывающие пакет HKL (№ 23 в списке ТОП-100) для анализа данных рентгеновской дифракции; комплекс PROCHECK (№ 71 в списке ТОП-100), используемой для анализа пространственной структуры белков и два графических редактора, используемые для рисования молекулярных структур (№ 82 и № 95 в списке ТОП-100).

Необычной для списка ТОП-100 является работа под номером 22. Это статья, опубликованная в 1976 г. Робертом Шенноном – научным сотрудником химической корпорации Дюпон (DuPont), который составил полный список ионных радиусов не только в зависимости от валентного состояния атома, но и от его координационного числа, а в случае атомов переходных металлов – даже от их спинового состояния. Робин Граймс, материаловед из Имперского колледжа в Лондоне, говорит, что физики, химики и теоретики до сих пор цитируют эту работу, когда используют в своих исследованиях значения ионных радиусов Шеннона, часто соотносимые с другими свойствами веществ. Это сделало его работу самой цитируемой базой данных.

Зачастую мы ссылаемся на работы, практически не задумываясь об этом. То же самое можно сказать и о многих методах и базах данных, отмеченных в списке ТОП-100 самых цитируемых публикаций. В каждом конкретном случае этот список демонстрирует то, насколько глубинно и широко были проведены те или иные исследования, насколько они важны для развития той или иной области знаний. Но это также служит напоминанием о том, что позиции какого-либо исследования в верхней части списка самых цитируемых работ может зависеть и от удачно сложившихся обстоятельств.

«Есть один полезный совет для исследователей», – отмечает Питер Мур, химик Йельского университета в Нью-Хейвен (США).

«Если высокие показатели цитирований ваших работ – это то, к чему вы стремитесь, то учтите, что шансов достичь этого больше у того, кто работает в прикладной науке, нежели у того, кто, скажем, совершит открытие тайны Вселенной».

По материалам The Nature
При перепечатке ссылка на science.spb.ru обязательна