воскресенье, 5 августа 2012 г.

использование электонных библиотек и баз данных в науке






Научный интернет-поиск

Научный интернет-поиск

Непростая задача сейчас – это найти научную информацию в Интернете с помощью современных поисковых систем. Справиться с ней помогут специализированные научные поисковики, являющиеся разновидностью вертикальных машин интернет – поиска. На данный момент есть немало таких сервисов в основном отраслевого характера. На современном информационном рынке существует достаточное количество предложений от коммерческих баз данных научной информации, подписка на доступ к которым бывает весьма дорогостоящей. Наш обзор посвящен многоотраслевым интернет-поисковикам, специализирующимся на свободно доступном контенте. Scirus.com Объем индексной базы — примерно 370 млн. документов по компьютерным наукам, лингвистике, экологии. В их число входят монографии, статьи из научной периодики, материалы конференций, препринты и патенты. Также индексируются и официальные сайты научных организаций. Бaза Scirus содержит только полные тексты, имеющиеся в свободном доступе. Показ дополнительных результатов из платных баз включается в настройках поиска. Система Scirus предлагает два режима поиска: простой и расширенный. В расширенном поиске используются логические операторы и маски. Форма расширенного поиска предлагает осуществить поиск введенных ключевых слов в определенных полях описания документов (автор, заглавие, ISSN и другие) и указать хронологические рамки поиска. В запросах допускается применение логических операторов. Возможен поиск как определенных видов документов, так и по электронным версиям. Есть фильтр Subject Areas, помогающий либо запустить поиск по материалам, относящимся к определенной научной дисциплине, либо включить в результаты данные исследований находящихся на стыке нескольких дисциплин. Если учесть количество современных междисциплинарных работ, такой фильтр становится хорошим подспорьем в работе со Scirus. В системе есть полезные инструменты – это прежде всего боковая панель фильтров, позволяющая быстро перейти к просмотру результатов по источникам (публикации периодических изданий или веб-страницы), а также по типам файлов. Раздел Refine your Search демонстрирует список дополнительных ключевых слов, автоматически найденных в результатах поиска, с помощью которых можно быстро уточнить свой запрос. Доступны два варианта сортировки списка выдачи: по релевантности и дате. Есть возможность выбрать базы данных из предлагаемого списка информационных партнеров Scirus и полученные результаты включить в выдачу поисковика. Для удобства работы с поисковиком разработчики предлагают использовать дополнения для браузеров: поисковый плагин и панель инструментов. Заинтересованным веб-мастерам предлагается установить на своих сайтах форму поиска Scirus. Scienceresearch Проект ScienceResearch — бесплатный и общедоступный поисковик по научным ресурсам. Он работает примерно с тремя сотнями баз данных, электронных библиотек и других источников научных публикаций, называемых здесь коллекциями. Основные свойства ScienceResearch — применение технологии Federated Search, а также кластеризации при выводе результатов Компания Deep Web Technologies разработала технологию «объединенного поиска» (Federated Search), реализованную в поисковом алгоритме Exploit Research Accelerator, предлагаемом заинтересованным разработчикам. Построенные на ее основе ресурсы не собирают какую-либо собственную индексную базу, а работают в режиме реального времени с большим количеством внешних подключаемых БД. После поступления запроса от пользователя ScienceResearch отправляет его во все поддерживаемые коллекции. Затем отбрасываются дублирующиеся записи и определяются наиболее релевантные результаты. Заметим, что степень релевантности, определяющаяся с помощью алгоритмов самого ScienceResearch, не зависит от качества ранжирующих алгоритмов отдельных источников информации. В результате формируется страница выдачи, доступная просмотру для пользователя. При составлении запросов допустимы употребления логических операторов и поиск точной фразы. Все операции выполняются в режиме реального времени и дает возможность реализации уникальной возможности. Если во время просмотра пользователем страницы результатов поиска в какой-либо из внешних баз появляются новые записи, подходящие под условия введенного запроса, система выведет соответствующее сообщение и предложит дополнить выдачу новыми результатами. Режим расширенного поиска позволяет его вести по конкретным признакам (например автору публикации, заглавию), а также ограничить выдачу определенным хронологическим промежутком или конкретной научной дисциплиной. Список основных дисциплин выводится на боковой панели поисковика. Кроме того, можно выбрать одну или несколько коллекций, куда и будет направлен ваш запрос. В бесплатной версии ScienceResearch предлагает выбор только нескольких основных коллекций. Для уточнения запросов система использует кластерные технологии. Результаты работы алгоритма демонстрируются на боковой панели страницы выдачи. Кроме тематических кластеров предлагаются разделы, группирующие статьи по авторам, источникам публикаций и по другим подобным признакам. Благодаря соответствующим меню легко сортировать выдачу по различным признакам, а также переключаться в режим просмотра результатов, полученных из какой-либо одной коллекции. base-search.net Научный интернет-поисковик Bielefeld Academic Search Engine (BASE) имеет европейские корни. Сам сервис BASE принадлежит немецкому университету, а в основе его поисковых алгоритмов лежат разработки норвежской компании Fast Search & Transfer. Ценность данного ресурса состоит в том, что BASE, представляющий собой поисковую машину международного проекта Open Archives Initiative, сотрудничает с европейским научно-информационным проектом DRIVER. Этот проект, позволяет владельцам электронных библиотек обмениваться данными о своих собраниях и является частью движения Open Access, ставящего своей целью повысить доступность научной информации. В рамках «Открытого доступа», ставшего популярным в начале 2000-х авторы получили платформу для распространения своих идей в международной академической среде, которая помогла им ограничиться минимальными затратами и избавила от длительного ожидания публикаций в традиционных научных журналах. Проект DRIVER обеспечил создание сводного ресурса, объединяющего европейские электронные библиотеки, специализирующиеся на научной и учебной информации. Таким образом, проект BASE стал удобной точкой доступа к свободно распространяемой научной информации. Кроме названных источников BASE обращается и к собственной индексной базе тематических веб-сайтов и БД. и потому в результатах поиска могут попадаться ссылки на лицензируемый контент. BASE предлагает режимы простого и расширенного поиска. В простом режиме проводится полнотекстовый поиск, а для уточнения запроса доступна лишь опция переключения сферы поиска между ресурсами BASE и по иском по базе Google Scholar через интерфейс BASE. В режиме расширенного поиска находятся источники по конкретным полям описания ресурсов (автор, заглавие, тема), а также определяются географический регион и год издания публикаций. Здесь же стоит определить и тип искомого контента. Поддерживается поиск статей, книг, текстов лекций, тезисов докладов, а также карт, видео- и аудиофайлов. В систему BASE интегрирован тезаурус Eurovoc, так что при обработке запроса вполне реально получить релевантные результаты сразу на двух десятках европейских языков, а также списки синонимов и близких терминов, что позволяет качественно уточнить запрос. Scholar.ru Это интересный проект научного интернет-поиска на русском языке. Стоит отметить, что данный ресурс поддерживает команда всего из трех человек. Индексируются статьи, монографии, а также авторефераты диссертаций, представленные в форматах HTML, PDF, DjVu. Индекс пополняется в полуавтоматическим режиме. Материал может добавить в поиск и сам автор, однако основным источником данных служат несколько общедоступных проектов, собирающих электронные версии научных публикаций. Как следствие на ресурсе полностью отсутствует информационного шума в результатах, но при этом сравнительно небольшой объем базы проекта. Сейчас в ней чуть более 48 тыс. публикаций. Данный сервис представляет собой гибрид поисковика и веб-каталога. Закладка «Каталог научных публикаций» состоит из 25 основных разделов, отражающих широкий спектр наук как естественного, так и гуманитарного профиля. Количество пустых разделов здесь достаточно велико, что не способствует эффективной работе. Раздел «Научные области» предлагает облако тегов, помогающее найти нужный материал. Раздел «Аспирантура», носящий справочный характер, содержит паспорта научных специальностей. Ссылки в поисковой выдаче системы сопровождаются краткой текстовой выдержкой, прямой ссылкой на исходный файл, а также списком тематических тегов. В боковой панели поисковика выводится сводный список дополнительных тегов, присвоенных документам, попавшим на страницу выдачи.

В индексе проекта в настоящее время около 4 тыс. сайтов. Данный проект по этому показателю, кстати, является крупнейшей системой на основе Flexum. Кроме того, по своему рейтингу он входит в тройку лучших персональных поисковиков Flexum. Там представлены тематические ресурсы, сайты учебных заведений и научных организаций, научных журналов. Интерфейс «Поиска по научным сайтам» стандартен для поисковиков на базе Flexum. Стартовая страница предлагает просмотреть каталог включенных в систему сайтов, построенный на основе присвоенных им тегов. Всего на данном поисковике выделено несколько десятков категорий. Среди них как тематические разделы, посвященные отдельным научным дисциплинам, так и разделы, выделенные по типам интернет-ресурсов, в частности «Форумы и блоги», «Электронные библиотеки». В этом проекте «Поиск по научным сайтам» доступен только режим простого поиска. Страница выдачи результатов поиска содержит собственно список найденных ссылок, панель тематических закладок и вспомогательную боковую панель. Она показывает выдержки из текстов с найденных веб-страниц, а также позволяет поставить быструю закладку на найденную страницу, оценить качество поиска и добавить свой комментарий к его результатам. С помощью панели закладок, расположенной над списком выдачи, легко переходить к поиску лишь по сайтам, помеченным соответствующими тегами, что повышает точность поиска. Найденные веб-страницы могут выводиться как единым списком с сортировкой по релевантности, так и сгруппированными по тем сайтам, на которых они были найдены. Главное достоинство данной системы—хороший охват научных интернет-ресурсов на русском языке. К недостаткам стоит отнести отсутствие дополнительных возможностей составления сложных запросов, а также наличие информационного шума в результатах поиска. Справедливости ради нужно отметить, что такие минусы свойственны большинству персональных поисковиков. Этот проект – это вертикальный сервис универсального поисковика. Его бета-версия под оригинальным названием Google Scholar стартовала в октябре 2004 г. «Академия Google» индексирует ресурсы открытого доступа, интернет-сайты, а также издательские сервисы, предоставляющие доступ к публикациям на коммерческих условиях. Кроме того, научный поисковик Google предлагает проект интеграции с классическими научными библиотеками. Данная функция работает с электронными каталогами библиотек, функционирующими в онлайновом режиме и поддерживающими формат OpenURL. Подключение библиотек к этому проекту Google свободное и бесплатное. В зависимости от настроек сервера библиотеки просмотр каталога может быть доступен как всем желающим, так и только зарегистрированным пользователям библиотеки. Русская версия «Академии Google» по умолчанию включает поиск по электронному каталогу Государственной публичной научно-технический библиотеки (ГПНТБ). В настройках поиска пользователю разрешается добавить до трех собственных ссылок на онлайновые каталоги библиотек, поддерживающих названные технологии. Интерфейс поисковика, выдержанный в строгом стиле, предлагает минимум дополнительных инструментов. К средствам быстрой фильтрации результатов отнесем, разве что хронологическое меню, позволяющее переходить к просмотру публикаций определенного года. Если материалы были найдены на нескольких ресурсах, то в результатах поиска будет предложена ссылка просмотра полного списка копий такого издания. Режим расширенного поиска «Академии Google», обеспечивающийся стандартным набором инструментов формирования запроса (поиск по фразе, на включение и исключение указанных слов), предлагает поиск как по именам авторов, так и в статьях определенных журналов, а еще позволяет указать диапазон дат публикаций нужных материалов.

При оценке релевантности той или иной ссылки, влияющей на ее позицию в выдаче поисковика, учитываются индекс цитирования публикации и ее автора, а также известность интернет-источника или того издания, где появилась статья. Каждая из ссылок снабжается кратким библиографическим описанием источника, счетчиком индекса цитирования данной публикации и ссылкой для поиска похожих материалов. В системе действует и «Библиографический менеджер», выводящий рядом с найденными ссылками корректное библиографическое описание источника, которое допустимо включить в список литературы к своей работе. К сожалению, там предусмотрены лишь зарубежные стандарты описания ресурсов, а вот форматов наших библиографических ГОСТов не дано, что определенно смазывает впечатление от этой, безусловно, полезной функции. Включить библиографический менеджер можно в настройках поисковика. К достоинствам «Академии Google» следует отнести простоту освоения, высокую скорость работы, а также наличие функции поиска в каталогах классических научных библиотек. Недостатками проекта являются ограниченный выбор дополнительных инструментов управления поиском и повышенный информационный шум в результатах, получаемых для пользователей, ориентирующихся на источники свободного доступа. поисковик выдает много ссылок на коммерческие ресурсы, что означает прямой доступ только к аннотациям или кратким выдержкам из текста публикаций. Как мы видим, при наличии инструментов для работы в Интернет, нет неразрешимых задач. Надеюсь, что данный обзор поисковых машин поможет оперативно разрешать возникающие задачи и поиск информации будет легким и приятным занятием.

Вам следует для того, чтобы оставить комментарий!

Всего пользователей: 18

Последние регистрации:

source




Комментариев нет:

Отправить комментарий