Электронные коллекции

Значительная часть современных электронных коллекций, актуальных для научных исследований, содержит мультимедийные объекты различных форматов (изображения, звук, видео и т.д.). Важнейшим аспектом является наличие инструментальной платформы, обеспечивающей пополнение и структурирование коллекций, а также их представление в Глобальной сети.

Можно ли говорить об универсальной технологической платформе, которая могла бы обеспечить сопровождение произвольных коллекций без серьёзной настройки, требующей участия специалистов? Это маловероятно, поскольку весьма различны как наборы полей, описывающих основные элементы коллекций, так и актуальные для конкретной предметной области классификаторы. 

Некоторые примеры

Внутренняя структура данных, представленных в коллекции, существенно зависят от предметной области. Равным образом от предметной области зависят и возможные форматы представленных в коллекции мультимедийных элементов.

В ряде случаев специфика данных, представленных в коллекции, требует непростых решений при реализации интерфейсов контент-менеджера и конечного пользователя.

Приведём несколько примеров, исходя из опыта работы с коллекциями в рамках научно-исследовательских проектов.

Экспедиционные материалы: этнография, фольклористика.

Даже небольшие коллективы исследователей во время регулярных экспедиций собирают значительные по объёму массивы данных. Все они нуждаются в структурировании для обеспечения текущей работы. Некоторые элементы коллекций могут быть в дальнейшем отобраны для публикации в глобальной сети.

Возможные мультимедийные форматы: фотоматериалы, аудиозаписи, видеозаписи.

Набор полей, описывающих элемент коллекции, может включать следующие:

  • название;
  • текстовое описание;
  • информант;
  • собиратель;
  • дата сбора материала;
  • название населённого пункта;
  • географические координаты населённого пункта (если в дальнейшем предполагается публикация, проиллюстрированная метками на карте);
  • фотографии, аудиозапись, видеозапись (опционно);
  • текстовая расшифровка аудиозаписи или видеозаписи (опционно).

Структурирование подобных коллекций предполагает выделение дополнительных сущностей: информанты, собиратели, населённые пункты и т.д. Возможны также дополнительные классификаторы.

Интерфейсы контент-менеджера предполагают возможность заполнения текстовых полей, загрузку файлов (изображения, аудио, видео), выбор из списка элементов таксономии. Отдельная задача при реализации системы представления коллекций – эффективная работа с классификаторами.

Виртуальные 3D реконструкции

Одним из результатов научных проектов, связанных с виртуальной реконструкцией, является коллекция элементов, внутреннее хранение и возможная публикация которых предполагает наличие как типовых, так и специфических полей, например:

  • название, текстовое описание, временные и географические характеристики реконструированного объекта, прочие неспецифические поля;
  • файл (файлы) 3D-сцены в формате соответствующего приложения;
  • файл, представляющий результат визуализации 3D-сцены в одном из видеоформатов;
  • файл (или, как правило, набор файлов), представляющие результат визуализации 3D-сцены в одном из форматов, обеспечивающих интерактивный просмотр.

Разработка интерфейсов контент-менеджера осложняется вероятной необходимостью загрузки наборов файлов, необходимых для адекватного представления 3D-сцен конечному пользователю.

Архивные рукописи

Публикация оцифрованных и расшифрованных архивных рукописей требует решения особых задач. В качестве примера приведём проект, связанный с публикацией рукописного архива Ф.М. Достоевского, хранящегося в ИРЛИ.

Таксономия в данном случае крайне проста: выделяются лишь две сущности – тетрадь и страница. Основным элементом коллекции является страница рукописи, для описания которой предусматривается набор полей, среди которых:

  • архивный шифр;
  • тетрадь;
  • номер;
  • отсканированное изображение;
  • четыре варианта расшифровки: текст с редакторской разметкой в оригинальной орфографии (формат PDF и HTML) и современной орфографии (формат PDF и HTML).

Интерфейс контент-менеджера, обеспечивающий загрузку данных по странице рукописи, очевиден: необходимо заполнить текстовые поля и загрузить соответствующие файлы. Сложность же пополнения подобных коллекций заключается в объёме материала. Практика показала, что результаты длительной работы исследователей (тысячи страниц) должны загружаться на сайт проекта в крайне сжатые сроки. Таким образом, была поставлена и реализована задача пакетного преобразования в нужные форматы исходных данных и загрузка их на сервер в полуавтоматическом режиме.

Отдельной проблемой представления подобных коллекций конечному пользователю заключается в разработке специфического инструментария, позволяющего в интерактивном режиме просматривать элементы редакторской разметки и выделять слои авторской правки на основе алгоритмического анализа размеченного текста.

Перспективы создания инструментальной платформы поддержки электронных коллекций

При всём очевидном структурном и содержательном разнообразии, можно предложить ряд подходов к разработке инструментальной платформы поддержки электронных коллекций с мультимедийным контентом. С нашей точки зрения, существует ряд предпосылок, позволяющих разрабатывать единые технологические решения как для электронных коллекций в широком смысле, так и для научных сетевых журналов.  Во-первых, основной акцент делается на структурирование и возможность публикации в Глобальной сети мультимедийных объектов различных форматов, и в этом смысле сетевой журнал может рассматриваться как специфическая электронная коллекция. Во-вторых, мультимедийная статья в качестве иллюстративного материала может содержать элементы электронных коллекций, что ставит ряд задач, связанных с соответствующими механизмами интеграции и обеспечением корректного цитирования.