Showing revision 8

astronet2008

Сервисно-ориентированная архитектура фундаментальной астрономии

Цели

Задачи

  • Системный анализ существующих проблем в информационной научной инфраструктуре и выработка предложений по их преодолению.
    • разнородная распределенная информация
    • большие объемы данных
    • версионность [каталогов (архивов)]
    • целостность данных
    • связность данных
    • устаревание информации
    • проблемы hardware
  • Исследование возможности использования семантической информации в системах информационного поиска и эффективность основанных на этом методов.
  • Анализ эффективности работы информационных систем:
    • структура посещений,
    • анализ логов,
    • эффективность навигации,
    • влияние загруженности,
    • время отклика,
    • критичные модули и приложения.
    • использование внешних оценок
  • Принципы построения вертикальных тематических порталов:
    • организационные принципы,
    • технологические принципы,
    • требования к контенту и сервисам

Задачи нижнего уровня

  • Расширяемость БД.
    • (В формулировке Олега) Возможность добавления новых типов данных и новых запросов экспертами в областях знаний (не разработчиками БД).
    • (В формулировке Михаила) Возможность введения эффективно реализованных новых внутренних типов данных и новых операций между ними (как между новыми, так и между старыми). Желательно наличие простой процедуры введения типов, которой могли бы пользоваться специалисты из предметных областей.
    • Анализ эффективности алгоритмов инфраструктуры поддержки расширяемости СУБД PostgreSQL - GiST (Generalized Search Tree) и GIN (Generalized Inverted Index)
  • Анализ эффективности реализации новых типов данных:
    • операции со множествами ( intarray),
    • иерархические данные (ltree),
    • слабо-структурированные данные (hstore),
    • геометрические данные на сфере (pgsphere),
    • поисковое представление документов ( tsvector)
  • Анализ работы СУБД PostgreSQL в распределенной сети физических массивов данных
    • Исследование эффективности работы с блочным и файловым доступом к удаленному хранилищу
    • SOAP-интерфейс к удаленным базам данных
  • Работа с астрономическими изображениями
    • Проблемы, эффективная реализация и расширения протокола SIAP
    • Поиск изображений с ранжированием
    • Исследование алгоритмов выделения точечных источников
    • Привязка астрономических изображений к мировой системе координат
    • Исследование алгоритмов поиска новых объектов на астрономических изображениях
  • Задачи информационного поиска
    • Дальнейшее улучшение и добавление функциональности в полнотекстовый поиск в PostgreSQL
    • Разработка специализированного словаря для полнотекстового поиска с поддержкой регулярных выражений
  • Алгоритмы кластерного анализа для VLDB.

Введение: Современное состояние

Причины перехода к сервисно-ориентированной архитектуре хранения научной информации