Сервисно-ориентированная архитектура фундаментальной астрономии
Цели
Задачи
- Системный анализ существующих проблем в информационной научной инфраструктуре и выработка предложений по их преодолению.
- разнородная распределенная информация
- большие объемы данных
- версионность [каталогов (архивов)]
- целостность данных
- связность данных
- устаревание информации
- проблемы hardware
- Исследование возможности использования семантической информации в системах информационного поиска и эффективность основанных на этом методов.
- Анализ эффективности работы информационных систем:
- структура посещений,
- анализ логов,
- эффективность навигации,
- влияние загруженности,
- время отклика,
- критичные модули и приложения.
- использование внешних оценок
- Принципы построения вертикальных тематических порталов:
- организационные принципы,
- технологические принципы,
- требования к контенту и сервисам
Задачи нижнего уровня
- Расширяемость БД.
- (В формулировке Олега) Возможность добавления новых типов данных и новых запросов экспертами в областях знаний (не разработчиками БД).
- (В формулировке Михаила) Возможность введения эффективно реализованных новых внутренних типов данных и новых операций между ними (как между новыми, так и между старыми). Желательно наличие простой процедуры введения типов, которой могли бы пользоваться специалисты из предметных областей.
- Анализ эффективности алгоритмов инфраструктуры поддержки расширяемости СУБД PostgreSQL - GiST (Generalized Search Tree) и GIN (Generalized Inverted Index)
- Анализ эффективности реализации новых типов данных:
- операции со множествами ( intarray),
- иерархические данные (ltree),
- слабо-структурированные данные (hstore),
- геометрические данные на сфере (pgsphere),
- поисковое представление документов ( tsvector)
- Анализ работы СУБД PostgreSQL в распределенной сети физических массивов данных
- Исследование эффективности работы с блочным и файловым доступом к удаленному хранилищу
- SOAP-интерфейс к удаленным базам данных
- Работа с астрономическими изображениями
- Проблемы, эффективная реализация и расширения протокола SIAP
- Поиск изображений с ранжированием
- Исследование алгоритмов выделения точечных источников
- Привязка астрономических изображений к мировой системе координат
- Исследование алгоритмов поиска новых объектов на астрономических изображениях
- Задачи информационного поиска
- Дальнейшее улучшение и добавление функциональности в полнотекстовый поиск в PostgreSQL
- Разработка специализированного словаря для полнотекстового поиска с поддержкой регулярных выражений
- Алгоритмы кластерного анализа для VLDB.
Введение: Современное состояние
Причины перехода к сервисно-ориентированной архитектуре хранения научной информации